<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Word2VEC_Javaword2vec的Java實現(xiàn)

          聯(lián)合創(chuàng)作 · 2023-09-30 16:18

          Word2VEC java版本的一個實現(xiàn)。

          示例代碼:

          package com.kuyun.document_class;
          
          import java.io.BufferedReader;
          import java.io.File;
          import java.io.FileNotFoundException;
          import java.io.FileOutputStream;
          import java.io.IOException;
          import java.io.UnsupportedEncodingException;
          import java.util.List;
          
          import org.ansj.domain.Term;
          import org.ansj.splitWord.analysis.ToAnalysis;
          
          import com.alibaba.fastjson.JSONObject;
          import com.ansj.vec.Learn;
          import com.ansj.vec.Word2VEC;
          
          import love.cq.util.IOUtil;
          import love.cq.util.StringUtil;
          
          public class Word2VecTest {
              private static final File sportCorpusFile = new File("corpus/result.txt");
          
              public static void main(String[] args) throws IOException {
                  File[] files = new File("corpus/sport/").listFiles();
          
                  //構(gòu)建語料
                  try (FileOutputStream fos = new FileOutputStream(sportCorpusFile)) {
                      for (File file : files) {
                          if (file.canRead() && file.getName().endsWith(".txt")) {
                              parserFile(fos, file);
                          }
                      }
                  }
          
                  //進行分詞訓(xùn)練
          
                  Learn lean = new Learn() ;
          
                  lean.learnFile(sportCorpusFile) ;
          
                  lean.saveModel(new File("model/vector.mod")) ;
          
          
          
                  //加載測試
          
                  Word2VEC w2v = new Word2VEC() ;
          
                  w2v.loadJavaModel("model/vector.mod") ;
          
                  System.out.println(w2v.distance("姚明")); ;
          
              }
          
              private static void parserFile(FileOutputStream fos, File file) throws FileNotFoundException,
                                                                             IOException {
                  // TODO Auto-generated method stub
                  try (BufferedReader br = IOUtil.getReader(file.getAbsolutePath(), IOUtil.UTF8)) {
                      String temp = null;
                      JSONObject parse = null;
                      while ((temp = br.readLine()) != null) {
                          parse = JSONObject.parseObject(temp);
                          paserStr(fos, parse.getString("title"));
                          paserStr(fos, StringUtil.rmHtmlTag(parse.getString("content")));
                      }
                  }
              }
          
              private static void paserStr(FileOutputStream fos, String title) throws IOException {
                  List<Term> parse2 = ToAnalysis.parse(title) ;
                  StringBuilder sb = new StringBuilder() ;
                  for (Term term : parse2) {
                      sb.append(term.getName()) ;
                      sb.append(" ");
                  }
                  fos.write(sb.toString().getBytes()) ;
                  fos.write("\n".getBytes()) ;
              }
          }
          瀏覽 11
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          編輯 分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          編輯 分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产乱伦AV片 | 成人三级片免费 | 日韩高清aⅴ | 一区二区三区四区精品久久 | 亚州操逼图片 |