小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

Word2Vec命令的功能

 看見就非常 2015-09-18
 下載make好word2vec后,生成以下5個(gè)命令:
     compute-accuracy:
     distance:
     word2phrase:就是將詞語(yǔ)拼成短語(yǔ)。
     word2vec:丫應(yīng)該是make后第一個(gè)執(zhí)行的命令了,因?yàn)樾枰褂迷撁钣?xùn)練語(yǔ)料庫(kù)。我們首先需要準(zhǔn)備好txt文本文件,里面全是用空格或Tab空開的詞。然后通過以下代碼生成*.bin文件,bin里面保存的值就是文檔中詞語(yǔ)和其對(duì)應(yīng)的向量。千萬(wàn)不要以為,得到的bin文件就一定比input.txt小,超過100M的txt是這樣,而且越大越是,但是對(duì)于20~50M的語(yǔ)料庫(kù)而言就不一定了,起碼我訓(xùn)練的時(shí)候是這樣。
  1. ./word2vec -train input.txt -output vectors.bin -cbow 0 -size 200 -window 5 -negative 0 -hs 1 -sample 1e-3 -threads 12 -binary 1
     word-analogy:

     在Ubuntu15.04下安裝Gensim:
     sudo apt-get install python-numpy python-scipy
      pip install gensim

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多