小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

Py之jieba:Python包之jieba包(中文分詞最好的組件)簡介、安裝、使用方法之詳細攻略

 處女座的程序猿 2021-09-28

Py之jieba:Python包之jieba包(中文分詞最好的組件)簡介、安裝、使用方法之詳細攻略


jieba簡介


應該算得上是分詞領域的佼佼者,想要使用python做文本分析,分詞是必不可少的一個環(huán)節(jié)。
(1)支持三種分詞模式:
  (1)精確模式:試圖將句子最精確的切開,適合文本分析。
  (2)全模式:把句子中所有可以成詞的詞語都掃描出來,速度非常快,但是不能解決歧義。
  (3)搜索引擎模式:在精確模式的基礎上,對長詞再次切分,提高召回率,適合用于搜索引擎分詞。
(2)支持繁體分詞
(3)支持自定義詞典
?

jieba安裝


pip install jieba

好啦,大功告成,開始使用吧!

jieba使用方法

1、進行分詞

import jieba
text='周杰倫(Jay Chou),1979年1月18日出生于臺灣省新北市,祖籍福建省泉州市永春縣,中國臺灣流行樂男歌手、原創(chuàng)音樂人、演員、導演等,畢業(yè)于淡江中學。'
text_cut = jieba.cut(text, cut_all=False)
print(list(text_cut))

['周杰倫', '(', 'Jay', ' ', 'Chou', ')', ',', '1979', '年', '1', '月', '18', '日出', '生于', '臺灣省', '新北市', ',', '祖籍', '福建省', '泉州市', '永春縣', ',', '中國臺灣', '流行樂', '男歌手', '、', '原創(chuàng)', '音樂', '人', '、', '演員', '、', '導演', '等', ',', '畢業(yè)', '于', '淡江', '中學', '。']
?

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多