|
周末了,大段長(zhǎng)篇技術(shù)文不發(fā)了,知道沒(méi)人愿意看,但是學(xué)習(xí)不能落下,畢竟我的心里只有學(xué)習(xí) 這里分享一個(gè)自然語(yǔ)言處理中對(duì)中文分詞支持比較好的結(jié)巴分詞庫(kù),屬于NLP中的重量級(jí)分詞庫(kù),我們通過(guò)下面有趣的解繞口令來(lái)學(xué)習(xí)這個(gè)庫(kù)能的基本用法 本文如題所說(shuō),用python來(lái)解繞口令,先來(lái)五組繞口令,自己試驗(yàn)下,看大概怎么斷句,有沒(méi)有暈了 下面看用python來(lái)解繞口令,用到j(luò)ieba庫(kù)和pandas庫(kù) jieba庫(kù)用來(lái)切詞,jieba.cut方法 join方法將列表中逗號(hào)替換成空格,并轉(zhuǎn)成字符串 pandas轉(zhuǎn)成dataframe二維數(shù)據(jù)結(jié)構(gòu),直觀看數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)處理分析 為了整齊些,把列表類型轉(zhuǎn)換成Dataframe二維數(shù)據(jù)類型,更直觀 整體看下來(lái),結(jié)果除了過(guò)過(guò)和用毒毒兩個(gè)地方有誤,其他都被完美解開(kāi),是不是很棒,有興趣動(dòng)手試試吧! |
|
|