kkx小編給大家分享的中文詞頻統(tǒng)計工具是一款功能強大的中文文本分析工具,可以實現(xiàn)中文詞頻統(tǒng)計、詞云生成、關(guān)鍵詞提取等功能。能夠準確統(tǒng)計Word文檔、網(wǎng)頁文件或文本文件中,基于詞典匹配算法,支持多種分詞模式,并且性能高。當(dāng)我們由于一些工作原因只能借助獨立的詞頻統(tǒng)計軟件,此時你可以使用kkx推薦的這款詞頻統(tǒng)計工具,效果佳,性能好,喜歡的朋友不要錯過了哦!
中文詞頻統(tǒng)計工具功能
全量統(tǒng)計方式:即統(tǒng)計給定多個文檔中的所有詞匯的出現(xiàn)詞頻;
指定統(tǒng)計方式:只統(tǒng)計指定的某些特殊詞匯的出現(xiàn)詞頻。
(注:可以選擇只統(tǒng)中文詞匯、英語詞匯或標點符號。)
中文詞頻統(tǒng)計工具使用說明
1、在文本框中輸入(或粘貼)中文或者英文文章,然后按“開始拆分并統(tǒng)計”按鈕即可查看拆分結(jié)果和頻率統(tǒng)計結(jié)果。可以生成兩種拆分結(jié)果:
(1)是按照原文順序列出單詞或句子;
(2)按照單詞或者句子的拼音順序排好序,當(dāng)然,也可以通過打開文件的方式導(dǎo)入文章。
2、輸出方式中也可帶上編號。
3、在頻率分析欄中可以通過點擊列表標題,可以進行“編號”、“單詞”、“出現(xiàn)頻率”的排序—正序或逆序。
4、分析排序結(jié)果可以保存為txt文件,供大家后續(xù)繼續(xù)分析。
中文詞頻統(tǒng)計工具常見問題
問:詞頻分析結(jié)果是什么樣的?比如我想把一篇文檔進行分詞,統(tǒng)計出高頻詞匯,這樣能做到嗎?分詞是單個字,還是一個詞語?
答:把一篇文檔進行分詞,統(tǒng)計出高頻詞匯,這就是這個軟件的功能。分詞是按語言學(xué)上的詞語,比如“中化人民共和國”算一個詞語。而且,對于一些新詞,或特殊定義的詞匯,如“新浪微博”這類新產(chǎn)生的詞匯,軟件提供了“自定義詞匯表”功能,您只要把它添加到自定義的詞匯表中,就可以作為一個詞來進行統(tǒng)計。
更新日志
v3.16更新日志
新版本Bug修正,優(yōu)化。
以上便是KKX小編給大家分享介紹的詞頻統(tǒng)計工具!