AntConc中文版是一款非常好用的語(yǔ)料庫(kù)檢索工具,對(duì)于從事語(yǔ)言文字研究學(xué)習(xí)的朋友特別有用,它具有索引詞表生成,主題詞計(jì)算,搭配和詞族提取等多種功能,以很方便地用來分析文本中的詞匯主題。

AntConc是免費(fèi)的語(yǔ)料庫(kù)檢索工具,適用于語(yǔ)料庫(kù)語(yǔ)言學(xué)、翻譯學(xué)、外語(yǔ)教學(xué)等領(lǐng)域的研究者。該軟件的開發(fā)者是Laurence Anthony,他是日本早稻田大學(xué)(Waseda University)教授。AntConc的一個(gè)非常重要的功能是計(jì)算相對(duì)于參照語(yǔ)料庫(kù)(reference corpus)的觀察語(yǔ)料庫(kù)(observed corpus)中的主題詞(key word)的主題性(keyness)。
AntConc中文版功能介紹
AntConc開始是作為相對(duì)簡(jiǎn)單的索引程序,不過慢慢地進(jìn)步成一個(gè)相對(duì)有用的文本分析工具。它是在ActiveState供應(yīng)商的優(yōu)良Komodo跨平臺(tái)支持多種程序軟件的開發(fā)環(huán)境下用Per15.8程序語(yǔ)言寫成的。
AntConc包括以下工具:素引**Concordance**索引定位**Concordance Plot**文件查看**File View**詞叢**Clusters**N元模式(部分詞叢)**N-Grams (part of Clusters)**搭配**Collocates**詞單**WordList**關(guān)鍵詞單**Keyword List**注意每個(gè)工具都可以點(diǎn)擊工具窗口上各自的選項(xiàng)卡或者使用功能鍵F1至F7打開。
怎么用ANTCONC分析漢語(yǔ)語(yǔ)料?
首先是分詞,因?yàn)橹形姆浅L厥猓幌裼⒄Z(yǔ)那樣每個(gè)單詞之間都有間隙,電腦可以輕易識(shí)別單詞,但是漢語(yǔ)大家都知道的,一般都是以標(biāo)點(diǎn)符號(hào)隔開,所以我們需要用其他軟件分詞。我用的是rost來分詞,分詞之后大概就是這個(gè)效果:

這個(gè)軟件很貼心,自己就會(huì)寫好“分詞后”。
然后就是“轉(zhuǎn)碼”
我們先把我們要用的語(yǔ)料粘在Word上,然后保存格式選為“純文本”之后再,點(diǎn)擊TXT(純文本)文件-另存為-編碼下拉-utf8-保存。這一步我也是找了好久,很多人都說改成Unicode,我試了無(wú)數(shù)次,都不行,不管哪個(gè)版本的antconc都不行,我好難過~
后來我換成了utf8,其實(shí)這個(gè)是屬于Unicode的一種的。

然后我們就可以打開antconc-files-open files-選中我們修改好的文件,就可以操作啦。

點(diǎn)擊start就可以看到這個(gè)界面了,祝大家好運(yùn)。