網(wǎng)友評分:
9.7分
貴鶴語料管理與檢索助手支持單關(guān)鍵詞和語法組合結(jié)構(gòu)查詢的語料管理和檢索工具。支持語料庫自建管理, 并可用以提取文獻中的語句,可將對話和敘述語句分別提取,適合漢語語法研究人員使用。
語料庫是語料庫語言學(xué)研究的基礎(chǔ)資源,也是經(jīng)驗主義語言研究方法的主要資源。應(yīng)用于詞典編纂,語言教學(xué),傳統(tǒng)語言研究,自然語言處理中基于統(tǒng)計或?qū)嵗难芯康确矫妗?/p>
⒈語料庫中存放的是在語言的實際使用中真實出現(xiàn)過的語言材料,因此例句庫通常不應(yīng)算作語料庫;
⒉語料庫是承載語言知識的基礎(chǔ)資源,但并不等于語言知識;
⒊真實語料需要經(jīng)過加工(分析和處理),才能成為有用的資源。
一、語料管理
所有語料均存放于程序目錄corpus文件夾中。
1、加入語料
可通過兩種方式加入語料:一是直接復(fù)制語料(TXT文檔)到corpus文件夾中,二是通過軟件界面“加入語料”按鈕進入加入語料操作界面進行操作。
2、刪除語料
為確保不誤刪語料,軟件界面上不提供刪除語料的操作功能,只能從程序目錄corpus文件夾中進行操作。
3、語料分類分級
在corpus文件夾根據(jù)語料類別建立新文件夾,以語料類別名稱命名,即可建立一個語料類別。每個文件夾下的文件夾都算一個子類。比如建立一個“北方話”的文件夾,該文件夾下又可建立“東北話”、“西北話”、“北京話”等子文件夾,每個子文件夾下放入相應(yīng)的語料TXT文檔,軟件運行后,即可在軟件右側(cè)文獻列表中看到相應(yīng)的樹形目錄。
二、語料檢索
語料查詢時,一定要先在文獻列表中選中相應(yīng)的文獻。可以一次選擇多篇文獻后進行檢索。
1、單個關(guān)鍵詞檢索
在關(guān)鍵詞輸入框中輸入一個關(guān)鍵詞,設(shè)置好左右顯示字?jǐn)?shù)(即關(guān)鍵詞左右兩側(cè)的字?jǐn)?shù)),點“搜索”按鈕,就可以搜索到所選文獻中含關(guān)鍵詞的語句并顯示到搜索提取語句列表中。
2、雙關(guān)鍵詞組合檢索
在關(guān)鍵詞輸入框中輸入兩個關(guān)鍵詞,兩詞之間以一個空格符號間隔,右側(cè)設(shè)置關(guān)鍵詞的配合模式(1、兩關(guān)鍵詞間隔字符數(shù);2、第二詞在第一詞之后的多少字符范圍內(nèi)),點“搜索”按鈕,即可檢索出符合兩關(guān)鍵詞配合特點的語句并提取顯示出來。
三、文獻語句提取
1、提取對話句:選中文獻,點“提取對話句”按鈕,會將文獻中引號內(nèi)的對話語句提出出來以供進一上使用。
2、提取敘述句:選中文獻,點“提取對話句”按鈕,會將文獻中對話之外的敘述句提取出來以供進一步使用。
3、提取所有語句:不區(qū)分對話和敘述類別,以漢語常用的斷句標(biāo)點作標(biāo)記,按順序逐句提取所有語句。由于是單線程方式提取,速度比較慢。字?jǐn)?shù)較多的文獻花的時間可能較多。
標(biāo)簽: 文獻檢索 語法學(xué)習(xí)
關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們
Copyright ? 2005-2024 www.wndwig.cn.All rights reserved.
浙ICP備2024132706號-1 浙公網(wǎng)安備33038102330474號