為推廣和規(guī)范使用國家通用語言文字,科學(xué)保護各民族語言文字,中國2015年啟動中國語言資源保護工程,目前已按計劃完成81個少數(shù)民族語言(含瀕危語言)調(diào)查點、53個漢語方言(含瀕危方言)調(diào)查點和32個語言文化調(diào)查點的工作任務(wù)。
2018年9月19日,教育部副部長、國家語委主任杜占元在長沙市舉辦的首屆世界語言資源保護大會上介紹,“中國語言資源保護工程”計劃田野調(diào)查1500個地點,目前已經(jīng)完成總體規(guī)劃的2/3,各項標(biāo)志性成果正陸續(xù)推出。
介紹
中國語言資源有聲數(shù)據(jù)庫是國家語言資源建設(shè)工程之一,它用現(xiàn)代信息技術(shù)采錄語言數(shù)據(jù),經(jīng)轉(zhuǎn)寫、標(biāo)記等加工程序?qū)⑾嚓P(guān)的文本文件、音頻文件及視頻文件整理入庫,以數(shù)據(jù)庫、互聯(lián)網(wǎng)、博物館、語言實驗室等形式向?qū)W界和社會提供服務(wù)。
漢語部分
根據(jù)《中國語言資源有聲數(shù)據(jù)庫調(diào)查手冊》,中國語言資源有聲數(shù)據(jù)庫(漢語)部分設(shè)計為:
一、語言和方言調(diào)查
1.調(diào)查點:根據(jù)縣級行政單位設(shè)置調(diào)查點,原則上“一縣一點”,特殊情況下可以增點或減點。本調(diào)查重在反映當(dāng)下語言的實態(tài),因此調(diào)查點選擇縣城等在當(dāng)?shù)赜绊戄^大的地方。
2.調(diào)查對象:每個調(diào)查點根據(jù)性別因素和年齡因素選擇有代表性的4名發(fā)音合作人,其中男女各2人,老年青年各2人。
3.調(diào)查內(nèi)容:調(diào)查內(nèi)容分語言結(jié)構(gòu)調(diào)查和話語調(diào)查兩大部分。
語言結(jié)構(gòu)調(diào)查是基礎(chǔ),用1000字調(diào)查語音系統(tǒng),用1200詞調(diào)查基本詞匯系統(tǒng),用50個句子調(diào)查主要的語法現(xiàn)象。
話語調(diào)查是重點,分為講述和對話兩部分。講述包括“規(guī)定故事”和“自選話題”。規(guī)定故事為《牛郎和織女》
4.調(diào)查方法:采用規(guī)定的錄音設(shè)備、軟件進行錄音,輔之以錄像和照片。并且,對調(diào)查內(nèi)容還要按照一定要求進行必要的國際音標(biāo)轉(zhuǎn)寫和漢字轉(zhuǎn)寫。最后,對一個調(diào)查點的所有調(diào)查資料和電子文件進行命名、分類、歸檔。
5.建庫:國家組織專人進行驗收,將調(diào)查材料統(tǒng)一建檔入庫。并及時組織專家對數(shù)據(jù)庫進行開發(fā)。
二、“地方普通話”調(diào)查
地方普通話調(diào)查與語言和方言調(diào)查一同進行。其選點要求也與語言和方言的調(diào)查相同,原則上是一縣一點。每調(diào)查點選擇3名發(fā)音合作人,這3名發(fā)音合作人的普通話水平處在不同的等級:1名相當(dāng)于《普通話水平測試等級標(biāo)準(zhǔn)》 規(guī)定的三級甲等,1名僅次于三級乙等,1名普通話水平最差,接近方言。
地方普通話的調(diào)查內(nèi)容是:1、用普通話講述規(guī)定故事《牛郎和織女》;2、用漢語朗讀兩篇短文《誠實與信任》《大學(xué)生村官》。調(diào)查得到的音頻文件等經(jīng)整理驗收,建檔入庫,形成地方普通話語料庫。
地方普通話語料庫是中國語言資源有聲數(shù)據(jù)庫的一個分庫。
工程進展
2015年,語保工程啟動。
2019年,為期5年的語保工程一期建設(shè)順利完成,調(diào)查收集到123種語言和全國各地方言的原始語料數(shù)據(jù)1000多萬條,其中音視頻數(shù)據(jù)各500多萬條,總?cè)萘窟_100TB。
2021年4月19日從教育部獲悉,中國語言資源保護工程正式啟動二期建設(shè),在大力推廣國家通用語言文字的同時,科學(xué)保護好漢語方言和少數(shù)民族語言資源,促進語言資源的開發(fā)利用。
參考資料 >
中國語言資源保護工程啟動二期建設(shè)_滾動新聞_中國政府網(wǎng).中國政府網(wǎng).2021-04-20