北京語言大學語言信息處理研究所始建于1987年,是中國境內第一個以漢語信息處理為主要研究方向的研究所。該所的宗旨是:面向實際應用,研究計算語言學理論和面向信息處理的漢語語言理論,發展自然語言處理關鍵技術和知識庫,開發相應的工具軟件和應用軟件,支持對外漢語教學和語言本體研究。
概況
研究所招收具有計算機應用和應用語言學背景的碩士研究生、博士研究生,并接受國內外高級進修生,致力于學科交叉發展,培養掌握自然語言處理理論和技術的高級專門人才。
歷史:
始建于1987年,研究所第一任所長是馬希文教授(1987年),第二任所長是張普教授(1987年-2001年),第三任所長是宋柔教授(2001年至今)。1990年代曾 先后設立5個研究室或教研室:辦公自動化研究室、基礎理論研究室、CAI研究室、現代遠程教育研究室、計算機基礎課教研室,并籌建計算機應用系統研究室、古籍整理研究現代化技術研究室。隨著學校規模擴大,現代遠程教育研究室發展成 網絡教育學院,CAI研究室的主要人員成為對外漢語研究中心CAI研究骨干,計算機基礎課教研室發展成為計算機科學與技術系的計算機基礎教研室。2001年年底研究所的行政管理歸入計算機系,2003年4月歸入信息科學學院。
發表文章
宋柔. 統計和規范中的誤區,中文信息處理的若干重要問題,科學出版社,2003,11
宋柔. 計算機輔助漢語校對系統,當代語言學,2001.No.1
宋柔,尚英,趙瑾. 簡單短語及線性鄰接屬性研究,對外漢語教學國際研討會, 北京市,2004.11
宋柔,樊太志,岳炳詞. 面向語言教學研究的漢語語料檢索系統CCRL 及其應用,第七屆國際漢語教學討論會論文集,上海市,2002.8.
婁,宋柔,李衛亮,羅智勇. 現代漢語分詞系統通用接口設計與實現,中文信息學報,2001.No.5
魯松,宋柔. 漢英機器翻譯中描述型復句的關系識別與處理,軟件學報,Vol. 12, No.1, 2001.pp83-93.
許勇,荀恩東,賈愛平,宋柔. 基于互連網的術語定義獲取系統. 中文信息學報. 2004, 18(4): 37-43.
許勇,宋柔. 基于CRF的百科全書文本段落劃分,計算機工程,2007年7月.
婁珽,宋柔,李衛亮,羅智勇. 現代漢語分詞系統通用接口設計與實現. 中文信息學報. 2001.No.5
XUN Endong ,Huang hangning, A unified statistical model for identification of English baseNP, 2000 Annual computing linguistics
XUN Endong. Extract Chinese Term definition from database and Internet, the 6th East Asia Forum on Terminology, 2003.
荀恩東,錢揖麗,應用二叉樹剪枝識別韻律短語邊界,2006,中文信息學報,第三期
荀恩東,顏偉,基于語義網計算英語詞語相似度,2005,情報學報,第一期
荀恩東,宋柔,非母語寫作水平自動評測,2006, 哈佛大學漢語書面語研討會
羅智勇,宋柔:現代漢語自動分詞中專名的一體化、快速識別方法,2001 International Conference of Chinese Computing(ICCC’2001),Singapore,2001.11
羅智勇,宋柔。現代漢語通用分詞系統中歧義切分技術。計算機研究與發展. 2006,43(6):1122-1128
羅智勇,宋柔。基于多特征的自適應新詞識別。北京工業大學學報.2007年6月
羅智勇,宋柔。一種基于可信度的人名識別方法。中文信息學報.2005,19(3):67-86
Luo Zhiyong, Song Rou. An Integrated Method for Chinese Unknown Word Extraction. Proceedings of the Third SIGHAN Workshop on Chinese Language Learning, Barcelona, Spain, 2004:148-155
科研項目
參考資料
北京語言大學語言信息處理研究所主頁 http://clip.blcu.edu.cn/Index.Asp
參考資料 >