類型 |
語料庫名稱及大小 |
建設單位 |
英語學習者語料庫(書面語及口語) |
中國學習者語料庫 CLEC(100萬) |
廣外、上海交大 |
大學英語學習者口語語料庫 COLSEC (5萬) |
上海交大 |
香港科技大學學習者語料庫 HKUST Learner Corpus |
香港科技大學 |
中國英語專業語料庫 CEME (148萬) |
南京大學 |
中國英語學習者口語語料庫 SECCL (100萬) |
南京大學 |
國際外語學習者英語口語語料庫中國部分 LINSEI-China (10萬) |
華南師大 |
碩士寫作語料庫 MWC (12萬) |
華中科技大學 |
平行語料庫 |
漢英平行語料庫 PCCE |
北外 |
南大-國關平行語料庫 |
南京大學 |
英漢文學作品語料庫; |
外研社 |
馮友蘭《中國哲學史》漢英對照語料庫 |
李約瑟(Joself Needham)《中國科學技術史》英漢對照語料庫 |
計算機專業的雙語語料庫; |
國家語言文字工作委員會語言文字應用研究所 |
柏拉圖(Plato)哲學名著《理想國》的雙語語料庫 |
英漢雙語語料庫(15萬對) |
中科院軟件所 |
英漢雙語語料庫:LDC香港新聞英漢雙語對齊語料36294段以及香港法律英漢雙語對齊語料31萬句子對 |
中國科學院自動化研究所 |
英漢雙語語料庫(100萬),網上英漢語段電子詞典及網上電子英漢搭配詞典(1000萬) |
東北大學 |
英漢雙語語料庫(40-50萬句子對) |
哈爾濱工業大學 |
雙語語料庫(5萬多對) |
北京大學計算語言學研究所 |
對比語料庫 LIVAC(Linguistic variety in Chinese communities) |
香港城市理工大學 |
平衡語料庫(Sinica Corpus);樹圖語料庫(Sinica Treebank) |
臺灣 |
特殊英語語料庫 |
中國英語(China English)語料庫 |
河南師范大學 |
軍事英語語料庫(Corpus of Military Texts) |
解放軍外語學院 |
新視野大學英語教材語料庫 |
上海交通大學 |
漢語語料庫 |
漢語現代文學作品語料庫(1979年,527萬字) |
武漢大學 |
現代漢語語料庫(1983年,2000萬字) |
北京航空航天大學 |
中學語文教材語料庫(1983年,106萬8000字) |
北京師范大學 |
現代漢語詞頻統計語料庫(1983年,182萬字) |
北京語言學院 |
國家級大型漢語均衡語料庫(2000萬字) |
國家語言文字工作委員會 |
《人民日報》語料庫(2700萬字) |
北京大學計算機語言學研究所 |
大型中文語料庫(5億字,10分庫) |
北京語言文化大學 |
現代漢語語料庫(1億字) |
清華大學 |
漢語新聞語料庫;(1988年,250萬字) |
山西大學 |
標準語料庫(2000年,70萬字) |
生語料庫(3000萬字);《作家文摘》的標注語料庫(100萬字) |
上海師范大學 |
現代自然口語語料庫 |
中國社會科學院語言所 |
旅游咨詢口語對話語料庫和旅館預定口語對話語料庫 |
中國科學院自動化所 |