說明: 「TOCFL 學習者語料庫」所收集的語料是母語非華語的外籍人士參加華語文能力測驗(TOCFL)所寫的作文。 寫作時間為2006到2012年。共收集4567篇,約150萬字。其中2837篇(989045字)經過偏誤標記處理。 如欲進一步參考語料庫建置內容請參考「TOCFL作文語料庫的建置與應用」。
中文斷詞及詞性標註採中央研究院CKIP自動斷詞系統。不論自動或人工偏誤標記謬誤難免。開放此系統,僅供研究目的。 使用本系統所完成之研究報告或論文,請加註語料出處或致謝。致謝詞範例:本研究感謝國立台灣師範大學TOCFL學習者語料庫團隊提供之語料及檢索系統。