|
4月28日下午,汉语水平考试中心邀请我校信息科学学院宋柔教授在会议中心第二会议室作了题为“文本语料库建设同语言教学和语言研究”的学术讲座。汉考中心领导、部分教师和研究生以及其他院系的师生听取了报告。
宋柔教授首先介绍了语言资源库的概念、语料库的由来及现状,而后从加工深度、配套工具、内容、功能等多个角度介绍了文本语料库的分类,重点阐述了研究型文本语料库建设(尤其是语料标注)过程中“目标不清楚、规范不稳定”的特点,以及针对这一特点提出的“大规模生语料+工作平台”的应对策略,并强调语料标注开始之前要深思熟虑,且最好设计一个便于管理、规范和共享的工作平台。宋柔教授现场展示了基于生语料和字频统计工具进行研究的成果,并演示了信息科学学院罗智勇副教授开发的“基于大规模生语料库的词语共现检索系统(Text Pattern Retrieval)”和“Similar Words Explorer Based on Distributed Context”系统。
讲座结束后,在场师生就语料标注、词语共现等问题进行了热烈的讨论。


北京语言大学汉语水平考试中心
2010年4月30日
|