2015年5月6日, 全国哲学社会科学规划办公室发布了国家社科基金年度项目、青年项目和西部项目成果鉴定等级公告,我院外语系陈伟教授主持的国家社科基金项目《台湾海峡两岸三地法律文本汉/英双语平行语料库建设和研究》(09BYY019),顺利结题,鉴定结果为良好,结题证书编号为20150521。该项目最终成果为专著《两岸三地汉/英法律平行语料库的创建及其词汇特征研究》及软件《两岸三地汉/英法律文本平行语料库》。

台湾海峡两岸三地同文同种,多种法系共存,三地各自都有自己的中英文法律文本,各种法律文本浩瀚如海、不知其数,呈现出“一国两制三法四域”的局面。为了彻底研究台湾海峡两岸三地之间汉英法律文本的词汇特征、存在的差异以及中英文本的翻译特征,项目组从2009年开始在四年时间里收集了两岸三地的中英文对应法律文本近10000部,字词总数高达40000多万;他们结合大陆法系和普通法系的特点对文本进行国内法和国际法、部门法、实体法和程序法等三维分类,分成行政实体法、行政程序法、民事实体法、民事程序法、刑事实体法、刑事程序法、国际公约和双边/多边条约等8种法律类型,把原本属于不同法系和法域的法律文本实现了无缝对接,之后对文本进行随机抽样,提取2716部法律文本作为语料;然后分别采用台湾中研院CKIP autotag 1.0和英国兰卡斯特大学MLCT等软件进行词性标注、段界和句界的标注、篇头信息标注,最后进行段句级对齐,创建了目前世界上首个也是最大的两岸三地汉/英语法律平行文本标注语料库,库容高达1000万字词,而且语料库兼有平行语料库和可比语料库的功能,这在目前世界上已建成的平行语料库中并不多见。在此基础上,项目组成员又花费一年的时间对两岸三地汉英语法律文本的词汇特征进行了目前世界上首次系统的实证研究并形成40万字的专著。
这种基于语料库的实证研究相对于传统的思辨研究和内省研究来说具有很大的优势。有了语料库这个平台,今后他们还可进行两岸三地汉英语法律文本的语义、句法、语篇、语用、法律语言与权力等问题的系列研究。从这种意义上说,该语料库的顺利建成使得我国法律语言研究和法律翻译研究从此走向了快车道,将为我国的法制建设和实现台海两岸的最终和平统一发挥重要的作用。