中文信息处理实验课程作业 2018 年 11 月 9 日星期五 一. 作业名称 :语料库使用报告 二. 作业主题 :语料库检索,检索结果分析,使用报告编制 三. 作业目的 : (1) 了解常用语料库的检索方法(高级检索); (2) 学习分析检索报告,发现语言现象和语言规律; (3) 学习编写语料库使用报告。 四. 作业要求 : 1、 依次打开如下三个语料库,认真阅读语料库的说明文件(或帮助文件): (1) 国家语委语料库在线: http://corpus.zhonghuayuwen.org/ 包含两个子库:现代汉语语料库、古代汉语语料库 (2) BCC 语料库: http://bcc.blcu.edu.cn/ 包含文学、报刊、多领域、微博、科技、古汉语、篇章检索、 HSK 、历时检索、自定义等十个板块 (3) CCL 语料库: http://ccl.pku.edu.cn/corpus.asp 包含三个子库:现代汉语、古代汉语、英汉双语语料库 2、 针对每个语料库的每一个子库或者内容板块,设计不少于 5 个检索条目进行检索,保存检索结果(如果可能),并对检索结果进行分析。 3、 根据文件阅读、条目检索和结果分析,编制单个语料库使用报告,包括: (1) 语料库基本信息(开发者、时间,语料的来源、规模、时间跨度、领域分布、加工程度、呈现方式,等等) (2) 检索条目以及检索结果概述、举例和分析; (3) 语料库评价(功能、操作、信息量等); 注意:上述三个语料库下库或不同内容板块,需要逐一进行检索测试后编制使用报告! 4、 根据三个语料库的使用体验,编制三个语料库对比分析报告,包括: (1) 语料库基本信息比较; (2) 语料库使用体验比较; (3) 个人收获(即个人从中学到的知识和技能); (4) 认为有必要写的其他内容。 5、 结果提交: 每人需完成如下四个文档: (1) BCC 语料库使用报告 .docx ; (2) CCL 语料库使用报告 .docx ; (3) 国家语委语料库在线使用报告 .docx; (4) 三个语料库对比分析报告 .docx 将上述四个文档压缩为一个压缩文件,按照如下格式命名: 语料库使用报告 - - 姓名 - 八位日期 - 四位时间 .rar 以附件形式提交到学习通作业平台。 20181109-作业附件.rar