ccl是谁开发的

职业培训 培训职业 2024-12-28
北京大学中国语言学研究中心主导开发了CCL语料库,此项目得到了北京大学计算语言学研究所、中科院计算技术研究所等机构的共同支持与协助。CCL语料库与检索系统专为学术研究而设,非营利性质,收录的中文文本未经分词处理,检索以汉字为单位进行。其主要特色功能包括:支持复杂

北京大学中国语言学研究中心主导开发了CCL语料库,此项目得到了北京大学计算语言学研究所、中科院计算技术研究所等机构的共同支持与协助。

CCL语料库与检索系统专为学术研究而设,非营利性质,收录的中文文本未经分词处理,检索以汉字为单位进行。其主要特色功能包括:支持复杂检索表达式,例如不相邻关键词查询、指定距离查询等;能对标点符号进行查询,如查找“?”可检索所有疑问句;允许用户在查询结果集中继续检索;用户可自定义查询结果的显示方式,如左右长度、排序等;用户还能从网页上下载查询结果,格式为文本文件。

CCL语料库总字符数为783,463,175,其中现代汉语语料库的字符总数为581,794,456。

标签

版权声明:本文由哟品培原创或收集发布,如需转载请注明出处。

本文链接:http://www.yopinpei.com/20241228/2/963506

猜你喜欢
其他标签