案例,spss,数据分析

手工分词与词性标注及其不足


全文字数:7500字左右  原创时间:<=2022年

【内容摘要】

手工分词与词性标注及其不足
手工分词与词性标注及其不足
摘要:本文通过对一篇字数为4000字左右的文章进行手工分词和手工词性标注,旨在体验手工作此工作的过程,以期得到手工分词与词性标注存在的具体不足的第一手资料。
关键词: 手工分词  词性标注 不足
 
现代的应用语言的研究中,有一门崭新而又发展迅速的学科,那就是语料库的研究与建设。各种语料库的建设在各个领域争相出现,给我们的语言研究提供了一个全新是研究角度给我们的语言应用提高了巨大的方便。然而,现在的语料库的建设也存在着各种不足,如分词和词性标注的准确度不够高。本文旨在通过手工分词和词性标注建立一个最简单的语料库与计算机进行语料分词和词性标注的方式进行比较,分析手工方式存在的优缺点。希望对现代语料库的建设提高一些感性的认识。

 

*若需了解更多与协助请咨询↓→[电脑QQ][手机QQ]【数据协助】