案例,spss,数据分析

基于领域本体网页结构化信息抽取技术的研究与应用


全文字数:15000字左右  原创时间:<=2022年

【内容摘要】

基于领域本体网页结构化信息抽取技术的研究与应用


基于领域本体网页结构化信息抽取技术的研究与应用
本文对面向知识服务的知识内容的提取、组织的理论方面进行了研究,重点针对中文分词技术、词语识别和提取、词频统计、句法分析方面进行了较为深入地研究,最终用Java语言开发出了作为语义检索系统后台关键部分的基于领域本体的网页结构化信息抽取系统。该系统充分运用了汉语智能分词系统的分词特性,能够准确地识别分词后文本中的词,在此基础上按照一定的模式将信息以词和句子为单元提取到指定的数据库管理系统中。本系统生成的各个类和方法和可直接调用,易于维护和改进。


关键词  本体    词频统计  中文分词  信息抽取 
Title    Functions of extraction ,organization and research used in the knowledge service - research in and application on the technology of structured information extraction based on domain Ontology web
Abstract
This paper  is about the theory of  knowledge  content  extraction and organization.It takes a deep reaserch about Chinese words cutting,words recognition and extraction,syntax analysis,termfrequerncy statistic and so on.It includes a structured information extraction system based on domain Ontology web,which is a part of a semantic retrieval project and programme in Java.This system is full use of a smart Chinese word cutting system and accurately identify the word text after words cutting.This system can extraction certain information including words and sentences to data management system.


Keywords  Ontology    termfrequency statistic     Chinese words cutting    information extraction

 

*若需了解更多与协助请咨询↓→[电脑QQ][手机QQ]【数据协助】