信息门户网站自动生成系统的研究.pdf
优采云 发布时间: 2020-08-10 20:00文档介绍:
摘要随着信息技术的不断发展,特别是/应用的普及,网上信息呈指数级下降。如何高效的借助和检索这种海量的信息,成为一个极为重要的问题,信息门户网站很好的解决了这个问题。它一般为用户提供对互联网上信息的密集访问方法,通过将来自不同信息源的同类信息集中在一个网站上,帮助用户通过统一的入口访问来自不同网站的信息,而无需挨个去访问单独的网站。信息门户网站极大的促进了互联网的发展,成为网路发展史上的一座罩程碑,因而对信息门户网站的研究具有重要的理论意义和实用价值。信息门户网站不仅仅是一个网站,更是一个知识和信息的“*敏*感*词*”,因而本文从后台信息资源的组织和整合以及前台网站的设计和建设这两个方面着手进行研究,将本系统主要分为三个模块:用户界面、客户端模块和服务器端模块。用户界面即前台的信息门户网站,它具有动态生成的功能,提供给用户动态交互的操作;客户端模块主要实现信息的过滤,它还能对用户输入的自然语言句子进行语义辨识让之成为计算机才能检索的关键词对;服务器端模块主要实现对力.维网北京量信息的智能检索。本文首先研究和讨论了基于自然语言的语义剖析方式,对汉语的自动分词方式进行了侧重讨论和剖析,并给出了一种基于反向最大匹配法的动词方式在本系统中的应用展望,提出动词的关键还须要一个完整合理的动词辞典。其次研究和讨论了万维网上的智能检索技术,针对当前万维网上的信息检索的若干缺陷提出了客户端和服务器端处理技术,并结合软件和数据库系统设计开发了一套后台的智能*敏*感*词*索软件系统,它通过对网页采集工具所搜集到的网页进行智能分类和检索,实验证明,该系统具有一定的智能性。最后从网站的设计和建设方面介绍了基于疟编程语言的信息门户网站设计的关键技术技巧并给出了具体的设计步骤和实现。关键词:语义剖析,分词,智能检索,门户网站武汉理工大学硕*敏*感*词*论文
,甀舶琤.武汉理笱妒垦宦畚甀琱”.也.,瓾..“甌,:’琧..甀’
甀.武汉理笱妒垦宦畚甅:..瓵,,,
第一章总论课题选题的目的和意义众所周知,互联网的诞生是世纪信息技术的一座壮歌,它以前主要是科研人员进行学术交流的场所。近年来随着商业、娱乐和教育的加入,互联网开始弄成无所不包的“信息集散地”,许多有价值的科研信息逐步“淹没”在其他信息构成的“汪洋大海”中。当科研人员和普通的用户发觉找寻须要的有用信息越来越难的时侯,“门户呕荆畔⒚拧弧ⅲ”出现了,它一般为用户提供对互联网上信息和应用的“密集”访问方法,通过将来自不同信息源的信息集中在一个页面上,帮助用户通过统。的入口访问来自不同网站的信息,而无需挨个去访问单独的网站,这种类似“信息剪报”和“参考消息”的信息组织形式通过提供个性化服务和附加服务ü残畔ⅰ⒂始信息订阅等次没У姆梦屎褪褂茫悄壳暗幕チM靶戮谩焙汀白意力经济”的重要组成部份,它极大地推进了互联网的发展,成为网路发展史上的一座里程碑。无论是出于职业须要还是个人兴趣爱好,人们获取信息的基本规律是,在瓦联网上获取信息通常都是在不同的网站上浏览同样的内容,而不是在同一个网站上浏览全部的内容。比如说一个人是做计算机网路通信的,非常关心计算机网路通信方面的发展;而另一个人是做化工行业的,自然一直荚,化。幸捣矫娴男畔ⅲ庑┬枨笠仓换崴孀潘侵耙档谋浠⑸浠M样,每个人都有自己的兴趣和爱好,有人喜欢娱乐,有人喜欢绘画,有人喜欢卜澹庑┬巳ひ膊换崆嵋追⑸谋洹6呕荆墙ǚ浅E釉拥哪容置于一起,将内容信息分门别类地堆置于网站卜,再由用户自己去选购他所须要和感兴趣的内容。显然,信,亩户网站的建设必然要用到因特网上强悍的信息资源,而其对资源的整合优化有一定的要求。因特网发展余年来.规模以几何级数急速发展,成为一个重要的信息源。但因特网上的信息具有数目大、形式多、内容广、专业性不强等特征,给信息采集、分类、检索等工作带来了新的问题和挑战。年代搜索引擎应运而生,且在网路信息资源查找中起到了重要上海理上人学硕*敏*感*词*论文
*敏*感*词*信息门户网站的发展过程及现况提升检索的查准率、查全率,将具有较高的研究价值。信息门户网站自动生成系统作为国家“こ獭笔只际楣萁ㄉ璧难芯的作用,帮助人们从浩如烟海的网路信息中找到所要的信息。但搜索引擎在精度、易用性等方面仍存在众多问题,总体性能差,检索的查准率、查全率不高,从而其疗效不尽人意。鉴于此,如何提升搜索引擎的智能检索能力,信息门户网站的手动生成系统从本质上改变了传统的网站*敏*感*词*法,使网站建设从技术型转向了面向内容的功能型。用户一蚩翁庾只要会使用浏览器就可以直接在线建成功能强悍专业知识集中的门户网站,因而从根本上消除了普通人员建设网站的壁垒,该系统让网站真『迪至硕项目具有深刻、长远和重大的现实意义。学科信息门户虺芐暌黄工程开始,就在法国范围内逐步普及,一大批面向物理、:炭蒲А⒁窖А社会科学的嗉探ⅰ5杲氲诙谑保琒早已在世界范围内呈“燎原”之势,在欧洲、欧洲、大洋洲广泛施行,据不完全统计,目前世界范围内有名的锏缴习俑觥R恍㏒还联合在一起构成更大的资源发觉网路缬⒐腞毖Э菩畔⒚呕У慕ㄉ瑁丫拥ゴ康难研究和课题项目,发展到*敏*感*词*的建设任务,目前正在法国范围内丌展的项目就是典型。门户网站的建设须要有强悍的网路资源做其后盾,对网路资源智能化的程度有一定的要求。网上信息检索的关键技术主要包括:①信息搜集和储存技术,分人工和手动两种形式,其中手动方法是由“网络机器人”来完成的。②信息预处理技术,收录格式支持、转换和信息过滤。其中信息过滤是一项关键技术,网上大量的无用信息须要充分过滤能够有好的搜索结果。⑧信息索引技术,建立索引主要涉及信息语词切分和语词句型剖析;进行时态标明及相关自然语言处理:建立检索项索引;检索结果处理技术。其中检索结果处理技术是关键技术,其核心是根据估算结果与查询词的相关程度来排序。在此基础上智能检索技术的重点是对用户的查询计划、意图、用户兴趣等进行推理和猜想,并为用户提供有效的答案。为了实现此目的.目前早已提出武汉理工大学硕十学位论文