搜索引擎主题模型优化(基于垂直搜索引擎的旅游线路评价推荐系统为游客提供旅游资讯)
优采云 发布时间: 2021-09-19 06:16搜索引擎主题模型优化(基于垂直搜索引擎的旅游线路评价推荐系统为游客提供旅游资讯)
24 SC技术创新导论2010年第18期SC技术创新随着互联网的普及,人们越来越习惯于在出行前通过互联网学习一些与旅游相关的信息。然而,人们在浩瀚的互联网上获取特定的旅游信息并不容易。为了满足越来越多游客的旅游信息搜索需求,帮助游客轻松获取旅游线路信息和旅途中的各种信息。本文研究了基于垂直搜索引擎的旅游线路评价与推荐系统,为旅游者提供旅游线路搜索服务,推荐最优线路,并提供旅游线路的相关旅游信息。垂直搜索引擎垂直搜索引擎,又称专业搜索引擎或专用搜索引擎,是专门为查询某一主题或主题的信息而设计的查询工具,特别是收录某一行业或主题的信息。垂直搜索引擎的技术实现具有以下特点:(1)vertical search engine为特定行业的站点搜索特定信息,并执行指向采集的网络蜘蛛程序(2)vertical search engine通常需要从采集的网页中提取格式化信息以进行搜索)。(3)vertical search engine的搜索结果通常以特定于行业的方式显示。垂直搜索引擎的实现过程大致如下:spider抓取网页,提取网页中的信息,然后对上述非结构化数据进行清理、消除重复、分类、分析和比较,提取结构ctured数据并存储在数据库中,最后通过中文分词索引提供用户搜索
其关键技术是:(1)topic-oriented高效蜘蛛程序。主题蜘蛛程序是垂直搜索引擎的重要组成部分,其捕获范围一般局限于特定主题或特定领域。主题蜘蛛的设计通常需要解决主题相关性预测、*敏*感*词*站点选择方案、URL搜索策略等问题。(2)format extraction of web page information extraction(ie)通常定义为提取指定的预先需要的信息(事件、事实)从文本出发,以结构化和统一的形式表达,用于信息查询、文本深度挖掘、答疑系统、抽样统计等应用。目前比较常用的方法有:基于特征模式匹配的信息提取、基于归纳学习的信息提取、基于网页结构特征分析,基于本体论的网页信息提取。前三种信息提取方法虽然各有特点,但在技术上,提取主要是通过为要提取的目标建立相应的模板库和匹配文档来实现第四种方法引入了本体,本体的概念解决了词序和多义的问题,本体从语义信息中提取,但具体的本体构建非常困难系统的主要功能是为游客提供高质量、个性化的旅游信息服务
本文在对旅游信息获取、提取、存储和显示技术研究的基础上,综合考虑了旅游周期、旅游价格、景区类型、景区动态、交通条件、旅游安全、旅游季节、服务质量、旅游体验等影响旅游者旅游体验的因素d等,设计了一个旅游线路评价模型,该模型可以计算并满足游客的搜索要求,找到每条旅游线路的推荐值,为游客推荐最符合其个性化要求的旅游线路。通过图形技术(map)友好展示旅游线路,在行程中提供餐饮、住宿、交通、景点动态等旅游相关信息,帮助游客在出发前做出旅游线路决策,在行程中充分了解相关信息,为交通运输做好充分准备设计了系统的总体结构,基于垂直搜索引擎的旅游线路推荐系统主要包括以下三个部分:旅游数据采集系统、决策数据生成系统、旅游线路搜索与推荐系统。(1)data采集system采集,数据的格式化存储是系统的核心之一。有两个数据源:爬虫程序采集,管理端手动输入。主题爬虫在heri trix的基础上进行扩展和定制,以实现旅游主题爬虫程序。因为系统要求较高数据准确性,对于一些非结构化的网页数据,它需要一些结构化的显示,这些信息通常收录在文章的一篇长文章中@
首先利用向量模型对这类信息进行分类和过滤,然后结合HTMLPasser和正则表达式技术提取主题信息。(2)决策数据生成系统根据数据格式化并存储所有数据采集.系统数据分为三个部分:路线数据、路线相关动态信息和其他旅游信息。路线数据以XML格式存储并索引,以便于路线搜索。路线相关动态信息是一个重要的功能路线推荐评分依据。其他出行信息将作为路线辅助信息显示在用户界面上,以增加信息量并提高友好性。(3)路线搜索、评估和推荐系统将基于用户给出的初始条件(如出发城市、目的地城市、景点类型、出行天数和费用预算)在路线索引中过滤得到满足用户需求的旅游路线,并根据路线评价模型进行排序和推荐,最后将推荐结果返回到用户界面,从数据库中查询与路线匹配的旅游信息进行异步显示旅游线路推荐3.的动态评分模型4.1推荐旅游线路采用动态评分模型很难设计不同旅游线路之间的评分,因为旅游线路长、短,景点层次不同,很多线路往往没有旅游线路评价的设计基于垂直搜索引擎的模型,电子科技大学,成都611731,四川;常州大学,常州213164,江苏;成都,四川610041)To:本文设计了一个基于垂直搜索引擎技术的旅游线路评价与推荐模型系统
首先,系统采用垂直搜索引擎技术获取旅游行业的具体信息网站提取旅游线路及相关旅游信息,辅以人工信息输入法建立旅游线路及旅游信息数据库。关键词:垂直搜索引擎信息提取,旅游线路评估模型,图纸分类号:TP3文件识别码:a文章@No:1674-098x(2010)06(c)谢谢。我想感谢本次研究的赞助商:邓电科技网文化旅游数字化项目团队的全资支持,以及电子科技大学与常州大学DIR研究中心的共同努力。科技创新指南SC technology innovation 2010no.18 SC technology innovation的科技创新指南。很难找到一个通用的可量化计划。计算方法对差异化的旅游路线进行了公平的评估。因此,系统将评估当路线是等价的时,这里所谓的路线等价是指旅游成本是等价的,旅游时间是等价的。游客对旅游路线的评价大多来自于游客自身的体验。我们可以从游客体验动态评价模型的角度来设计旅游路线。所谓动态是指模型计算出的推荐值应随影响游客体验的事物的发生而变化,动态评分模型设计应满足的要求(1)同一条旅游线路在不同时期的推荐值,应随影响因素的变化而变化
(2)可以考虑不同路线的实际差异,具有灵活性和通用性。(3)公平性是评价不同线路时应考虑的因素,旅游线路推荐会受到一定因素的影响,经过仔细分析,我们得出的结论是,影响因素分为以下两类:(1)决定性因素f(影响景区旅游可行性)如道路故障、健康与安全(传染病)、自然灾害(山洪)、景区改造等不可预见的情况。(2)非决定性因素f(影响景区完善)例如,天气因素和服务质量。动态评分模型的设计将一条旅游线路的评价分为两个步骤。第一步是对路线中的所有节点进行评价,并计算出当前的景点推荐值。第二步是对路线中的所有景点进行评价,并对其进行综合评价动态评分模型