农业信息资源,“三农”用户只能兴叹(组图)

优采云发布时间: 2021-05-24 02:19

　　[摘要]：截至2009年底，互联网上有超过30,000个与农业相关的网站，积累了丰富的信息资源，例如农业技术，市场信息，政策法规和农业消息。但是，由于缺乏互联网信息资源的统一形式表达，信息异质，异质，分散，重复现象严重，形成了“信息孤岛”，难以发挥农业信息资源的综合效应。同时，由于农民的文化水平和计算机操作能力的限制，“三农”用户难以使用传统的搜索工具直接进行交互，捕获和过滤个性化信息。面对庞大的农业信息资源，“三农”用户只能兴奋地叹息，“信息泛滥”的问题十分严重。因此，建立专业化，个性化，智能化的农业搜索模型和相应的搜索引擎系统具有重要意义。本文基于开放，分散，等级，演进和庞大等互联网的基本特征，提出了一种复杂的农业自适应搜索模型。该模型建立了农业信息资源发现，信息获取，信息处理和用户服务实体的联盟。通过实体与网络资源，网页的实体与内容，网页的表达形式，实体与用户的个人需求之间的学习和适应机制，实现了匹配机制。适应复杂而动态的Internet环境提高了农业搜索引擎的召回率和准确性，并解决了新一代搜索引擎面临的核心问题。针对农业互联网资源的动态性和高度分散的特点，提出一种自适应农业深度Web资源发现算法AADWED（自适应农业深度Web入口发现）算法。

　　此算法通过不断地从样本中学习适当的查询表达式并将其提交给一般搜索引擎，从而有效地获取了域Deep Web资源条目页面。实验表明，该算法大大提高了农业领域深层Web资源发现的收益。针对网站页面呈现多样性和动态性的特点，提出了一种自适应的Web结构化数据提取算法。该算法基于MDR算法，提出了一种基于相对熵的页面去噪算法，提高了Web结构化数据提取的准确性。针对互联网上大量农业数据描述不完整和冗余的问题，本文着重研究农产品价格，供求等信息和基于语义的数据的空间属性的自动标注。冗余处理问题，从而改善了数据。系统的质量和可用性为准确的检索和视觉分析服务提供了基础。针对不同Web用户的个性化需求，提出了一种基于FCA的用户兴趣主题自动挖掘算法。所挖掘的兴趣主题模式被描述为一组正式概念，并且兴趣概念模式之间的连接在概念格中显示和描述，这有助于用户理解。本文还提出了一种计算文档和用户感兴趣的主题之间的相关性的方法。通过对比实验证明该方法是有效的。最后，在提出的农业综合自适应搜索模型的基础上，设计并实现了农业垂直搜索引擎系统“中国搜农”。该系统已开始向外界*敏*感*词*开放服务，并已在许多省市推广和应用。

0

2021-05-24

搜索引擎主题模型优化

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

农业信息资源,“三农”用户只能兴叹(组图)

0 个评论

发起人