搜索引擎主题模型优化(Python语言完成全文搜索的主要编程工作介绍介绍(图) )

优采云 发布时间: 2021-11-21 00:02

  搜索引擎主题模型优化(Python语言完成全文搜索的主要编程工作介绍介绍(图)

)

  介绍

  从今天开始,付哥就要带着童鞋来做项目了。虽然我们已经介绍了c/c++、java、php、python等很多编程语言,这些编程语言也可以独立完成一些项目的开发任务,但是如果要做出一个好的项目,那就是通常仅依靠一种编程语言是不够的。所以,当傅哥带着大家做项目的时候,他会同时使用几种编程语言。

  我们的第一个项目叫做搜索引擎,它模仿百度和谷歌的基本全文搜索功能。当然,我们要使用刚刚安装好的ElasticSearch搜索引擎软件。没有安装的小朋友可以学习之前的课程。

  为了避免一次引入太多新知识,我们这次使用Python语言来完成全文搜索的主要编程工作。因为没有学过Python的界面操作,所以我们这次做的搜索引擎是控制台(类似于MS-DOS)形式。

  开发一个项目有很多步骤,通常是从需求分析、技术选择、模型设计、数据库设计、模块设计,最后是编写代码。当然,代码写好之后,还要经过严格的测试和质量检验。可以完成在生产环境中部署等后期制作工作。

  傅哥就带着童鞋做了一个简单的搜索引擎。这时候会简化一些步骤。这次要做的项目需要用到三种技术:Python、MySQL、ElasticSearch。今天我们将首先设计模型。一个链接。

  模型设计

  首先,我们可以思考一下搜索引擎都有哪些“东西”?最简单最重要的就是一个一个的搜索结果吧?

  那么搜索结果是什么呢?我们会发现,搜索结果其实是一个个网页,包括网页的标题、匹配的内容、网页的原创网址。

  既然是网页,那肯定是属于某个网站的。毕竟,一个网站 至少会有一个网页。一般情况下,一个网站会有很多很多的网页,比如某宝,像董这样的大型网站有1000w以上的网页。因此,网站 是相对于网页的一对多关系。在设计模型时,我们至少需要一个网站模型,一个网页模型,每个网页模型都需要从属于一个网站模型。

  网站型号

  在确定了网站模型之后,我们需要为网站模型设计它的属性。网站 有什么属性?

  我们可以列出网站的可能属性,包括但不限于网站域名、网站标题、网站关键字、网站描述、网站等等。此外,还应该有一些与搜索引擎相关的属性,包括但不限于收录数量、权重值等。

  至此,我们的网站模型分析基本完成!

  网络模型

  网页模型也是如此。动动脑子想想网页会有哪些属性?

  Foge可以想到属于网站,网页网址,网页标题,网页关键词,网页介绍,网页文字,网页图片,网页视频,网页音频等等。

  至此,我们的网页模型分析基本完成!

  总结

  模型设计是项目的第一步。看起来很简单,但实际上需要很多经验,因为剩下的工作都是围绕着模型进行的。如果模型设计不合理,剩下的工作就会一团糟!

  模型设计的几个要点,傅哥总结出来分享给大家:

  事实上,模型设计只是一个粗略的设计。在项目开发过程中,需要添加许多额外的新模型。但是,必须在模型设计阶段确定主模型,不能在后期逐渐增加主模型。

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线