博客搜索引擎优化(985院校硕士毕业算法研究员一职使用方法分享使用技巧)
优采云 发布时间: 2021-10-23 07:16博客搜索引擎优化(985院校硕士毕业算法研究员一职使用方法分享使用技巧)
大家好,我是herosunly。985大学硕士毕业,现在是算法研究员。CSDN博客专家,2020年博客明星TOP,曾获得阿里云天池大赛、科大讯飞大赛、CCF大赛等顶级排名。他拥有多项发明专利。他对机器学习和深度学习有自己独特的见解。曾指导多位非计算机专业的学生进入算法行业就业。经常被同学和同事夸奖的一项能力就是搜索,所以今天给大家分享一下如何使用搜索引擎,希望对大家有所帮助。如果觉得有用,请帮忙点赞、评论、采集(一键三连),谢谢支持~
文章内容
1. 前面写的字
对于新手程序员来说,无论是在编程的过程中,还是在软件安装、配置、使用的过程中,都经常会遇到各种意料之外的bug,但很多时候,遇到bug之后,他们却束手无策。从进入到放弃很容易。
今天,当有同学在群里提问时,时不时会看到下图所示的解决方案,即通过百度或其他搜索引擎解决问题:
但问题是,你如何使用搜索引擎?以及如何更有效地使用搜索引擎?
2. 搜索引擎的选择
简单的一句话,谷歌是首选,百度是备选。主要原因如下:
谷歌广告少,百度广告多。在技术问题的解决方案上,谷歌的成果来自世界各地的开发者,而百度则主要来自中国的开发者。众人拾柴火焰高,这也是谷歌优先考虑搜索技术问题的最重要原因。
至于如何使用谷歌,超出了本文的范围。请自行解决。
3. 搜索符号语言
除了最简单最常用的搜索方式,即在搜索框中输入内容进行搜索,还可以通过符号使用更高级的搜索功能。
3.1 精确搜索(双引号)
最准确的搜索方式是在关键词后面加上双引号,可以得到与关键词完全匹配的搜索结果。
比如输入“python网络”教程时,会以python和network作为一个整体进行搜索。
不输入双引号,第三页出现如下结果:
可以对地名、人名、形容词+名词或多个名词组成的特殊名词进行精准搜索,帮助用户完成结果筛选。最好在搜索信息比较常见或搜索结果较多时使用。
3.2 指定 网站 搜索(站点:)
对于个人搜索,它本质上是从正确的来源中找到您想要的内容。但是如果直接使用搜索引擎,往往会得到很多冗余的数据源,因此需要花费大量的时间进行筛选和识别,才能得到有效的信息。
如果平日积累很多,直接在指定来源上搜索,可以大大提高解决问题的效率。比如调试的时候可以在stackoverflow上搜索,或者在CSDN上找到优秀的学习教程:
搜索 关键词 为:module'aioredis' has no attribute'create_redis' 站点:
搜索关键词为:阿里云冠军体验分享站:
3.3 或操作(OR)
可以通过OR操作同时搜索两个关键词或关键词组(注意必须使用大写OR):
或者计算可以提高搜索的容错率,尤其是在不确定哪个关键词是最重要的搜索关键词时。值得一提的是,OR 的同义运算符是 | (竖线),OR 或 | 可以使用。
3.4 不是算术(减号)
当您明确排除部分信息时使用非操作,例如,您只想保留多义词中的特定含义。
先以python为例;
Python是一个多义词,它不仅是最流行的编程语言,还收录了python的含义。Boa Constrictor 的搜索结果可以通过非操作删除。可以看到搜索结果减少了3000万。
3.5 改变操作顺序(括号)
当涉及到复杂的操作时,操作的顺序是极其重要的。您如何确保操作顺序是您想要的?可以使用括号来达到上述效果。
上面用的是python book OR java book,如何简化?如下所示:
3.6 个同义词(波浪号)
有时我想在保留搜索语义的同时增加搜索结果关键词,那么我该如何进行呢?具体来说,比如你想找Python相关的教程,可以搜索python教程,但是收录教程的关键词不仅仅是教程,还是讲座或研讨会。
从上图可以看出,使用代字号这个同义词后,搜索结果多了4亿。它非常有用吗?当搜索结果很少时,它可能是一个不错的选择。
3.7 通配符(星号)
一般来说,通配符星号(*)主要用于表示文件路径。但是在搜索引擎中,它可以用于缺少关键词。例如,当您只记住函数名称的一部分时,您可以使用星号来表示它。比如Numpu中有一个非常常用的API,一个常用的机器学习库:concatenate,但是只能隐约想到前几个字母,如下图所示:
3.8 范围指示器(两个点)
在现实生活或工作中,往往需要查阅多年的数据,比如中国1990年到2021年的GDP,1974年到2021年的美国总统,应该怎么表达?
以1974年至2021年的美国总统为例,在输入框中输入美国总统1974...2021,如下图:
相关数据可以在链接中找到。第一栏是总裁,第二栏是总裁夫人,第三栏是副总裁。
范围指示器不仅可以指示时间范围,还可以指示其他范围。但这意味着时间范围内的粒度过大。有没有更准确的查询方法?
3.9 时间范围指示器 (datarange:)
对于上述问题,答案是使用数据范围:time1-time2。需要注意的是time1和time2的时间格式为儒略时间格式。您可以单击链接来转换时间。例如,要查询2021年1月1日至2021年10月24日新冠感染人数,输入应为COVID-19感染人数日期范围:21001-21141,如下图所示:
3.10 指定文件格式(filetype:)
使用此运算符可快速查找收录指定格式的文件。此操作适用于各种文件格式,如PDF文件、word文档、PPT幻灯片、excel表格等格式。
例如,我们知道神经网络和深度学习这本书的 PDF 文件是开源的。如果想下载进行深度学习,可以输入搜索关键词为:Neural Network and Deep Learning filetype:pdf,如下图:
该书的相应下载链接可用。
3.11 英文单词详解(define:)
在学习英语单词时,学习单词对应的中文意思往往无法准确理解单词,尤其是某些单词在中文中的含义相同时。这时候最好的学习方法就是查它的英文解释。比如我们要查询机器学习对应的详细解释,可以搜索关键词为:define:machine learning,如下图:
对了,百度不支持以上功能,哈哈。
3.12 查找相关网站(相关:)
如果你了解谷歌的PageRank算法,就会知道在谷歌的数据中,网站是相互引用的。所以你可以很容易的找到相关的网站。比如我想知道Python官网关联的网站,可以搜索关键词为:related:,如下图:
可以看到相关的网站也是常用的编程语言。但美中不足的是,这个功能只能在较大的国际网站中使用。
3.13 在 URL、标题、主题、正文中搜索
为简单起见,方便大家演示,每一项的搜索内容都是python。
4. 关于搜索思维
搜索思维本质上是将自然语言(人类语言)表达成一种机器更容易理解的形式。那么什么样的表情机更容易理解呢?与复杂的句子相比,机器更容易理解几个单词。早些年使用搜索引擎时,使用几个词的搜索效率远高于使用句子。随着自然语言处理领域的蓬勃发展,神经网络模型已经能够理解句子的语义,因此使用句子进行搜索也能取得更好的效果。但如果发现搜索结果不理想,不妨尝试提取句子中的关键词进行搜索。