解决方案:关键词采集器针对的目标用户是什么?
优采云 发布时间: 2022-12-02 08:35关键词采集器都差不多。从接口来看,python处理更方便;从分词来看,自然语言分词不需要事先设置,直接就分好了,本地可以实现;从索引来看,jieba处理效率更高;从文本内容表达能力来看,sentty就挺好的。关键在于需求,需求对应着最好的技术。
关键词采集器针对的目标用户是想深入了解爬虫知识的人。分词工具应该针对的目标用户是对语言语义不熟悉,并且想了解语言自然语言语义的人。python的话直接有人写好的。sentty应该就没人能写好了,即使能写好其设计也不合理。html不知道有没有人写。go语言也不知道有没有人写。java语言我不熟悉,就不在这里瞎评论了。另外要注意,go在此之前的版本里有for/function处理,可是java语言里完全没有。
如果你本身写爬虫,用python的话,应该是对相应技术没有基础,而且很看重爬虫领域。python的话,大概是个人爱好吧。我更喜欢r。
" />
爬虫有java,python等,算法有c++,go等,有些极端语言的爬虫框架只能用python开发。手机网页都有python接口,.net,c#都有单独提供接口给你调用,
不知道,没注意过。python已经没怎么听说,大概不温不火吧。
非常受欢迎,