网站内容采集系统(帮客户建一个基于MySQL的PHP网站,里面有一个模块)
优采云 发布时间: 2022-01-19 17:04网站内容采集系统(帮客户建一个基于MySQL的PHP网站,里面有一个模块)
帮助客户构建一个基于MySQL的PHP网站,其中有一个网页内容模块采集。首先是去google,在百度上疯狂搜索。查找带有源代码的 PHP 蜜蜂采集器。
小蜜蜂基本可以用了,最后更新日期是2006年年中。因为它是开源的,所以你找不到新版本。你可以付钱,只要你自己研究。
功能上:规则、内容替换等基本线路。不过新浪博客有点失控,花了一周时间才搞定多页博客文章采集。采集 到 文章 的管理很头疼,只好放弃了。
重复第一步,Bugs Blog 2009。费用可能会被接受。如果你仔细问,写博客是不够的。这是一个小组博客。
重复第一步,优采云采集器。总而言之,可能是平均水平中最好的。我下载了试用版,安装使用都很好。采集真不错,怪不得中科院用(中科院就在优采云家旁边)。关键问题又出来了,采集对文章的管理和上传。虽然它支持各种论坛、博客等。
只剩下一条路,长征,这是自己开发的最昂贵的方法之一。
中国人手握源代码,想重新开发,难度很大。一方面增加了再开发的成本,浪费了更多的智力,这可能是不保护知识产权的恶果。本来10W的程序员就够了,但是因为知识产权不能正常转让,所以必须增加到20W的程序员。额外的10W收入很难高。外包的方式是利用脑力劳动的产出。
我在网上放了几个源码,只要尊重版权,可以买一半免费。所有被问到的人都想要所有的版权,想把别人的劳动当成自己的,但他们没有支付版权的全部价格。
这也是我重新打开博客的原因。抱怨和责骂救不了华夏。
只有经济单位的效率才是制胜之道。