一个简约而不简单的全能采集工具,可批量获取多个网页的信息
优采云 发布时间: 2021-08-20 02:18一个简约而不简单的全能采集工具,可批量获取多个网页的信息
KK网页信息批量采集导出工具是一个简单但不简单的全能采集工具,可以批量获取和导出多个网页的信息。该软件轻巧简单。页面信息采集,3个简单的功能,可以实现强大复杂繁琐的批量信息采集和网页操作。
软件介绍
网页信息批量提取工具,由于您自己的工作需要,管理后台订单和产品列表不支持导出。总结的时候,一一复制粘贴到excel中,难免很繁琐。 1 分钟内可以完成的工作需要手动完成。数小时内重复这些机械化动作。所以为了解决这些问题,2017年发布了第一个版本,让有相同需求的同学能够更高效的处理问题。
支持截取网页上的部分信息并导出,也支持从截取信息片段列表中匹配多条信息。
更好:
1、 请求通过 post 获取数据
2、自定义网页头协议头,伪装任意浏览器访问
3、还可以设置爬取间隔,防止采集被其他网站server快速拦截
4、将采集的结果导出到excel或txt
它不仅具有采集信息的功能,如果你有自己的网站,还可以帮你将这些信息或电脑excel中的信息发布到你的网站。
你可以用它做什么:
1、采集网页中的多条信息(标题/URL/时间等),导出
2、batch采集多个网页信息,导出
3、批量访问打开的页面,比如有些站长需要批量提交收录给百度,一个一个打开比较麻烦
如何使用
进阶进阶文章(写给站长,一般人不需要看懂,阅读让一个简单的软件变得更复杂):
那么,怎么用呢,来采集一条网站的帖子发到我的网站上
只需几步:
1、write文章page 抓取文章title 和内容规则,写下来。
2、使用“小工具”中的序列URL生成工具生成一系列列表URL。例如:list/1.html、list/2.html、list/3.html、...、list/999.html,从别人网站的列表页可以看到多少页@, 生成多个列表网址,页面数量多。
3、在匹配列表页写入并获取所有文章规则:即从列表页中取出所有文章链接,进行匹配,然后导出
4、然后输出第3步导出的文章 URL作为采集目标,输出到URL框。然后填写步骤1中的规则,这些页面的文章title和链接信息采集就可以自动发布了。
这里,目前网站某列文章的所有标题和链接都被采集接收并导出为excel,那么这个excel如何发布到我的网站?
5、在excel中手动将cell合成为post提交的信息格式。如:title=kkno1&content=com
6、Submit URL填写文章publishing backend的post接收URL,并在软件中填写协议头的cookie信息(模拟网站Administrator登录后端),然后填写第5步发帖参数 生成发帖提交格式,然后点击批处理,软件可以自动批量发帖模式,将此类信息一一提交到帖子接收页面,实现自动发布功能。
从采集到发布的完整过程。看起来步骤很多,但实际上只匹配了3个。