你可以用它来做什么:软件介绍网页信息批量提取工具
优采云 发布时间: 2021-07-18 02:32你可以用它来做什么:软件介绍网页信息批量提取工具
KK网页信息批量采集导出工具是一个简单但不简单的全能采集工具,可以批量获取和导出多个网页的信息。该软件轻巧简单。页面信息采集,3个简单的功能,可以实现强大、复杂、繁琐的批量信息采集和网页操作。
软件介绍
网页信息批量提取工具,由于您自己的工作需要,管理后台订单和产品列表不支持导出。总结的时候,一一复制粘贴到excel中,难免很复杂。可以在 1 分钟内完成的工作必须手动完成。数小时内重复这些机械化动作。所以为了解决这些问题,2017年发布了第一个版本,让有相同需求的同学能够更高效的处理问题。
支持截取网页上的部分信息并导出,也支持从截取信息片段列表中匹配多条信息。
更好:
1、 请求通过 post 获取数据
2、自定义网页头协议头,伪装任意浏览器访问
3、还可以设置爬取间隔,防止采集快速被其他网站server拦截
4、将采集的结果导出到excel或txt
它不仅有采集信息的功能,如果你有自己的网站,还可以帮你把电脑上的这些信息或excel中的信息发布到你的网站。
你可以用它做什么:
1、采集网页中的多条信息(标题/网址/时间等),导出
2、batch采集多个网页信息,导出
3、 批量访问打开的页面。比如有的站长需要批量提交收录给百度,一个一个打开比较麻烦。
如何使用
进阶进阶文章(写给站长,一般人不需要看懂,阅读让一个简单的软件变得更复杂):
那么,怎么用呢,来采集一条网站的帖子发到我的网站上
只需几步:
1、写文章Page 抓取文章title 和内容规则,写下来。
2、使用“小工具”中的序列URL生成工具生成一系列列表URL。例如:list/1.html、list/2.html、list/3.html、...、list/999.html,从别人@k14的列表页可以看到多少页@, 生成多个列表网址,页面数量多。
3、在匹配列表页写入并获取所有文章规则:即从列表页中取出所有文章链接,进行匹配,然后导出
4、然后输出第3步导出的文章 URL作为采集目标,输出到URL框。然后填写步骤1中的规则,这些页面的文章title和链接信息采集就可以自动发布了。
这里,目前网站某列文章的所有标题和链接都被采集接收并导出为excel,那么如何将这个excel发布到我的网站?
5、在excel中手动将cell合成为post提交的信息格式。如:title=kkno1&content=com
6、Submit URL 填写文章publishing后端的post接收URL,在软件中填写协议头的cookie信息(模拟网站Administrator登录后端),然后填写步骤5发帖参数 生成发帖提交格式,然后点击批处理,软件可以自动批量发帖模式,将此类信息一一提交到帖子接收页面,实现自动发布功能。
从采集到发布的完整过程。看起来步骤很多,但实际上只匹配了3个。