软文采集器(优采云中的“变量”进行替换并给定值范围的采集)
优采云 发布时间: 2022-02-02 11:18软文采集器(优采云中的“变量”进行替换并给定值范围的采集)
简介:post获取列表是什么意思,即一般使用Ajax或.NET中的一些技术。当您请求新内容时,页面只是部分刷新,地址栏中的 URL 保持不变。我们在处理这种采集的时候,思路是用抓包工具截取请求过程中提交的内容,找出共同特征,替换成优采云@中的“分页”变量> 并给出取值范围,使优采云@>在采集的时候,自动提交请求的内容,得到采集的新内容列表。 Yuguotianqing工作室重点介绍如何抓包,抓哪些包,以及如何处理抓包得到的数据。 采集内容和普通页面一样
优采云@>采集器采集采集教程
后样式分页列表
通过邮寄获取列表是什么意思?通常使用 ajax 或 .NET 中的一些技术。当您请求新内容时,页面只是部分刷新,地址栏中的 URL 保持不变。我们在处理这种采集的时候,思路是用抓包工具截取请求过程中提交的内容,找出共同特征,替换成优采云@中的“分页”变量> 并给出取值范围,使优采云@>在采集的时候,自动提交请求的内容,得到采集的新内容列表。 Yuguotianqing工作室重点介绍如何抓包,抓哪些包,以及如何处理抓包得到的数据。 采集的内容和普通页面一样,这里就不多说了。
工具/成分
方法/步骤
1
首先下载抓包工具:WSExplorer(由于属于黑客软件,部分杀毒软件可能会造成误报。)站长请提供下载地址:
2
我们使用浏览器打开您要抓取的页面,
当你翻页的时候,你会发现这个页面是一个post提交的翻页请求。
标题如图
3
打开下方下载WSockExpert,界面如下
4
选择你使用的浏览器,我用的是2345浏览器,里面有3个进程,最下面的一个是我们要的进程,点进去,找到你的“POST”后面通常跟的下一行这个动作或者上一行是POST数据,也就是我们所说的抓包内容。
5
从浏览器打开你要获取的页面,点击下一页,你会发现WSockExpert中获取的数据又发生了变化,也就是POST数据,也就是我们所说的获取的内容包
6
当你点击 POST 上面的那一行时,会出现下图。当你看到下面的文本时,将鼠标移动到右侧以复制二进制文本
7
你把这些内容中的2或3个复制到记事本,对吧,你会注意到一点不同,看截图,
8
将我在抓包数据中标记的地方替换为优采云@>中的[page]变量,并将整个代码复制到优采云@>中,如下图
9