需求解决方案:1688商品采集
优采云 发布时间: 2022-11-29 21:19需求解决方案:1688商品采集
优采云
1688商品采集软件是一款1688(阿里巴巴)商品信息批量采集软件,可以帮助用户快速获取平台商品信息,即时了解和更新店铺动态。操作简单,实用方便。非常好的软件。
" />
优采云
1688商品采集软件支持两种采集模式:
1.页面设置集合
在WEB页面设置采集
关键词,精细设置采集
条件(如款式、颜色、尺码等)。这适合复杂条件下的精品采集
。
" />
2.按关键词批量领取
通过导入一批关键词,直接按关键词即可领取。
采集的商品信息包括商品ID、商品名称、商品URL、商品价格、商品图片、月销量、月销量、退货率、描述、回复、发货、旺旺、公司名称、业务类型等字段,以及export 为文本表格(excel),可用于产品市场分析、同行销售业绩评估、企业信息采集等。每个产品关键词最多支持100页,每页60个产品,以及约 6,000 条产品信息。支持详细的搜索参数设置,支持多个产品关键词顺序采集,每行不同的关键词回车键,支持字段排序(点击标题栏)然后导出保存。
解决方案:云采集规则优化加速案例1——不固定元素列表转固定元素列表.pdf 3页
" />
云收录规则优化加速案例(一)——从不固定元素列表到固定元素列表 看过云收录加速原理的人都知道,云收录中除单个元素和列表外的所有列表都可以拆分不固定的元素,可以加快云采集的速度。当你使用不固定元素列表的云采集规则时,这条规则无法在云服务器上拆分,所以无法优化采集速度,导致云采集速度没有提升。本教程将教您如何通过将不固定元素列表转换为固定元素列表来帮助您优化云采集
规则,从而获得更高的采集
速度。各种循环列表的循环方式先给大家看一个自动生成不固定元素列表的例子: 以网站:http///tutorial?type=1为例,打开这个网站,点击第一个教程名称添加循环,然后继续单击第二个循环项以添加循环。如图: 这是系统自动生成的固定循环列表的xpath(//HTML/BODY[1]/DIV[3]/DIV[1]/DIV[1]/DIV[2]/ DIV[1]/DIV /A[1]) 然后我们通过修改不固定元素列表的XPath来转换固定元素列表。首先,将这个未固定元素列表的Xpath复制到Firefox浏览器中并打开。可以看到网页中教程每一行的信息都被提取出来了。拆分列表,我们只需要修改上面的Xpath即可;如下//HTML/BODY[1]/DIV[3]/DIV[1]/DIV[1]/DIV[2]/DIV[1]/DIV[1]/A[1]中可以看到给定DIV后添加[1]定位到第一个教程的位置。观察第一个Xpath可以看到只有倒数第二个DIV没有序号,这说明所有的教程都被选中了,所以当你要拆分列表的时候,需要加上[number]来定位。
" />
以后遇到其他需要拆分的列表时,建议将xpath复制到火狐浏览器中,通过修改其中未定位的标签进行拆分实验,确定修改后的xpath。Xpath的修改可以参考这两个教程: Xpath1, Xpath2 其他行的位置,按照列表的顺序,修改上面Xpath中的数字,然后将修改后的Xpath复制到固定元素的列表中. 如下图,我修改了8个Xpath,所以列表中只出现了8个元素的信息。至此我们就完成了固定元素列表的转换。固定元素列表和不固定元素列表可以相互修改。前提是源代码的内容格式必须一致。建议可以改成固定元素列表,尽量改成固定元素列表(循环列表中没有点击元素,直接提取元素,不要用这种方式拆分.你可以试试下面推荐的另一种加速案例)。这将拆分任务以加速云采集
。其他云加速案例: 云获取规则优化加速案例(二)——循环页面拆分