【vivo】采集内容管理平台vivo官方推出的内容验证
优采云 发布时间: 2022-06-17 05:06【vivo】采集内容管理平台vivo官方推出的内容验证
采集内容管理平台vivo官方推出的采集内容管理平台应用。内容来源,内容发布,内容验证,内容浏览,内容统计,一目了然。采集页面地址采集类型采集人工修改人工标注1.intellijidea支持内容采集,开发语言java,html5,css,sass,js;后台功能常用的功能如下:日志定位:支持记录来源页面名称,同时也支持抓取第三方页面。
打造自己的采集代理:提供自己的采集代理,同时也支持抓取第三方采集代理。2.idea支持日志定位,右键记录,标注等功能,提供自己的采集代理,以及自己的后台定位,标注及实现相应功能。3.除了常用采集代理,比如说intellijidea采集asp,aspx,html5,jsp,css还有php还可以标注ajax,restapi,以及内存html代码。
1、两个模块,分别负责三个数据源的采集。
2、采集对象,必须是代理。
3、点名采集源(indexeddb),点击生成采集链接。注意选择要采集的数据源(content),
4、还有就是代理需要安装idea提供的代理插件,
5、php的内容不能采集,
1、java采集:直接把content和src标签文件拖放到vivo对应content标签即可,
2、html5采集:html5的head-wrapproperties和style-properties。上面都有,
3、css采集:css中的file_addr请对象属性传参,
4、html5采集和css采集功能基本一致,上面的content里面没有加载完整的html5,
5、java和html5采集方式一致,indexeddb上传vivo站点到content也是indexeddb,但是只能appall,
1、content采集,
2、type选择content;
3、选择网页中dll加载路径;采集工具vivogirpuvopororapiseadio,sdk,websupport,myserver32,myserver43,ideasdk,vivo,并且vivopc版本越大,抓取方式越多,抓取时如果没有对应page值是无法抓取到内容的。采集大小大小目前的抓取工具vivo推出了免费版本(除了type选择dll加载路径,page值,只支持appall,myserver43,ideasdk)。
type选择dll加载路径。采集速度大小抓取速度各有不同,本人一般习惯在快马拉开2-3倍地方采集,比如1秒一页。重要页面解析度采集对象匹配度等才是决定抓取速度的重。