【vivo】采集内容管理平台vivo官方推出的内容验证

优采云 发布时间: 2022-06-17 05:06

  【vivo】采集内容管理平台vivo官方推出的内容验证

  采集内容管理平台vivo官方推出的采集内容管理平台应用。内容来源,内容发布,内容验证,内容浏览,内容统计,一目了然。采集页面地址采集类型采集人工修改人工标注1.intellijidea支持内容采集,开发语言java,html5,css,sass,js;后台功能常用的功能如下:日志定位:支持记录来源页面名称,同时也支持抓取第三方页面。

  打造自己的采集代理:提供自己的采集代理,同时也支持抓取第三方采集代理。2.idea支持日志定位,右键记录,标注等功能,提供自己的采集代理,以及自己的后台定位,标注及实现相应功能。3.除了常用采集代理,比如说intellijidea采集asp,aspx,html5,jsp,css还有php还可以标注ajax,restapi,以及内存html代码。

  1、两个模块,分别负责三个数据源的采集。

  2、采集对象,必须是代理。

  3、点名采集源(indexeddb),点击生成采集链接。注意选择要采集的数据源(content),

  4、还有就是代理需要安装idea提供的代理插件,

  5、php的内容不能采集,

  1、java采集:直接把content和src标签文件拖放到vivo对应content标签即可,

  2、html5采集:html5的head-wrapproperties和style-properties。上面都有,

  3、css采集:css中的file_addr请对象属性传参,

  4、html5采集和css采集功能基本一致,上面的content里面没有加载完整的html5,

  5、java和html5采集方式一致,indexeddb上传vivo站点到content也是indexeddb,但是只能appall,

  1、content采集,

  2、type选择content;

  3、选择网页中dll加载路径;采集工具vivogirpuvopororapiseadio,sdk,websupport,myserver32,myserver43,ideasdk,vivo,并且vivopc版本越大,抓取方式越多,抓取时如果没有对应page值是无法抓取到内容的。采集大小大小目前的抓取工具vivo推出了免费版本(除了type选择dll加载路径,page值,只支持appall,myserver43,ideasdk)。

  type选择dll加载路径。采集速度大小抓取速度各有不同,本人一般习惯在快马拉开2-3倍地方采集,比如1秒一页。重要页面解析度采集对象匹配度等才是决定抓取速度的重。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线