网站文章一键采集( 优采云单个文本输入及点击登录方法(7.0版))

优采云 发布时间: 2022-04-12 18:41

  网站文章一键采集(

优采云单个文本输入及点击登录方法(7.0版))

  

  优采云单文本输入点击登录方法(7.0版本) 本文演示了数据单文本输入点击登录采集的方法。部分网站需要登录账号才能执行采集数据,这里文章采集数据URL示例为%C1%AC%D2%C2% C8%B9&click_id =%C1%AC%D2%C2%C8%B9&from=mallfp..pc_1.1_hq&spm=875.7931836%2FB.a1z5h.2.vxUxbA 如果是上面的URL需要登录采集,你需要做一个登录过程。

  

  登录地址是我们的网站。需要输入用户名和密码才能登录,然后打开之前的网站采集数据。具体步骤如下: 步骤1 登录优采云7.0采集器→点击新建任务→自定义采集,进入任务配置页面:然后输入网址→保存网址,系统会进入工艺设计页面,自动打开之前输入的网址。单文本输入并点击登录- 图1:输入URL 下一步是输入用户名和密码。优采云 模拟人类行为,所以这一步也很简单。Step 2 在浏览器用户名输入框点击鼠标→在右侧弹出提示中选择“输入文本”→输入自己的用户名→选择“确定”进行单个文本输入

  

  输入并点击登录-图2:输入账号单文本输入并点击登录-图3:输入密码与账号相同。这样就完成了输入用户名和密码的步骤。接下来,模拟手动点击登录按钮。完成这一步后,你会进入登录后的页面采集我们最终需要的数据。步骤3 用鼠标点击浏览器中的登录按钮→在右侧弹出的提示框中选择“点击此按钮”。这时候你会看到浏览器会跳转到登录页面。此时登录过程会完成单条文字输入,点击登录——图4:点击登录。前面的步骤完成后,打开即可。我们最终需要 采集 重新做数据的 URL 采集 处理步骤 4 点击页面上的“处理”按钮。进程显示后,我们将一个打开的文件拖入进程中。

  

  网页的步骤,打开最终采集的天猫网址。可以看到打开浏览器后的URL已经是登录URL了。输入单个文本,点击登录——图5:打开网址为采集 本教材的重点是教用户如何通过输入用户名和密码进行登录。网站,至于下面的数据采集步骤可以按照初学者的方法提取。Tips:另外,一些网站这个登录框其实就是iframe的登录框,iframe是html标签,它会创建一个内嵌框架(即inline frame)收录另一个文档,意思是网页在网页。比如上面天猫的登录地址,优采云在操作的时候获取了iframe,但是天猫有预防采集的措施。

  

  上述方法获取登录框的详细UR​​L,直接输入该URL进行登录过程。我们可以通过火狐获取登录框的详细地址,然后直接输入详细地址进行流程设计。在火狐浏览器上右击登录框→选择这个框架→查看框架信息→地址这个地址是登录框的真实地址,获取到这个地址后,可以在优采云规则中输入这个地址为一条规则。单文输入点击登录-图6:查看框架信息单文输入点击登录-图7:复制地址栏中的URL单文输入点击登录-图8:打开复制的URL在网页相关采集教程:京东商品资讯采集新浪微博资料采集

  

  . 1、简单易用,任何人都可以使用:无需技术背景,只需了解互联网采集。完成流程可视化,点击鼠标完成操作,2分钟快速上手。2、功能强大,任意网站可选:点击、登录、翻页、身份验证码、瀑布流、Ajax脚本异步加载数据,都可以通过简单的设置进行设置< @采集。3、云采集,你也可以关机。配置采集任务后,可以将其关闭,并可以在云端执行任务。庞大的云采集集群24*7不间断运行,无需担心IP阻塞和网络中断。4、 功能为免费+增值服务,可按需选择。免费版具有满足用户基本采集需求的所有功能。同时设置一些增值服务(如私有云),满足高端付费企业用户的需求。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线