最详细的优采云数据采集系统DedeCMS发布了文章指南

优采云 发布时间: 2020-08-05 17:00

  搜索引擎不喜欢复制内容,也不喜欢数据采集,但有时会遇到某些情况,例如网站修订,数据库更改,管理程序等,这些情况需要网络数据采集或网站备份. 提醒大家:

  ①在进行任何操作之前,必须备份数据库并打包原创站点;

  ②对于排名较高的网站,不建议对网站管理系统进行重大更改;

  ③不建议从其他网站采集有关新台站的信息,这样可以减少新台站的特殊重量.

  前一段时间,我制定了一个计划,以改造旧网站. 随着管理系统和数据库的替换,我决定采用一种解决方案来在原创网站上采集数据. 新手需要掌握很多网站建设知识和SEO知识才能进行网站修订. 这些经验可用来与您分享.

  

  网站的基本信息

  该网站最初具有排名,相对较大的集合和更好的优化. 制作风格与Acridine非常相似,代码简单,前端大气,可以使用标签,但网站优化方法却是一头黑帽子. 使用asp程序后端,数据库是access,要替换为php,数据库是mysql.

  用于网站修订的软件工具

  

-EditPlus或DreamWear(代码编辑器);

-APMServ(本地ASP、PHP环境);

-Fiddler Web汉化版(web数据抓包);

-火车头(LocoySpider)采集7.6(破解稳定版、数据采集);

-DedeCMS V5.7(后台内容管理程序);

-其他辅助工具。

  在Youcai Cloud Collection的帮助下进行网站修订和修订的详细步骤1.构建本地环境,安装DedeCMS,安装Fiddler Web捕获工具,安装Youcai Cloud Collection 7.6和其他软件

  安装方法非常简单,相关文章“在64位win8win10系统中启动APMServ安装失败的解决方案”,“如何安装dedecms的详细说明”.

  提供一些软件下载链接: 密码​​: 3n7e

  2. 优采云设置(关键内容)

  官方说明相对简单. 新手在采集网站数据时必须阅读和练习更多. 打开优采云采集工具,然后创建一个新任务和组.

  

  第1步: 采集URL规则

  ①起始地址. 也就是说,按照下图的顺序提取分页规则: 单击添加-单击批处理/多页输入地址格式,例如我要采集的地址列表,即:

  

http://www.123.com/case.asp?page=1&SmallClass=1

http://www.123.com/case.asp?page=2&SmallClass=1

http://www.123.com/case.asp?page=3&SmallClass=1

  可以看到变量是1、2、3 ...,并使用了通配符.

  

http://www.123.com/case.asp?page=(*)&SmallClass=1

  选择算术序列中的项目数作为要采集的列表数,并根据实际情况进行写入. 点击依次添加

  

  然后单击添加-完成-关闭.

  ②多级URL获取. 获取特定页面的URL地址列表. 在任何目标列表中,单击鼠标右键以查看源代码. 一般而言,具有基础知识的学生无需多说,还有许多他们不理解的在线资源. 找到特征代码片段,如下所示编写并保存.

  

  单击测试URL采集以确保列表采集规则正确,然后继续执行第二步.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线