最详细的优采云数据采集系统DedeCMS发布了文章指南
优采云 发布时间: 2020-08-05 17:00搜索引擎不喜欢复制内容,也不喜欢数据采集,但有时会遇到某些情况,例如网站修订,数据库更改,管理程序等,这些情况需要网络数据采集或网站备份. 提醒大家:
①在进行任何操作之前,必须备份数据库并打包原创站点;
②对于排名较高的网站,不建议对网站管理系统进行重大更改;
③不建议从其他网站采集有关新台站的信息,这样可以减少新台站的特殊重量.
前一段时间,我制定了一个计划,以改造旧网站. 随着管理系统和数据库的替换,我决定采用一种解决方案来在原创网站上采集数据. 新手需要掌握很多网站建设知识和SEO知识才能进行网站修订. 这些经验可用来与您分享.
网站的基本信息
该网站最初具有排名,相对较大的集合和更好的优化. 制作风格与Acridine非常相似,代码简单,前端大气,可以使用标签,但网站优化方法却是一头黑帽子. 使用asp程序后端,数据库是access,要替换为php,数据库是mysql.
用于网站修订的软件工具
-EditPlus或DreamWear(代码编辑器);
-APMServ(本地ASP、PHP环境);
-Fiddler Web汉化版(web数据抓包);
-火车头(LocoySpider)采集7.6(破解稳定版、数据采集);
-DedeCMS V5.7(后台内容管理程序);
-其他辅助工具。
在Youcai Cloud Collection的帮助下进行网站修订和修订的详细步骤1.构建本地环境,安装DedeCMS,安装Fiddler Web捕获工具,安装Youcai Cloud Collection 7.6和其他软件
安装方法非常简单,相关文章“在64位win8win10系统中启动APMServ安装失败的解决方案”,“如何安装dedecms的详细说明”.
提供一些软件下载链接: 密码: 3n7e
2. 优采云设置(关键内容)
官方说明相对简单. 新手在采集网站数据时必须阅读和练习更多. 打开优采云采集工具,然后创建一个新任务和组.
第1步: 采集URL规则
①起始地址. 也就是说,按照下图的顺序提取分页规则: 单击添加-单击批处理/多页输入地址格式,例如我要采集的地址列表,即:
http://www.123.com/case.asp?page=1&SmallClass=1
http://www.123.com/case.asp?page=2&SmallClass=1
http://www.123.com/case.asp?page=3&SmallClass=1
可以看到变量是1、2、3 ...,并使用了通配符.
http://www.123.com/case.asp?page=(*)&SmallClass=1
选择算术序列中的项目数作为要采集的列表数,并根据实际情况进行写入. 点击依次添加
然后单击添加-完成-关闭.
②多级URL获取. 获取特定页面的URL地址列表. 在任何目标列表中,单击鼠标右键以查看源代码. 一般而言,具有基础知识的学生无需多说,还有许多他们不理解的在线资源. 找到特征代码片段,如下所示编写并保存.
单击测试URL采集以确保列表采集规则正确,然后继续执行第二步.