官方发布:帝国cms仿《新版东方头条》模板 新闻资讯门户网站模板+投稿+带采集
优采云 发布时间: 2022-10-11 09:22官方发布:帝国cms仿《新版东方头条》模板 新闻资讯门户网站模板+投稿+带采集
松开你的眼睛,戴上耳机,听它~!
帝国cms模仿“新版东方头条”模板 新闻资讯门户 网站模板+投稿+采集
“帝国cms模仿《东方新版头条》模板新闻信息门户网站模板+投稿+采集”,免费下载使用,仅供学习参考,自适应网站结构,安装简单,优化快捷。
源代码名称:“帝国cms模仿的”新版东方头条“模板新闻信息门户网站模板+投稿+采集(专业测试可用)。
开发环境:帝国cms7.5
安装环境:
模板介绍:首页模板,图片列表,新闻列表,联系我们,下载栏目,单页,文章页。
外媒:BBC英文文章采集
本文介绍如何使用优采云采集(以BBC亚洲新闻为例)。
采集网站:
采集的内容包括:文章标题、文章正文
使用功能点:
l 分页列表和详细信息提取
第 1 步:创建一个 BBC 英语 文章采集 任务
1)进入主界面,选择“自定义模式”
2) 将你想要采集的URL复制粘贴到网站的输入框,点击“保存URL”
第 2 步:创建列表循环
1) 在页面右上角,打开“流程”,显示“流程设计器”和“自定义当前操作”两个部分。选择页面上的第一张图片,系统会自动识别页面上的相似链接,并选择“全选”
2)选择“循环通过每个链接”
3)设置超时和ajax滚动
第三步:采集小说内容
1)在页面中选择文本标题为采集(选中的内容会变成绿色),选择“采集这个元素的文本”
2)在页面中选择body内容为采集(选中的内容会变成绿色),选择全选,
选择“采集此元素的文本”
3)设置合并字段,选择自定义数据字段,选择自定义数据合并方式,
然后多次选择同一字段提取并合并为一行。
4)修改字段名
5)选择“启动本地采集”
第四步:BBC英语文章数据采集并导出
1)采集完成后会弹出提示,选择“导出数据。选择“合适的导出方式”导出采集好的BBC英文文章数据
2)这里我们选择excel作为导出格式,数据导出如下图