操作方法:phpcms文章采集器如何设置采集规范
优采云 发布时间: 2022-11-08 08:57操作方法:phpcms文章采集器如何设置采集规范
应用采集器采集文章时,第一步是设置采集规范,那么应该如何设置呢?本文对这个问题做一个简单的介绍。
1 首先,我们需要新建一个采集任务,点击【开始网址】右侧的添加按钮。
2 系统弹出【添加开始采集地址】对话框,给出了中间五个采集的时间点,一般我们使用较多的【单网址】、【批量/多页】 ,【RSS地址】这三种方式。我们在单个或多个URL下输入需要采集的URL,依次点击右侧的【添加】按钮和【完成】按钮。
3 URL添加后,我们需要告诉采集软件我们需要网页的哪一部分采集。此时,我们需要点击【多级URL获取】右侧的添加按钮,添加采集规则。
4 在【添加多级 URL 规则】选项框中,一般我们勾选【从页面自动分析获取地址连接】,并在下方设置【从该选定区域提取 URL】,实现采集的某段网页的目的。
5 我们可以通过查看页面的HTML代码,或者查看这些连续写法的共性,然后通过URL过滤将这些URL过滤掉,就可以得到我们需要的列。例如文中的过滤条件为:
6、获取本页面的cookie信息,点击【网页登录信息】右侧的【浏览器登录获取】,打开【内置微型浏览器】对话框,点击里面的cookie,确认节省。
7点击右下角的【Test URL采集】按钮,查看【Test URL采集】是否符合要求。如果没有,则需要在【步骤 5】中调整规则。
教程:自动给关键字加链接html,DEDECMS 全站关键字自动添加链接的方法
DEDEcms的全内链方案,所有设置为关键词的内链都会在文档中创建,突破了关键字的限制。
注意:因为我有上万个网站关键字,恐怕用了这个修改后,生成HTML会很慢,所以如果你在使用中有什么测试,请贴出结果并说明如何执行效率很高,非常感谢。谢谢你。
1.修改系统参数->核心设置->关键字替换(是/否)使用该功能会影响HTML生成速度(这里选择是)
2.修改include/arc.archives.class.php
找到
在下面添加以下代码
//设置所有关键词
$dsql12 = 新的 DedeSql();
$query1="从 dede_keywords 中选择 *";
$dsql12->SetQuery($query1);
$dsql12->执行();
而($kws = $dsql12->GetArray())
{
再次查找:
如果($i > $maxkey)
{
休息;
}
并删除。
找到
$body = preg_replace("/(^|>)([^
添加一个
}
3.核心—>文档关键词维护—>添加关键字和链接重新生成文章。