文章采集规则(phpcmsv9自带的采集功能/modules/collection/php)
优采云 发布时间: 2022-01-13 23:09文章采集规则(phpcmsv9自带的采集功能/modules/collection/php)
phpcms v9自带的采集功能确实可以处理2012/07/12 10:19的标准格式,但是国内大部分门户的时间格式网站它2012年7月21日10点19分是这样,导致采集无法入库,给很多站长带来困扰。让我分享一个解决这个问题的方法。
打开phpcms/modules/采集/classes/采集.class.php
这个类用于采集返回信息
从这里我们可以找到这样一段代码
if ($config['time_rule']) {
$time_rule = self::replace_sg($config['time_rule']);
$data['time'] = strtotime(self::replace_item(self::cut_html($html, $time_rule[0], $time_rule[1]), $config['time_html_rule']));
}
if (empty($data['time'])) $data['time'] = SYS_TIME;
我们用一个方法来添加这个函数,在上面的代码中先调用这个方法
//获取时间
if ($config['time_rule']) {
$time_rule = self::replace_sg($config['time_rule']);
$data['time'] = strtotime(self::formattime(self::replace_item(self::cut_html($html, $time_rule[0], $time_rule[1]), $config['time_html_rule'])));
if (!empty($data['time'])) $data['time']+=rand(1,35);
}
if (empty($data['time'])) $data['time'] = SYS_TIME;
然后将此方法添加到采集.class.php的类中
注意:仅供转载,未经测试!