QueryList采集器开发指南

优采云 发布时间: 2020-05-28 08:01

  

  出现乱码的问题好多,解决方式也不尽相同采集过来的文章乱码,要视具体情况而定,以下几种乱码解决方案仅供参考。

  Query方式:

  QueryList::Query(采集的目标页面,采集规则[,区域选择器][,输出编码][,输入编码][,是否移除背部])

  1.设置输入输出编码

  $html =<<<STR

<div>

   <p>这是内容</p>

</div>

STR;

$rule = array(

   'content' => array('div>p:last','text')

);

$data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;

  2.设置输入输出编码,并设置最后一个参数为true

  如果设置输入输出参数始终未能解决乱码采集过来的文章乱码,那就设置最后一个参数为true(移除背部)

  $html =<<<STR

<div>

   <p>这是内容</p>

</div>

STR;

$rule = array(

   'content' => array('div>p:last','text')

);

$data = QueryList::Query($html,$rule,'','UTF-8','GB2312',true)->data;

  乱码:#all

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线