小程序

小程序

【报销革命】01 智能收据管理,开启极至报销体验

采集交流优采云 发表了文章 • 0 个评论 • 225 次浏览 • 2020-08-03 20:02 • 来自相关话题

  增值税电子普通收据、增值税电子专用收据和区块链电子普通收据均可从陌陌卡包直接获取。
  在“财务云”小程序首页点选“电子收据”,确认授权后智能识别,一键采集,即可将陌陌卡包中须要报销的收据导出到“财务云”小程序中,系统就会同时获取电子收据原文件,用于后续电子会计账簿的归档。
  知乎视频
  
  纸票/图片:智能照相辨识
  对于仍占相当比列的纸质收据,“财务云”小程序可用照相或从相册导出图片的形式,通过“智能分类辨识引擎”和“智能OCR识别引擎”识别每张票据并解析收据信息,获取收据的结构化数据,并将导出的多张收据以票据列表的方式诠释;点击列表中的任意一张收据,即可查看该收据的详尽信息。
  为节约收据采集时间,“财务云”支持多张收据混和照相和多张图片同时导出,还可切换到“连拍”模式,将收据连续照相后统一核实确认信息。
  知乎视频
  
  【 技术小讲座 】
  什么是“智能分类辨识引擎”和“智能OCR识别引擎”?
  智能分类辨识引擎,基于图象分类算法、目标测量算法等切分分类引擎,可以实现多类型、多特点的影像切分分类和智能辨识,并返回图片的切分分类结果数据。
  
  智能OCR识别,通过光学设备将纸质文档上的文字转化为图象,结合卷积神经网络算法的应用,将图象信息翻译成可编辑的计算机文字,输出收据的结构化信息,文本辨识准确率已提升至99%智能识别,一键采集,高于人工辨识。
  
  手工录入:发票采集无遗漏
  系统除提供上述两种采集方式外,还支持通过手工录入的方法采集发票信息。用户可以步入“我的收据”界面自动新增票据信息,支持常见的16种收据类型,保留了费用报销一定的灵活性。
  知乎视频
  
  票据合规 & 查重验真
  “财务云”小程序支持从“源头”上对采集的收据进行合规性检验,可以手动辨识收据中出现的敏感数组并给出违法提示;对于超过报销有效期的收据还可在议付、审批、审核时,给出警告或严禁提示。
  
  如果一张收据早已采集,再次导出时将会有重复提示。导入增值税发票后会调用国税局查验插口查验收据真假。查验成功的收据返回查验结果信息;查验失败则返回查验状态及失败缘由,用户可通过手工查验再度发起查验。
  
  “我的收据”:一目了然
  小程序中有“我的收据”模块,个人可以查看导出过的所有收据,并通过销方名称、发票号码或城市维度进行快捷搜索,也可以按照收据类型、日期、报销状态和是否因公报销四个条件快速筛选,还可根据收据采集日期、发票开票日期和收据金额进行正负向排序,实现个人收据的有效管理。若是帮朋友开的收据,还可在报销前转交给朋友。
  
  从收据到报销单,一键递交
  “财务云”小程序支持从“我的收据”列表里直接勾选须要报销的收据,立即步入报销单补报界面,实现从收据导出到水单报销的无缝衔接。也可从首页的“费用报销”模块步入,选择费用类型后关联收据,随时随地新建报销单。
  
  “财务云”小程序的应用,使收据整理的工作轻松不少,帮助职工愉快开启报销之旅。若电子收据全面推行,发票无需复印而以电子原件归档将成为更好的选择,移动报销的模式将迎来更广泛的应用。
  完成了收据采集,如何轻松水单并实现智能初审呢?敬请期盼财务云信息系统 FOL 专栏上期解锁!
  财务云 FOL 专栏
  中兴新云 FOL 财务云信息系统,源于中兴新云团队多年沉淀的财务共享服务管理理念及信息化建设经验,是企业建设财务共享服务、推动数字化变革的重要工具。FOL 财务云信息系统以财务共享为核心,集合费用、采购、销售、核算、资金和税务六大体系,采用成熟、主流的 IT 技术框架,通过各个系统的互联互通,实现了业务数据的手动采集与财务处理的智能高效,帮助企业发挥数据价值。
  如您希望了解 FOL 财务云信息系统的更多功能,请联系我们: 查看全部

  增值税电子普通收据、增值税电子专用收据和区块链电子普通收据均可从陌陌卡包直接获取。
  在“财务云”小程序首页点选“电子收据”,确认授权后智能识别,一键采集,即可将陌陌卡包中须要报销的收据导出到“财务云”小程序中,系统就会同时获取电子收据原文件,用于后续电子会计账簿的归档。
  知乎视频
  
  纸票/图片:智能照相辨识
  对于仍占相当比列的纸质收据,“财务云”小程序可用照相或从相册导出图片的形式,通过“智能分类辨识引擎”和“智能OCR识别引擎”识别每张票据并解析收据信息,获取收据的结构化数据,并将导出的多张收据以票据列表的方式诠释;点击列表中的任意一张收据,即可查看该收据的详尽信息。
  为节约收据采集时间,“财务云”支持多张收据混和照相和多张图片同时导出,还可切换到“连拍”模式,将收据连续照相后统一核实确认信息。
  知乎视频
  
  【 技术小讲座 】
  什么是“智能分类辨识引擎”和“智能OCR识别引擎”?
  智能分类辨识引擎,基于图象分类算法、目标测量算法等切分分类引擎,可以实现多类型、多特点的影像切分分类和智能辨识,并返回图片的切分分类结果数据。
  
  智能OCR识别,通过光学设备将纸质文档上的文字转化为图象,结合卷积神经网络算法的应用,将图象信息翻译成可编辑的计算机文字,输出收据的结构化信息,文本辨识准确率已提升至99%智能识别,一键采集,高于人工辨识。
  
  手工录入:发票采集无遗漏
  系统除提供上述两种采集方式外,还支持通过手工录入的方法采集发票信息。用户可以步入“我的收据”界面自动新增票据信息,支持常见的16种收据类型,保留了费用报销一定的灵活性。
  知乎视频
  
  票据合规 & 查重验真
  “财务云”小程序支持从“源头”上对采集的收据进行合规性检验,可以手动辨识收据中出现的敏感数组并给出违法提示;对于超过报销有效期的收据还可在议付、审批、审核时,给出警告或严禁提示。
  
  如果一张收据早已采集,再次导出时将会有重复提示。导入增值税发票后会调用国税局查验插口查验收据真假。查验成功的收据返回查验结果信息;查验失败则返回查验状态及失败缘由,用户可通过手工查验再度发起查验。
  
  “我的收据”:一目了然
  小程序中有“我的收据”模块,个人可以查看导出过的所有收据,并通过销方名称、发票号码或城市维度进行快捷搜索,也可以按照收据类型、日期、报销状态和是否因公报销四个条件快速筛选,还可根据收据采集日期、发票开票日期和收据金额进行正负向排序,实现个人收据的有效管理。若是帮朋友开的收据,还可在报销前转交给朋友。
  
  从收据到报销单,一键递交
  “财务云”小程序支持从“我的收据”列表里直接勾选须要报销的收据,立即步入报销单补报界面,实现从收据导出到水单报销的无缝衔接。也可从首页的“费用报销”模块步入,选择费用类型后关联收据,随时随地新建报销单。
  
  “财务云”小程序的应用,使收据整理的工作轻松不少,帮助职工愉快开启报销之旅。若电子收据全面推行,发票无需复印而以电子原件归档将成为更好的选择,移动报销的模式将迎来更广泛的应用。
  完成了收据采集,如何轻松水单并实现智能初审呢?敬请期盼财务云信息系统 FOL 专栏上期解锁!
  财务云 FOL 专栏
  中兴新云 FOL 财务云信息系统,源于中兴新云团队多年沉淀的财务共享服务管理理念及信息化建设经验,是企业建设财务共享服务、推动数字化变革的重要工具。FOL 财务云信息系统以财务共享为核心,集合费用、采购、销售、核算、资金和税务六大体系,采用成熟、主流的 IT 技术框架,通过各个系统的互联互通,实现了业务数据的手动采集与财务处理的智能高效,帮助企业发挥数据价值。
  如您希望了解 FOL 财务云信息系统的更多功能,请联系我们:

php实现的采集小程序,做采集的必看

采集交流优采云 发表了文章 • 0 个评论 • 454 次浏览 • 2020-07-25 08:02 • 来自相关话题

  
  以下是我收集的php实现的采集小程序,自己测试可用php 文章采集,做采集很实用哦!
  <?php
//调用方法 :localhost/2.php?id=1 (自动采集1-8的列表)
header(&quot;Content-type:text/html;charset=utf-8&quot;);
$con =mysql_connect(&quot;localhost&quot;, &quot;root&quot;, &quot;huweishen.com&quot;) or die(&quot;数据库链接错误&quot;);
mysql_select_db(&quot;liuyan&quot;, $con);
mysql_query(&quot;set names &#39;utf8&#39;&quot;);
function preg_substr($start, $end, $str) // 正则截取函数
{
$temp = preg_split($start, $str);
$content = preg_split($end, $temp[1]);
return $content[0];
}
function str_substr($start, $end, $str) // 字符串截取函数
{
$temp = explode($start, $str, 2);
$content = explode($end, $temp[1], 2);
return $content[0];
}
// ---------------- 使用实例 ----------------

if($_GET[&#39;id&#39;]<=8&amp;&amp;$_GET[&#39;id&#39;]){
$id=$_GET[&#39;id&#39;];
$url = &quot;http://www.037c.com/New/list_5_$id.html&quot;; //目标站
$fp = fopen($url, &quot;r&quot;) or die(&quot;超时&quot;);
$fcontents = file_get_contents($url);
$pattern=&quot;/<\/span><a href=\&quot;(.*)\&quot; title=\&quot;(.*)\&quot; target=\&quot;_blank\&quot;>/iUs&quot;;//正则
preg_match_all($pattern, $fcontents, $arr);
//print_r($arr);
foreach($arr[1] as $k=>$url)
{
$title = iconv(&#39;GB2312&#39;, &#39;UTF-8&#39;, addslashes($arr[2][$k]));
// echo $title;
// echo $url;
$str = iconv(&quot;GB2312&quot;,&quot;UTF-8&quot;, file_get_contents($url));
$author = preg_substr(&quot;/作者:/&quot;, &quot;/<\//&quot;, $str); // 通过正则提取作者
$content = str_substr(&#39;<p class=&quot;wltg&quot;>&#39;, &#39;</p>&#39;, $str); //通过字符串提取标题
$sql = &quot;INSERT INTO `caiji` (`title`, `url` , `content`, `author` ) VALUES (&#39;$title&#39;, &#39;$url&#39; , &#39;$content&#39; , &#39;$author&#39;)&quot;;
// echo $sql.&quot;<br/>&quot;;
mysql_query($sql);
}
$id++;
echo &quot;正在采集URL数据列表$id...请稍后...&quot;;
echo &quot;<script>window.location=&#39;2.php?id=$id&#39;</script>&quot;;
}
else{
echo &quot;采集数据结束。&quot;;
}
?>
  
  其中 title 设置惟一php 文章采集,可以避免重复采集,很好的的一个php采集小程序,作者:风云无忌 查看全部
  
  以下是我收集的php实现的采集小程序,自己测试可用php 文章采集,做采集很实用哦!
  <?php
//调用方法 :localhost/2.php?id=1 (自动采集1-8的列表)
header(&quot;Content-type:text/html;charset=utf-8&quot;);
$con =mysql_connect(&quot;localhost&quot;, &quot;root&quot;, &quot;huweishen.com&quot;) or die(&quot;数据库链接错误&quot;);
mysql_select_db(&quot;liuyan&quot;, $con);
mysql_query(&quot;set names &#39;utf8&#39;&quot;);
function preg_substr($start, $end, $str) // 正则截取函数
{
$temp = preg_split($start, $str);
$content = preg_split($end, $temp[1]);
return $content[0];
}
function str_substr($start, $end, $str) // 字符串截取函数
{
$temp = explode($start, $str, 2);
$content = explode($end, $temp[1], 2);
return $content[0];
}
// ---------------- 使用实例 ----------------

if($_GET[&#39;id&#39;]<=8&amp;&amp;$_GET[&#39;id&#39;]){
$id=$_GET[&#39;id&#39;];
$url = &quot;http://www.037c.com/New/list_5_$id.html&quot;; //目标站
$fp = fopen($url, &quot;r&quot;) or die(&quot;超时&quot;);
$fcontents = file_get_contents($url);
$pattern=&quot;/<\/span><a href=\&quot;(.*)\&quot; title=\&quot;(.*)\&quot; target=\&quot;_blank\&quot;>/iUs&quot;;//正则
preg_match_all($pattern, $fcontents, $arr);
//print_r($arr);
foreach($arr[1] as $k=>$url)
{
$title = iconv(&#39;GB2312&#39;, &#39;UTF-8&#39;, addslashes($arr[2][$k]));
// echo $title;
// echo $url;
$str = iconv(&quot;GB2312&quot;,&quot;UTF-8&quot;, file_get_contents($url));
$author = preg_substr(&quot;/作者:/&quot;, &quot;/<\//&quot;, $str); // 通过正则提取作者
$content = str_substr(&#39;<p class=&quot;wltg&quot;>&#39;, &#39;</p>&#39;, $str); //通过字符串提取标题
$sql = &quot;INSERT INTO `caiji` (`title`, `url` , `content`, `author` ) VALUES (&#39;$title&#39;, &#39;$url&#39; , &#39;$content&#39; , &#39;$author&#39;)&quot;;
// echo $sql.&quot;<br/>&quot;;
mysql_query($sql);
}
$id++;
echo &quot;正在采集URL数据列表$id...请稍后...&quot;;
echo &quot;<script>window.location=&#39;2.php?id=$id&#39;</script>&quot;;
}
else{
echo &quot;采集数据结束。&quot;;
}
?>
  
  其中 title 设置惟一php 文章采集,可以避免重复采集,很好的的一个php采集小程序,作者:风云无忌

【报销革命】01 智能收据管理,开启极至报销体验

采集交流优采云 发表了文章 • 0 个评论 • 225 次浏览 • 2020-08-03 20:02 • 来自相关话题

  增值税电子普通收据、增值税电子专用收据和区块链电子普通收据均可从陌陌卡包直接获取。
  在“财务云”小程序首页点选“电子收据”,确认授权后智能识别,一键采集,即可将陌陌卡包中须要报销的收据导出到“财务云”小程序中,系统就会同时获取电子收据原文件,用于后续电子会计账簿的归档。
  知乎视频
  
  纸票/图片:智能照相辨识
  对于仍占相当比列的纸质收据,“财务云”小程序可用照相或从相册导出图片的形式,通过“智能分类辨识引擎”和“智能OCR识别引擎”识别每张票据并解析收据信息,获取收据的结构化数据,并将导出的多张收据以票据列表的方式诠释;点击列表中的任意一张收据,即可查看该收据的详尽信息。
  为节约收据采集时间,“财务云”支持多张收据混和照相和多张图片同时导出,还可切换到“连拍”模式,将收据连续照相后统一核实确认信息。
  知乎视频
  
  【 技术小讲座 】
  什么是“智能分类辨识引擎”和“智能OCR识别引擎”?
  智能分类辨识引擎,基于图象分类算法、目标测量算法等切分分类引擎,可以实现多类型、多特点的影像切分分类和智能辨识,并返回图片的切分分类结果数据。
  
  智能OCR识别,通过光学设备将纸质文档上的文字转化为图象,结合卷积神经网络算法的应用,将图象信息翻译成可编辑的计算机文字,输出收据的结构化信息,文本辨识准确率已提升至99%智能识别,一键采集,高于人工辨识。
  
  手工录入:发票采集无遗漏
  系统除提供上述两种采集方式外,还支持通过手工录入的方法采集发票信息。用户可以步入“我的收据”界面自动新增票据信息,支持常见的16种收据类型,保留了费用报销一定的灵活性。
  知乎视频
  
  票据合规 &amp; 查重验真
  “财务云”小程序支持从“源头”上对采集的收据进行合规性检验,可以手动辨识收据中出现的敏感数组并给出违法提示;对于超过报销有效期的收据还可在议付、审批、审核时,给出警告或严禁提示。
  
  如果一张收据早已采集,再次导出时将会有重复提示。导入增值税发票后会调用国税局查验插口查验收据真假。查验成功的收据返回查验结果信息;查验失败则返回查验状态及失败缘由,用户可通过手工查验再度发起查验。
  
  “我的收据”:一目了然
  小程序中有“我的收据”模块,个人可以查看导出过的所有收据,并通过销方名称、发票号码或城市维度进行快捷搜索,也可以按照收据类型、日期、报销状态和是否因公报销四个条件快速筛选,还可根据收据采集日期、发票开票日期和收据金额进行正负向排序,实现个人收据的有效管理。若是帮朋友开的收据,还可在报销前转交给朋友。
  
  从收据到报销单,一键递交
  “财务云”小程序支持从“我的收据”列表里直接勾选须要报销的收据,立即步入报销单补报界面,实现从收据导出到水单报销的无缝衔接。也可从首页的“费用报销”模块步入,选择费用类型后关联收据,随时随地新建报销单。
  
  “财务云”小程序的应用,使收据整理的工作轻松不少,帮助职工愉快开启报销之旅。若电子收据全面推行,发票无需复印而以电子原件归档将成为更好的选择,移动报销的模式将迎来更广泛的应用。
  完成了收据采集,如何轻松水单并实现智能初审呢?敬请期盼财务云信息系统 FOL 专栏上期解锁!
  财务云 FOL 专栏
  中兴新云 FOL 财务云信息系统,源于中兴新云团队多年沉淀的财务共享服务管理理念及信息化建设经验,是企业建设财务共享服务、推动数字化变革的重要工具。FOL 财务云信息系统以财务共享为核心,集合费用、采购、销售、核算、资金和税务六大体系,采用成熟、主流的 IT 技术框架,通过各个系统的互联互通,实现了业务数据的手动采集与财务处理的智能高效,帮助企业发挥数据价值。
  如您希望了解 FOL 财务云信息系统的更多功能,请联系我们: 查看全部

  增值税电子普通收据、增值税电子专用收据和区块链电子普通收据均可从陌陌卡包直接获取。
  在“财务云”小程序首页点选“电子收据”,确认授权后智能识别,一键采集,即可将陌陌卡包中须要报销的收据导出到“财务云”小程序中,系统就会同时获取电子收据原文件,用于后续电子会计账簿的归档。
  知乎视频
  
  纸票/图片:智能照相辨识
  对于仍占相当比列的纸质收据,“财务云”小程序可用照相或从相册导出图片的形式,通过“智能分类辨识引擎”和“智能OCR识别引擎”识别每张票据并解析收据信息,获取收据的结构化数据,并将导出的多张收据以票据列表的方式诠释;点击列表中的任意一张收据,即可查看该收据的详尽信息。
  为节约收据采集时间,“财务云”支持多张收据混和照相和多张图片同时导出,还可切换到“连拍”模式,将收据连续照相后统一核实确认信息。
  知乎视频
  
  【 技术小讲座 】
  什么是“智能分类辨识引擎”和“智能OCR识别引擎”?
  智能分类辨识引擎,基于图象分类算法、目标测量算法等切分分类引擎,可以实现多类型、多特点的影像切分分类和智能辨识,并返回图片的切分分类结果数据。
  
  智能OCR识别,通过光学设备将纸质文档上的文字转化为图象,结合卷积神经网络算法的应用,将图象信息翻译成可编辑的计算机文字,输出收据的结构化信息,文本辨识准确率已提升至99%智能识别,一键采集,高于人工辨识。
  
  手工录入:发票采集无遗漏
  系统除提供上述两种采集方式外,还支持通过手工录入的方法采集发票信息。用户可以步入“我的收据”界面自动新增票据信息,支持常见的16种收据类型,保留了费用报销一定的灵活性。
  知乎视频
  
  票据合规 &amp; 查重验真
  “财务云”小程序支持从“源头”上对采集的收据进行合规性检验,可以手动辨识收据中出现的敏感数组并给出违法提示;对于超过报销有效期的收据还可在议付、审批、审核时,给出警告或严禁提示。
  
  如果一张收据早已采集,再次导出时将会有重复提示。导入增值税发票后会调用国税局查验插口查验收据真假。查验成功的收据返回查验结果信息;查验失败则返回查验状态及失败缘由,用户可通过手工查验再度发起查验。
  
  “我的收据”:一目了然
  小程序中有“我的收据”模块,个人可以查看导出过的所有收据,并通过销方名称、发票号码或城市维度进行快捷搜索,也可以按照收据类型、日期、报销状态和是否因公报销四个条件快速筛选,还可根据收据采集日期、发票开票日期和收据金额进行正负向排序,实现个人收据的有效管理。若是帮朋友开的收据,还可在报销前转交给朋友。
  
  从收据到报销单,一键递交
  “财务云”小程序支持从“我的收据”列表里直接勾选须要报销的收据,立即步入报销单补报界面,实现从收据导出到水单报销的无缝衔接。也可从首页的“费用报销”模块步入,选择费用类型后关联收据,随时随地新建报销单。
  
  “财务云”小程序的应用,使收据整理的工作轻松不少,帮助职工愉快开启报销之旅。若电子收据全面推行,发票无需复印而以电子原件归档将成为更好的选择,移动报销的模式将迎来更广泛的应用。
  完成了收据采集,如何轻松水单并实现智能初审呢?敬请期盼财务云信息系统 FOL 专栏上期解锁!
  财务云 FOL 专栏
  中兴新云 FOL 财务云信息系统,源于中兴新云团队多年沉淀的财务共享服务管理理念及信息化建设经验,是企业建设财务共享服务、推动数字化变革的重要工具。FOL 财务云信息系统以财务共享为核心,集合费用、采购、销售、核算、资金和税务六大体系,采用成熟、主流的 IT 技术框架,通过各个系统的互联互通,实现了业务数据的手动采集与财务处理的智能高效,帮助企业发挥数据价值。
  如您希望了解 FOL 财务云信息系统的更多功能,请联系我们:

php实现的采集小程序,做采集的必看

采集交流优采云 发表了文章 • 0 个评论 • 454 次浏览 • 2020-07-25 08:02 • 来自相关话题

  
  以下是我收集的php实现的采集小程序,自己测试可用php 文章采集,做采集很实用哦!
  <?php
//调用方法 :localhost/2.php?id=1 (自动采集1-8的列表)
header(&quot;Content-type:text/html;charset=utf-8&quot;);
$con =mysql_connect(&quot;localhost&quot;, &quot;root&quot;, &quot;huweishen.com&quot;) or die(&quot;数据库链接错误&quot;);
mysql_select_db(&quot;liuyan&quot;, $con);
mysql_query(&quot;set names &#39;utf8&#39;&quot;);
function preg_substr($start, $end, $str) // 正则截取函数
{
$temp = preg_split($start, $str);
$content = preg_split($end, $temp[1]);
return $content[0];
}
function str_substr($start, $end, $str) // 字符串截取函数
{
$temp = explode($start, $str, 2);
$content = explode($end, $temp[1], 2);
return $content[0];
}
// ---------------- 使用实例 ----------------

if($_GET[&#39;id&#39;]<=8&amp;&amp;$_GET[&#39;id&#39;]){
$id=$_GET[&#39;id&#39;];
$url = &quot;http://www.037c.com/New/list_5_$id.html&quot;; //目标站
$fp = fopen($url, &quot;r&quot;) or die(&quot;超时&quot;);
$fcontents = file_get_contents($url);
$pattern=&quot;/<\/span><a href=\&quot;(.*)\&quot; title=\&quot;(.*)\&quot; target=\&quot;_blank\&quot;>/iUs&quot;;//正则
preg_match_all($pattern, $fcontents, $arr);
//print_r($arr);
foreach($arr[1] as $k=>$url)
{
$title = iconv(&#39;GB2312&#39;, &#39;UTF-8&#39;, addslashes($arr[2][$k]));
// echo $title;
// echo $url;
$str = iconv(&quot;GB2312&quot;,&quot;UTF-8&quot;, file_get_contents($url));
$author = preg_substr(&quot;/作者:/&quot;, &quot;/<\//&quot;, $str); // 通过正则提取作者
$content = str_substr(&#39;<p class=&quot;wltg&quot;>&#39;, &#39;</p>&#39;, $str); //通过字符串提取标题
$sql = &quot;INSERT INTO `caiji` (`title`, `url` , `content`, `author` ) VALUES (&#39;$title&#39;, &#39;$url&#39; , &#39;$content&#39; , &#39;$author&#39;)&quot;;
// echo $sql.&quot;<br/>&quot;;
mysql_query($sql);
}
$id++;
echo &quot;正在采集URL数据列表$id...请稍后...&quot;;
echo &quot;<script>window.location=&#39;2.php?id=$id&#39;</script>&quot;;
}
else{
echo &quot;采集数据结束。&quot;;
}
?>
  
  其中 title 设置惟一php 文章采集,可以避免重复采集,很好的的一个php采集小程序,作者:风云无忌 查看全部
  
  以下是我收集的php实现的采集小程序,自己测试可用php 文章采集,做采集很实用哦!
  <?php
//调用方法 :localhost/2.php?id=1 (自动采集1-8的列表)
header(&quot;Content-type:text/html;charset=utf-8&quot;);
$con =mysql_connect(&quot;localhost&quot;, &quot;root&quot;, &quot;huweishen.com&quot;) or die(&quot;数据库链接错误&quot;);
mysql_select_db(&quot;liuyan&quot;, $con);
mysql_query(&quot;set names &#39;utf8&#39;&quot;);
function preg_substr($start, $end, $str) // 正则截取函数
{
$temp = preg_split($start, $str);
$content = preg_split($end, $temp[1]);
return $content[0];
}
function str_substr($start, $end, $str) // 字符串截取函数
{
$temp = explode($start, $str, 2);
$content = explode($end, $temp[1], 2);
return $content[0];
}
// ---------------- 使用实例 ----------------

if($_GET[&#39;id&#39;]<=8&amp;&amp;$_GET[&#39;id&#39;]){
$id=$_GET[&#39;id&#39;];
$url = &quot;http://www.037c.com/New/list_5_$id.html&quot;; //目标站
$fp = fopen($url, &quot;r&quot;) or die(&quot;超时&quot;);
$fcontents = file_get_contents($url);
$pattern=&quot;/<\/span><a href=\&quot;(.*)\&quot; title=\&quot;(.*)\&quot; target=\&quot;_blank\&quot;>/iUs&quot;;//正则
preg_match_all($pattern, $fcontents, $arr);
//print_r($arr);
foreach($arr[1] as $k=>$url)
{
$title = iconv(&#39;GB2312&#39;, &#39;UTF-8&#39;, addslashes($arr[2][$k]));
// echo $title;
// echo $url;
$str = iconv(&quot;GB2312&quot;,&quot;UTF-8&quot;, file_get_contents($url));
$author = preg_substr(&quot;/作者:/&quot;, &quot;/<\//&quot;, $str); // 通过正则提取作者
$content = str_substr(&#39;<p class=&quot;wltg&quot;>&#39;, &#39;</p>&#39;, $str); //通过字符串提取标题
$sql = &quot;INSERT INTO `caiji` (`title`, `url` , `content`, `author` ) VALUES (&#39;$title&#39;, &#39;$url&#39; , &#39;$content&#39; , &#39;$author&#39;)&quot;;
// echo $sql.&quot;<br/>&quot;;
mysql_query($sql);
}
$id++;
echo &quot;正在采集URL数据列表$id...请稍后...&quot;;
echo &quot;<script>window.location=&#39;2.php?id=$id&#39;</script>&quot;;
}
else{
echo &quot;采集数据结束。&quot;;
}
?>
  
  其中 title 设置惟一php 文章采集,可以避免重复采集,很好的的一个php采集小程序,作者:风云无忌

官方客服QQ群

微信人工客服

QQ人工客服


线