php登录抓取网页指定内容(php采集程序构建基本步骤:换行采集、远程获取--)
优采云 发布时间: 2022-02-15 13:17php登录抓取网页指定内容(php采集程序构建基本步骤:换行采集、远程获取--)
php采集程序构建的基本步骤:
采集程序是什么?获取远程数据(文字、图片、图片)并快速保存到本地或指定地址。
如天气预报(小偷程序):
远程访问——“替换内容——”显示给用户
如实时更新新闻(采集内容):
远程采集--》提取内容--》分类存储--》读取内容-》显示内容
************************
将 PHP采集 设计成 UML
常规清单:
终端正则表达式:
******************************
file_get_contents() 获取远程页面内容
preg_match_all() 匹配列表
preg_match() 匹配终端
preg_replace() : 过滤终端
******************************
创建一个新的列表文件:lb.php
回声 $con=file_get_cotents($_GET[url]);
$preg="##iUs";
pg_match_all($preg,$conn,$arr);
foreach($arr[1] as $id=>$v){
echo $v." "arr[2][$id]."
";
}
创建一个新的 vi。php获取标题
vi.php
$con=file_get_contents();
$preg="(.*)/iUs";//不区分大小写,防止贪婪匹配,防止换行
回声 zz($preg,$con);
函数 zz($preg,$con,$num=1){
preg_match($preg,$con,$arr);
返回 $arr[$num];
}
echo $arr[1];//获取标题
echo "".arr[2][$id]."
";
==========================================
php100:83:采集程序
磅.php
==================================================== === ==============
脚步:
1.新建数据库caiji,tep_url表,id,title,content,11,100,150
2.新建conn.php,插入语句可以通过phpmyadmin插入语句简单获取
3.新建一个vi.php