php抓取网页数据插入数据库( 接到一个任务是把中国名牌网站的某些内容添加到我们的网站上)
优采云 发布时间: 2022-03-25 23:09php抓取网页数据插入数据库(
接到一个任务是把中国名牌网站的某些内容添加到我们的网站上)
frog 青蛙推荐:远程爬取网页到本地database.doc
接到任务将中国名牌网站的部分内容添加到我们的网站中,地址如下:本页有一些文章链接列表,点击链接会出现< @网站@文章的详细内容展示页面,根据这个规则,结合正则表达式、XMLHTTP技术、Jscript服务器端脚本、ADO技术,编写了一个小程序,将这些内容抓取到本地数据库. 抓起来比较方便,然后将数据库中的数据导入到数据库中。
接到任务,将中国名牌网站的部分内容添加到我们的网站中,地址如下:
此页面收录 文章 链接列表。点击链接会弹出文章的详细内容展示页面。根据这个规则,结合正则表达式、XMLHTTP技术、Jscript服务器脚本、ADO技术,我编写了一个小程序,将这些内容抓取到本地数据库中。抓起来比较方便,然后将数据库中的数据导入到数据库中。首先创建一个Access数据库,结构如下
ID
自动编号
ID,主键
旧*敏*感*词*
数字
旧数据编码
标题
标题
文本
内容
评论
内容
具体实现代码如下
下一步就是将Access数据库的内容导入到服务器数据库中,但是还有一些东西,就是原来的文章是分类的,所以导入的时候还得手动分类,因为链接被分析。写正则表达式的时候,写起来很麻烦,但还是严谨的。如果分类也用正则表达式来解析,那会很麻烦,因为分类收录在里面,而且那个页面有很多标签。如果要定位文本分类会很麻烦,而且即使写出来,程序也会失去灵活性,变得难以维护,所以这是它现在唯一做的一步。
发表于@2005-07-15 15:59 青蛙王子 浏览量(4581)评论(8)编辑