php 抓取网页标题(程序狗速度看过来!Python编程语言抓取新闻标题和链接的方法)

优采云 发布时间: 2022-03-17 18:01

  php 抓取网页标题(程序狗速度看过来!Python编程语言抓取新闻标题和链接的方法)

  这里是新鲜出炉的Python多线程编程,程序狗的速度来了!

  Python 编程语言 Python 是一种面向对象的、解释型的计算机编程语言,由 Guido van Rossum 于 1989 年底发明,并于 1991 年首次公开发布。 Python 语法简洁明了,具有丰富而强大的类库. 通常被称为胶水语言,它可以很容易地将用其他语言(尤其是 C/C++)制作的各种模块链接在一起。

  本文文章主要介绍Python中定时抓取新闻头条和链接的方法,结合具体实例分析Python定时匹配页面元素和文件编写的操作技巧。有需要的朋友可以参考以下

  本文的例子描述了Python中定时抓取新闻头条和链接的方法。分享给大家参考,详情如下:

  

#-*-coding:utf-8-*-

import re

from urllib import urlretrieve

from urllib import urlopen

#获取网页信息

doc = urlopen("http://www.itongji.cn/news/").read() #自己找的一个大数据的新闻网站

#抓取新闻标题和链接

def extract_title(info):

pat = '<a target=\"_blank\"(.*?)/a/h3'

title = re.findall(pat, info)

titles='\n'.join(title)

#print titles

#修改指定字符串

titles1=titles.replace('class="title"','title')

titles2=titles1.replace('>',':')

titles3=titles2.replace('href','url:')

titles4=titles3.replace('="/','"http://www.itongji.cn/')

#写入文件

save=open('xinwen.txt','w')

save.write(titles4)

save.close()

titles = extract_title(doc)

  希望这篇文章对大家Python编程有所帮助。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线