python抓取动态网页(利用Python方法来抓取某网站分享页面中的源码方法示例)

优采云 发布时间: 2022-01-10 23:03

  python抓取动态网页(利用Python方法来抓取某网站分享页面中的源码方法示例)

  这个文章是关于使用Python方法在一个网站分享页面中捕获源代码方法示例。需要注意的是,Python爬取分享页面的源码示例只有在运行时导入BeautifulSoup.py文件后才能使用。

  Python爬取分享页面源码示例需要使用python urllib2模块方法和BeautifulSoup模块。

  源码如下:

  

#coding:utf-8

import urllib2

from BeautifulSoup import BeautifulSoup

'''

www.iplaypy.com

'''

#define

def readPage(Url):

page = urllib2.urlopen(Url).read()

pageContent = BeautifulSoup(page)

OSC_Content = pageContent.find("div",{'id':'OSC_Content'})

preHandleCode = OSC_Content.find('pre').next

print preHandleCode

'''

页面的url需指定

'''

#call

readPage('http://www.xxxxxx.net/code/snippet_580365_11857')

  这里的目标网站已被隐藏。可以参考这个python源码根据你要抓取的目标站进行适当的修改。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线