网站内容更新机制有哪些?如何用python爬用户感兴趣?
优采云 发布时间: 2022-06-07 20:50网站内容更新机制有哪些?如何用python爬用户感兴趣?
网站内容更新机制?如果有点相关经验,可以写一些爬虫爬一些网站,抓取一些网站基础资料,然后建立一个分类表,每个表内容都是不同的资料(这个资料是会有交集的),写代码做分类比如“电影类”等。还有就是找一些比较优秀的文章可以反过来建立分类表,把网上一些比较好的文章拿过来。
可以用python+cookie做个referral
用爬虫爬用户感兴趣的东西,
请我的davidward大神来解答吧。哈哈。
你可以手工建议你朋友对一些影视tag进行爬取分类,然后写一个爬虫程序去爬。虽然可以去爬,但是受限因素多多,可能性会有点多。如果题主真的想尝试的话,你可以先试试用你朋友的感兴趣的东西去投递公司网站。
就像推销
爬虫,蜘蛛,最基本网页tag可以建立你的网站分类库。国内引擎,有各种公司提供各种网站的爬虫和标签。可以网上搜索就可以知道了。
个人观点,分享,seo只是针对网站的话,主要根据网站性质,目的去分析需要什么类型的文章,百度网页搜索,爱站,比较新的搜索引擎等等,然后去找。
先写一套基本的结构以下摘自虎嗅网
推荐你写个python爬虫
先拿到网站源代码,然后利用gzip压缩,
我们公司这种情况一般写成一个scrapy