最新版本:网页Meta信息检测

优采云 发布时间: 2022-10-13 01:20

  最新版本:网页Meta信息检测

  什么是元信息?

  

  简单来说,元信息就是在一些网页的页眉中用来标记网页属性的元素。站长和朋友在制作网站或发布文章时,他们经常考虑的meta主要包括网页的标题。,网页关键词(关键字)和网页摘要描述(描述)。

  网页标题一般不建议使用超过40个汉字。最常见的方式是使用“Title-网站Name”的形式,当然也有很多使用“Title-Column-网站Name”的形式,做的站长垃圾站喜欢在标题里剪很多长尾巴关键词(这个方法有优缺点,站长朋友可以自行权衡测试),关键词信息一般用英文逗号隔开,重要的关键词要写在前面,网页的描述要保持在150-200字左右。建议用一句话简单描述网页的性质。你可以在这句话中重复关键词 2~3次(个人经验,

  

  当然,关键词 信息似乎不像以前那么重要了。标题和描述对于搜索引擎来说是比较重要的,但无论如何最好仔细填写每一项。当然你也可以把关键词和描述留空,搜索引擎会根据网页内容自动判断拦截。

  文章采集调用 最新版本:  ajax

  最近在学习php爬虫,遇到一个困扰我很久的问题,

  我在抓取一个页面的信息(比如说a.php),这个页面只是一些基本的html框架,其他关键信息通过ajax请求返回(b.php),返回的是json,然后通过页面js将json解析并绘制到页面。问题的关键是ajax请求的信息中有一个手机号需要登录才能完整显示。

  方法一我试过:模拟登录后直接爬取页面(a.php),ajax不能跨域调用;

  

  方法二:使用模拟登录抓取json数据(b.php)获取(api.php)想要的手机信息还是不能完全显示。

  方法三:将ajax调用的页面(b.php)替换为本地地址(api.php),还是无法显示。

  是我的获取方法不对,还是根本抓不到这种数据,还是我方法中的关键参数不对?求大神指导!

  补充:可能我没有表达清楚,原来网站使用ajax请求b.php获取json数据,

  

  如果直接访问b.php,也可以直接获取:{"name":"zhangsan","age":"17","mobile":"135****6789"}这种json数据.

  问题是如果你没有登录,是手机:135****6789,而且登录后会显示在a.php中,但是如果你在登录状态下打开b.php,还是会不完整,(就是只会在a.php中显示。完成)

  而且我用上面提到的三种方法都不能得到完整的手机号,所以想问一下我的抓取方法是不是错了?有经验的人能否提供采集这类数据的方法?

  注意:我的模拟登录成功了,我也试过设置cookies、referer、agent,但是一个数字都显示不出来。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线