js抓取网页内容(机器可读百度通过一个叫做Baiduspider的程序抓取上的网页)

优采云 发布时间: 2022-01-08 04:05

  js抓取网页内容(机器可读百度通过一个叫做Baiduspider的程序抓取上的网页)

<p>机器可读的百度通过一个名为Baiduspider的程序抓取互联网上的网页,对其进行处理,并将其构建到索引中。目前百度蜘蛛只能读取文本内容,暂时无法处理flash、图片等非文本内容。放在flash和图片中的文字百度无法识别。建议使用文字代替flash、图片、Javascript等显示重要内容或链接。搜索引擎暂时无法识别Flash、图片、Javascript中的内容,无法搜索到这部分内容;只有flash和Javascript收录网页链接,百度未必能收录。建议:使用文字代替flash、图形、Javascript等来显示重要的内容或链接。如果您必须使用 Flash 创建网页,建议同时为搜索引擎创建文本版收录,并在首页使用文本链接指向文本版。Ajax 和其他搜索引擎无法识别的技术只在需要用户交互的地方使用,而您希望搜索引擎“看到”的导航和文本内容不会放在 Ajax 中。如果不使用frame和iframe框架结构,通过iframe显示的内容可能会被百度丢弃。网站结构网站要有清晰的结构和清晰的导航,可以帮助用户快速从你的网站中找到他们需要的东西,帮助搜索引擎快速了解

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线