网站抓取：如何正确识别Baiduspider移动ua_网站运营教程-查字典教程网

摘要：近日，百度站长平台发布公告宣布新版Baiduspider移动ua上线，同时公布了PC版Baiduspiderua，那么该如何正确识别移动ua...

近日，百度站长平台发布公告宣布新版Baiduspider移动ua上线，同时公布了PC版Baiduspider ua，那么该如何正确识别移动ua呢?对此，百度站长平台技术专家孙权给出了答案。

新版移动ua:

Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +/search/spider.html)

PC ua:

Mozilla/5.0 (compatible; Baiduspider/2.0; +/search/spider.html)

之前通过“+/search/spider.html”进行识别的网站请注意!您需要修改识别方式，新的正确的识别Baiduspider移动ua的方法如下：

1. 通过关键词“Android”或者“Mobile”来进行识别，判断为移动访问或者抓取。

2. 通过关键词“Baiduspider/2.0”,判断为百度爬虫。

另外需要强调的是，对于robots封禁，如果封禁的agent是Baiduspider，会对PC和移动同时生效。即，无论是PC还是移动 Baiduspider，都不会对封禁对象进行抓取。之所以要强调这一点，是发现有些代码适配站点(同一个url，PC ua打开的时候是PC页，移动ua打开的时候是移动页)，想通过设置robots的agent封禁达到只让移动Baiduspider抓取的目的，但由于 PC和移动Baiduspider的agent都是Baiduspider,这种方法是非常不可取的。