屏蔽百度蜘蛛或某一爬虫的四种方法

汇聚分享 5年前 (2019-12-17) HTML 4285人围观 1408字抢沙发百度未收录

在企业网站站群中有的时候不免有电话号码，今天看到一些云发布平台，通过css中放置的JS转码电话号码，从而屏蔽蜘蛛抓取。

我个人用的方法是通过Unicode编码转换手机号码。

下面分享四种屏蔽百度蜘蛛的方法：

1、robots.txt屏蔽百度或某一爬虫抓取

打开robots.txt，在开头加入如下语句（以百度蜘蛛为例）：

Markup

User-agent:baiduspider
Disallow:/

代码分析，首先要知道该爬虫的名称，如百度爬虫是Baiduspider，Google爬虫是Googlebot，360搜索爬虫是360Spider，你可以通过各大搜索引擎蜘蛛爬虫UA汇总来获取爬虫的名称，例如，微软必应的蜘蛛UA是：

Markup

"Mozilla/5.0(compatible;bingbot/2.0;+http://www.bing.com/bingbot.htm)"

我们就可以知道它的爬虫名称为bingbot。

2、robotsMeta标签屏蔽百度或某一爬虫抓取

如果是针对某一个页面屏蔽百度蜘蛛或某一爬虫抓取，那么可以通过Meta标签来实现。代码如下：

Markup

<head>…
<metaname="robots"content="noindex,nofollow"/>
</head>

这是屏蔽所有蜘蛛爬虫抓取该页面的写法，如果只屏蔽某个爬虫，可以把"robots"改为特定的爬虫名称，爬虫名称可以通过上面方法1中提及的办法获得。例如想只屏蔽微软必应的蜘蛛抓取该页，则可以写成：

Markup

<head>…
<metaname="bingbot"content="noindex,nofollow"/>
</head>

3、.htaccess屏蔽百度或某一爬虫抓取

一些可恶的爬虫并不遵循robots规则，那么我们还可以通过.htaccess来屏蔽它，代码如下（以百度蜘蛛为例）：

Markup

RewriteEngineon
RewriteCond%{HTTP_USER_AGENT}^.*Baiduspider.*[NC]
RewriteRule.*-[F]

如果是Apache服务器，可以修改配置文件httpd.conf，这样写(/var/www/html是根目录)：

Markup

<Directory"/var/www/html">
...
SetEnvIfNoCaseUser-Agent^.*Baiduspider.*bad_bot
OrderAllow,Deny
Allowfromall
Denyfromenv=bad_bot
...
</Directory>

如果是Nginx服务器，可以修改配置文件(默认是nginx.conf)，这样写：

Markup

Server{
...
location/{
if($http_user_agent!~Baiduspider){
return403;
}
}
...
}

4、通过IP屏蔽百度或某一爬虫抓取

我们还可以通过分析日志，获得爬虫的IP地址，然后从服务器防火墙屏蔽该IP，不过爬虫通常有很多IP，我们可以屏蔽爬虫的IP段。

不过此方法没有前面几个方法实用，较少人这样操作。

本站文章除注明转载/出处外，均为本站原创或翻译。若要转载请务必注明出处，尊重他人劳动成果共创和谐网络环境。

转载请注明 : 文章转载自深山的鹿屏蔽百度蜘蛛或某一爬虫的四种方法

本文标题：《屏蔽百度蜘蛛或某一爬虫的四种方法》

本文链接：http://www.noteet.com/656.html

上一篇 : 颓废：饮食不规律的单人生活

下一篇 : 转载：刘静尧就是刘强东生命中的那场“大雨”

评论列表暂无评论

发表评论

« 2025年4月 »
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Andree - 山花终将灿烂
July - 写在风中的信
等风来 - 请记住我
July - Where memory had stopped
弹棉花的小花 - 最美的瞬间
乔浚丞 - 泥巴
AWOLNATION - Sail
Sleep Dealer - Hidden Path
曲婉婷 - 最好的安排
杨乃文 - 推开世界的门
やまだ豊 - 柔和的光（やわらかな光）
痛仰乐队 - 无法离地的飞行
陆锦花 - 声声慢（评弹）
孙小雅 - 觉悟
王小帅 - 觉悟 (戏腔版)
林志炫 - 凤凰花开的路口
邵帅 - 写给黄淮（Live）
刘烨溦 - 不如回家喝自来水
王小草 - 下个路口见
隔壁老樊 - 我曾
王琪 - 送亲
吉田亚纪子 - 泪的告白（ありがとう）
河东男人味 - 我也常常问自己
陈粒 - 历历万乡
告五人 - 唯一
你的心河 - River Flows in You
叶倩文 - 兰花草
一支榴莲 - 海底
周深 - 大鱼
CMJ - 所念皆星河
三亩地 - 城南花已开
Martin Arteta - Past Lives
李健 - 贝加尔湖畔
满江 - 归来
邵帅 - 你是人间四月天
林子祥 - 谁能明白我
Soft Night - Play dat $tick
YSF - Hurt Me
高夫 - 大雨还在下
陈一发 - 童话镇
黄艺明 - 我们的天空
梁博 - 表态(live)
老王乐队 - 我还年轻
Lindsey Stirling - Senbonzakura
Bad Style - Time Back
Simply Three - Counting Stars
Ennio Morricone - Per Qualche Dollaro In Piu
none - 清新的小女孩
孙露 - 思念谁
Maria Cordero - 友谊之光
郑伊健 - 友情岁月
音阙诗听、赵方婧 - 芒种
苏打绿 - 无与伦比的美丽
G.E.M.邓紫棋 - 画
刘珂矣 - 半壶纱
Rauf & Faik - колыбельная（爱恋）
王力宏、谭维维 - 缘分一道桥
丫蛋蛋、崔铭嘉 - 口是心非
许巍 - 像风一样自由
L4WUDU - Love song (Live)
Kungfu-Pen - 跳跳蛙2.0
福克斯 - 庆功酒
Thomas Greenberg - The Right Path
杨和苏KeyNG - 兔八哥 (Live)
杨千嬅 - 野孩子
艾热 - 乌云中
JelloRio李佳隆、艾热 - 星球坠落
潘玮柏、G.E.M.邓紫棋、艾热 - 攀登 (Live)
程雷 - 欢喜就好
王琪 - 可可托海的牧羊人
焦迈奇 - 我的名字
凤飞飞 - 追梦人
李佳薇 - 煎熬
Kim Taylor - I Am You
王小帅 - 最近
痛仰乐队 - 再见杰克
江映东 - In the eyes
茄子蛋 - 浪子回头
痛仰乐队 - 公路之歌
Tommee Profitt - In the End
阿冷 - 春风吹
Cover高橋優 - 起风了
李荣浩、ICE - 王牌冤家 (Live)
那吾克热 - 四季 (Live)
那吾克热 - 漂 Part II (Live)
尤长靖、那吾克热 - 飘向北方 (Live)
GAI - 虎山行
广东雨神 - 广东爱情故事
苏立生 - 流着泪说分手
陈鸿宇 - 理想三旬
纵贯线 - 再见
AUM - FLY
毛不易 - 如有有一天我会变得很有钱
MKJ - Time
燕池 - 从前慢
许巍 - 蓝莲花
王若琳 - 一生守候
Haya乐团 - 迁徙
陈粒 - 易燃易爆炸
jam - 七月上
who - 天空之城
矶村由纪子 - 风居住的街道
Various Artists; - 微笑的弧度
赵小磊 - 时间
五月天 - 温柔
陈升 - 把悲伤留给自己
方磊 - 依兰爱情故事
庾澄庆 - 想念你
宋冬野 - 安和桥北
枫桥 - 我在等你

山花终将灿烂 - Andree

0:00

词

屏蔽百度蜘蛛或某一爬虫的四种方法

归一

3007

1319

7215904

屏蔽百度蜘蛛或某一爬虫的四种方法

归一

3007

1319

7215904

User Login

帐号或密码错误,请重试.