首页时评财经科技企业公司快资讯商会文化艺术健康专题视频要闻新闻快讯

首页 > 财经 > 正文

ccbot蜘蛛是什么 CCbot蜘蛛你见过吗如何处理CCbot蜘蛛

2021-02-22 15:27:11
来源： A5用户投稿 MAY的SEO博客

不清楚您的网站日志中是否有出现过一个不太常见的CC蜘蛛，访问名称为：CCBot/2.0，下面我们具体来了解一下CCbot是什么蜘蛛?

一. CCbot是什么蜘蛛?

CCbot，全称为Common Crawl Bot，是一个非营利性基金会致力于提供可以被所有人访问和分析的Web爬网数据的开放存储库。

二. 你如何处理CCbot蜘蛛?

方法1. 使用robots.txt

使用robots.txt文件来允许或禁止蜘蛛访问页面的权限。robots.txt是放在网站根目录中，蜘蛛来访问时会先查找并查看robots.txt文件，并遵守robots协议来访问网站上的内容，允许访问则访问，不允许访问蜘蛛则离开。

①. 不允许任何蜘蛛访问您站点的任何部分

User-agent：*

Disallow：/

②. 允许任何蜘蛛访问您站点的任何部分

User-agent：*

Disallow：

③. 不允许CCbot蜘蛛访问网站的任何部分

User-agent：ccbot

Disallow：/

④. 允许CCbot蜘蛛访问您站点的任何部分

User-agent：ccbot

Disallow：

⑤. 允许CCbot蜘蛛访问您站点，但不允许CCbot访问“wp-admin”文件夹

User-agent：ccbot

Disallow：/wp-admin

方法2. 使用元标记

可以在页面中使用元标记来帮助控制搜索引擎蜘蛛对您网站的访问权限。如果您为所有页面使用模板，则可以在和之间添加元标记，它将适用于使用该模板的所有页面。如果要控制特定页面，可以在和之间的各个页面上添加元标记。

①. 允许所有蜘蛛访问您的页面

②. 允许所有蜘蛛访问您的网页并跟踪页面上的链接

③. 允许所有蜘蛛访问您的网页，但不允许他们跟踪链接

④. 不允许任何蜘蛛访问您的网页

⑤. 允许CCbot访问您的网页

⑥. 不允许CCbot访问您的页面

⑦. 允许CCbot访问您的页面并跟踪更多页面的链接

如果你在网站日志中也发现了CCbot，不要惊慌，你接下来需要做的就是是允许它继续爬行还是禁止爬行?May个人觉得这类蜘蛛没有多大的意义，一旦发现这类蜘蛛爬行比较频繁，最好的方式就是禁止这些蜘蛛继续访问我们的网站。

关键词： ccbot 蜘蛛

[责任编辑：]

为您推荐

奶茶渍很久了能洗掉吗怎么洗长时间干了的奶茶渍能洗掉吗

猛犸象属于什么动物？猛犸象生长繁殖情况猛犸象化石出土最多的是哪

磁铁矿的主要成分有哪些磁铁矿的用途及应用范围介绍

阳朔在哪里个城市哪个省？阳朔的江是什么江华南第一峰是什么在哪

珐琅锅的优缺点有哪些？珐琅锅保温效果怎么样用珐琅锅炖汤好喝吗

时评

警惕性格测试成为新型就业歧视切实保护劳动者合法权益

禁止直播带货有助于让医务人员回到看病救人的轨道上来

“一人购房全家帮”并没有“一日游” 这个创新性突破值得借鉴

“中专生逆袭大学讲台”犹如一面镜子带给我们多重启示

《红楼梦》入高考作文向社会发出一个强烈的信号：要重视经典阅读

热门文章

最新报道

快讯

内容举报联系邮箱：58 55 97 3 @qq.com

沪ICP备2022005074号-27 营业执照公示信息

Copyright © 2010-2020 看点时报版权所有，未经许可不得转载使用，违者必究。