更新时间:2026-03-25 18:14:07
管理互联网中活跃的搜索引擎、信息抓取、网站监控等自动化程序流量。对网站业务开展有益的爬虫,可以一键放行。如果是信息比较敏感的网站,您也可以一键拦截这些爬虫。
主要分为以下6个类别:
| 公开Bots类别 | 说明 |
|---|---|
| 搜索引擎 | 通过自动化程序从互联网上抓取网页内容,并将其信息存储在搜索引擎的数据库中,为用户提供网页搜索服务。 |
| 网站监控 | 定期访问和监测网站可用性、性能和安全性的自动化程序。 |
| 市场分析 | 以市场分析为目的,收集和分析网页内容,帮助客户提高广告、资料等方面的可见性。 |
| 页面预览 | 快速提取并呈现目标页面的关键信息,以便后续处理或展示。 |
| 信息流汇聚 | 帮助用户跟踪和聚合各种信息流,通过自动化程序从不同来源获取最新的内容并进行自动更新和推送。 |
| 实用工具 | 能够给网站提供一些实用性帮助的自动化程序,比如对网站进行快照保存、分析并优化网站加载速度等。 |
您可对不同类别的公开Bots流量选择监控、拦截或放行。具体说明见下表:
| 动作 | 描述 |
|---|---|
| 不使用 | 不使用该策略进行流量检测,仍会流入其他检测模块。 |
| 监控 | 仅日志记录该类型的请求,会正常转发该请求。 |
| 拦截 | 阻断请求并响应403。 |
| 放行 | 记录请求并跳过后续所有Bot策略检测,但仍会进行其他保护,如WAF、API安全。 |
若已收录的机器人不再满足上述条件,将从公开Bots库中移除。以下是一些违反政策例子:
公开Bots库会定期收录主流搜索引擎SEO、市场分析、网站监控等机器人,并支持按类别处置。
若您有特殊需求,可联系客户技术服务申请新增特定机器人。建议申请时提供:机器人名称与用途、官方说明链接、User-Agent、来源IP/ASN范围及期望处置策略等信息。
| 公开Bots类别 | Bot名称 | 对应User-Agent关键字 |
|---|---|---|
| 网站监控 | SiteLock监控 | SiteLockSpider |
| Pingdom监控 | pingdom.com_bot | |
| Uptime监控 | uptimerobot | |
| Downnotifier监控 | downnotifier | |
| 搜索引擎 | Facebook爬虫 | www.facebook.com |
| Pinterest爬虫 | www.pinterest.com | |
| Ahrefs爬虫 | ahrefsbot | |
| Dataprovider爬虫 | Dataprovider | |
| Barkrowler爬虫 | Barkrowler | |
| Blex爬虫 | blexbot | |
| 谷歌爬虫 | Googlebot/ | |
| 谷歌爬虫-Image | Googlebot-Image | |
| 必应爬虫 | bingbot msnbot BingPreview |
|
| 百度爬虫 | baiduspider | |
| 搜狗爬虫 | Sogou web spider | |
| 有道爬虫 | youdaobot | |
| 雅虎爬虫 | Yahoo! Slurp/ | |
| Yandex爬虫 | YandexBot/ YandexImages/ |
|
| Istella爬虫 | istellabot | |
Yeti爬虫 |
Yeti/ |
|
| 苹果爬虫 | applebot | |
| Coccoc爬虫 | coccocbot | |
| Seznam爬虫 | SeznamBot | |
| Findx爬虫 | Findxbot | |
| 360爬虫 | 360Spider | |
| 字节爬虫 | Bytespider | |
| Qwant爬虫 | Qwantbot | |
| 易搜爬虫 | YisouSpider | |
| Mail.ru爬虫 | Mail.RU_Bot | |
| Mojeek爬虫 | MojeekBot | |
| Kakaotalk爬虫 | kakaotalk-scrap | |
| 市场分析 | Netvibes爬虫 | Netvibes |
| 谷歌爬虫-AdWords | AdsBot-Google Google-Ads Google-Adwords |
|
| 领英爬虫 | LinkedInBot | |
| Semrush爬虫 | SemrushBot | |
| SEOkicks爬虫 | SEOkicks | |
| AwarioRss爬虫 | AwarioRssBot | |
| 信息流聚合 | Trendiction爬虫 | trendictionbot |
| Archive.org爬虫 | archive.org_bot | |
| Blogtrottr | Blogtrottr | |
| Feeder | feeder.co | |
| ipip.net爬虫 | ipip.net | |
| 实用工具 | Google-Site-Verification爬虫 | Google-Site-Verification |
| Google-PageRenderer爬虫 | Google-PageRenderer | |
| Google Web Preview爬虫 | Google Web Preview | |
| Google-AMPCrawler爬虫 | Google-AMPCrawler | |
| Google-Docs爬虫 | Google-Docs | |
| Google-Page-Speed-Insights爬虫 | Google-Page-Speed-Insights | |
| Google-Read-Aloud爬虫 | Google-Read-Aloud | |
| 页面预览 | Zoom爬虫 | Zoombot/ |
| Telegram爬虫 | TelegramBot | |
| Twitter爬虫 | Twitterbot |