什么是机器人?| 机器人定义

机器人是一种 Internet 运行软件程序,执行的是重复性任务。 虽然某些机器人流量来自于善意机器人,但恶意机器人会给网站或者应用程序带来巨大的负面影响。

学习目标

阅读本文后,您将能够:

  • 了解机器人的概念以及机器人的任务
  • 说明善意机器人与恶意机器人二者的区别
  • 了解如何阻止恶意机器人流量

复制文章链接

什么是机器人?

机器人(bot)是一种被编程完成特定任务的软件应用程序。机器人会根据自己的指令自动运行,无需每次由人类用户启动。机器人常常模仿或者代替人类用户的行为。机器人通常执行重复性任务,且速度比人类用户快得多。

机器人一般在网络上运行;超过半数的互联网流量是由机器人产生的,它们会扫描内容、与网页互动、与用户聊天或者寻找攻击目标。一些机器人是有用的,如为搜索内容创建索引的搜索引擎机器人,或是为用户提供帮助的客服机器人。一些机器人是“恶意的”,被编程侵入用户帐户、在 web 上扫描查找联系人信息以发送垃圾邮件,或者进行其他恶意活动。如果机器人连接到互联网,会有一个相关的的 IP 地址

机器人类型:

  • 聊天机器人:通过对某些短语进行编程响应来模拟人类对话的机器人
  • Web 爬网程序 (Googlebot):这种机器人会在整个互联网上扫描网页内容
  • 社交机器人:这种机器人在社交媒体平台上运行
  • 恶意机器人:这种机器人会抓取内容、传播垃圾邮件内容或者执行凭证填充攻击
机器人的各种类型

什么是恶意机器人活动?

任何违反网站所有者意图、网站服务条款或网站 Robots.txt 规则的机器人自动行为都可以被视为恶意行为。尝试实施身份窃取或者帐户盗用等网络犯罪的机器人也属于“恶意”机器人。虽然这些活动中的一些是违法行为,但有些机器人即使没有违反任何法律,也被认为是恶意的。

此外,过大的机器人流量会导致 web 服务器资源不堪重负,导致为尝试使用网站或者应用程序的合法人类用户提供的服务被拖慢或甚至中断。有时这是蓄意行为,表现为 DoS DDoS 攻击的形式。

恶意机器人活动包括:

为实施此类攻击并伪装攻击流量源,恶意机器人可能分布于僵尸网络中,这意味着机器人副本在多台设备上运行,而设备用户往往对此毫无所觉。因每台设备有自己的 IP 地址,故而僵尸网络流量由大量不同的 IP 地址产生,这使得识别恶意机器人流量源并加以阻止难上加难。

企业如何阻止恶意机器人活动?

机器人管理解决方案可通过机器学习的方式,将有害机器人活动与用户活动以及有益机器人活动区分开来。Cloudflare 机器人管理会在不影响用户体验或是不阻止善意机器人的情况下,对恶意行为加以阻断。机器人管理解决方案应能基于异常检测行为分析,识别并阻止恶意机器人,同时仍允许有益机器人访问 Web 属性。

要了解有关设置机器人防护的更多信息,请查看我们的开发人员文档