什麼是傀儡程式管理?|傀儡程式管理員如何運作

傀儡程式管理涉及識別和封鎖來自網站或應用程式的某些傀儡程式,同時仍允許存取其他傀儡程式。

Share facebook icon linkedin icon twitter icon email icon

傀儡程式管理

學習目標

閱讀本文後,您將能夠:

  • 理解傀儡程式進行的事項,以及有必要管理的原因
  • 瞭解傀儡程式管理員產品進行的事項
  • 探索傀儡程式應受到允許或封鎖的原因

什麼是傀儡程式管理?

傀儡程式管理意指封鎖不必要或惡意的網際網路傀儡程式流量,同時仍允許實用的傀儡程式存取 Web 資產。傀儡程式管理達成這個目標的方式是偵測傀儡程式活動、辨別有需要和不必要的傀儡程式行為,以及識別不必要活動的來源。

傀儡程式管理是必要事項,因為如果沒有檢查傀儡程式,會對 Web 資產造成大量問題。太多的傀儡程式流量會對網頁伺服器造成繁重的負載、拖慢或拒絕對合法使用者提供的服務 (有時候這會採用 DDoS 攻擊的形式)。惡意傀儡程式可從網站消除或下載內容、竊取使用者認證、迅速擴散垃圾內容並執行其他各種網路攻擊。

傀儡程式管理員進行哪些事項?

傀儡程式管理員意指任何管理傀儡程式的軟體產品。傀儡程式管理員應能夠封鎖某些傀儡程式並允許其他傀儡程式通過,而非只是封鎖所有非人為的流量。例如,若所有傀儡程式受到封鎖,而 Google 傀儡程式無法將頁面編入索引,則該頁面就無法顯示在 Google 搜尋結果中,造成前往網站的有機流量大幅減少。

良好的傀儡程式管理員可達成下列目標。這可以:

  • 識別傀儡程式與人類訪客
  • 識別傀儡程式信譽
  • 根據 IP 聲譽識別傀儡程式來源 IP 位址並封鎖
  • 分析傀儡程式行為
  • 將「良好」傀儡程式新增至白名單
  • 透過 CAPTCHA 測試、JavaScript 插入或其他方法挑戰可能的傀儡程式
  • 對可能過度使用服務的傀儡程式進行限速
  • 拒絕「惡意」傀儡程式存取特定內容或資源
  • 對傀儡程式提供替代內容

什麼是傀儡程式?

傀儡程式是在網路上作業的電腦程式。傀儡程式經過程式化,會自動進行特定動作。通常傀儡程式執行的任務相單簡單,但傀儡程式會透過比人類快上許多的速度一再進行。

例如,Google 使用傀儡程式持續爬梳網頁並將內容編入索引以供搜尋。這需要人類團隊耗費大量時間檢閱散佈在網際網路各處的內容,但 Google 的傀儡程式則能夠將 Google 的搜尋索引保持最新狀態。

就負面例子而言,垃圾郵件發信者會使用取得傀儡程式的電子郵件,以收集來自網際網路各處的電子郵件地址。傀儡程式會爬梳網頁,尋找遵循電子郵件地址格式的任何文字 (文字 + @ 符號 + 網域),並將該文字儲存到資料庫。一般而言,人類可以透過電子郵件地址查看網頁,但因為這些取得傀儡程式的電子郵件經過自動化,只會查看適合特定參數的文字,所以在尋找電子郵件地址時的速度會呈指數型增長。

與人類使用者存取網際網路不同,傀儡程式通常不會透過 Google Chrome 或 Mozilla Firefox 等傳統網頁瀏覽器存取網際網路。傀儡程式不會操作滑鼠 (或智慧型手機) 和點選瀏覽器中的視覺內容,而只是進行 HTTP 請求 (在其他活動當中) 的軟體程式,通常使用所謂的「無頭瀏覽器」。

傀儡程式進行哪些事項?

傀儡程式基本上可以進行任何重複性、無創意性質的任務,亦即任何可以自動化的事項。傀儡程式可與網頁互動、填寫並提交表單、點選連結、掃描 (或「爬梳」) 文字並下載內容。傀儡程式可以「觀看」影片、發佈留言和貼文等,或是在社群媒體平台上重複推文。有些傀儡程式甚至可以與人類使用者進行基本對話,這稱為聊天機器人。

良好傀儡程式與惡意傀儡程式之間有什麼差異?

驚人的是,許多資訊來源估計,在所有網際網路流量當中,大約有一半是傀儡程式流量。其中有一些 (並非全部) 軟體是惡意程式碼,有些傀儡程式是惡意,而有些是「良好」。

任何不當使用線上產品或服務的傀儡程式可視為「惡意」。惡意傀儡程式的範圍包括公然惡意,例如嘗試入侵使用者帳戶的傀儡程式,也包括較溫和的資源誤用形式,例如在活動網站上大量購買票券的傀儡程式。

執行所需或實用服務的傀儡程式可以視為「良好」。客服聊天機器人、搜尋引擎網路爬蟲以及效能監控傀儡程式都是良好傀儡程式的例子。良好傀儡程式通常會尋找並遵守網站 robots.txt 檔案中概述的規則。

什麼是 robots.txt 檔案?

Robots.txt 是網頁伺服器上的檔案,大致說明傀儡程式存取伺服器內容的規則。不過,檔案本身不執行這些規則。基本上,任何設計傀儡程式的人都應該遵守榮譽制度,並確認他們的傀儡程式先檢查網站的 robots.txt 檔案,再存取網站。當然,惡意傀儡程式通常不會遵守這套制度,因此需要進行傀儡程式管理。

傀儡程式管理如何運作?

若要識別傀儡程式,傀儡程式管理員可使用 JavaScript 挑戰 (這判定是否正在使用傳統網頁瀏覽器) 或 CAPTCHA 挑戰。他們也能透過行為分析 (亦即比較使用者的行為與過去使用者的標準行為) 判定哪些使用者是人類,哪些是傀儡程式。傀儡程式管理員必須大量收集高品質的行為資料以供檢查,才能進行行為分析。

若判定傀儡程式是惡意程式,則可以重新導向至不同的頁面或封鎖存取網頁資源。

良好傀儡程式可新增至白名單,或受允許的傀儡程式清單 (相反者為黑名單)。傀儡程式管理員也能透過進一步的行為分析來辨識良好和惡意的傀儡程式。

另一個傀儡程式管理方法是使用 robots.txt 檔案設定網路誘捕系統。網路誘捕系統是一種供惡意執行者使用的虛假目標,當網路誘捕系統遭到存取時,就會顯露出惡意執行者的惡意性質。就傀儡程式而言,網路誘捕系統可以是透過 robots.txt 檔案受到傀儡程式禁止的網站網頁。良好的傀儡程式將會讀取 robots.txt 檔案並避開該網頁;有些惡意傀儡程式則會爬梳該網頁。藉由追蹤存取網路誘捕系統的傀儡程式的 IP 位址,可識別並封鎖惡意傀儡程式。

傀儡程式管理可緩解哪些種類的傀儡程式攻擊?

傀儡程式管理解決方案可協助阻止各種攻擊:

這些其他傀儡程式活動不一定會被視為「惡意」,但傀儡程式管理員應能夠予以緩解,無論是下列何種情況:

  • 庫存囤積
  • 在社交論壇或平台上自動發佈
  • 購物車填充

Cloudflare 如何管理傀儡程式?

Cloudflare 具有獨特的能力,可從每天透過其網路進行的數十億個請求中收集資料。藉由此資料,Cloudflare 能夠透過機器學習和行為分析,識別可能的傀儡程式活動,並且能夠提供必要資料,用來建立良好傀儡程式的有效白名單或惡意傀儡程式的黑名單。Cloudflare 也具有範圍廣泛的 IP 信譽資料庫。進一步瞭解 Cloudflare 傀儡程式管理。