一鍵屏蔽惡意 AI 模型爬蟲機器人，Cloudflare 推出“防扒”網(wǎng)絡工具

2024/9/26 13:39:20 來源：IT之家作者：漾仔責編：漾仔

評論：

IT之家 9 月 26 日消息，網(wǎng)絡服務商 Cloudflare 本周推出一系列防 AI 爬蟲的工具，包括可查看 AI 爬蟲具體活動的 AI Audit 和一鍵屏蔽所有 AI 爬蟲的 Block AI Scrapers and Crawlers。站長們可以部署相關服務，從而防止自己網(wǎng)站的內(nèi)容被用于訓練 AI 的機器人爬蟲扒取。

IT之家注：爬蟲是一種自動化的程序，可以在互聯(lián)網(wǎng)上搜索和獲取信息，目前許多廠商使用相關爬蟲扒取各大網(wǎng)站信息用于訓練 AI 模型，相關爬蟲容易導致被扒網(wǎng)站產(chǎn)生大量異常流量，為此站長需支付高昂的網(wǎng)絡帶寬費用，同時也容易導致網(wǎng)站上大量原創(chuàng) / 隱私內(nèi)容泄露。

Cloudflare 推出的相關工具主要利用簽名比對、啟發(fā)式算法、機器學習和行為分析技術來辨別爬蟲，用戶可以查看 AI 爬蟲的各種行為，包括爬蟲類型、訪問頻率和掃描內(nèi)容，站長還可以按照需要放行“善意的 AI 機器人”抓取信息（此類“善意的 AI 機器人”主要尋找網(wǎng)站的 robots.txt 來獲取信息，通常不會對網(wǎng)站本身產(chǎn)生異常流量，也不會將網(wǎng)頁所有數(shù)據(jù)直接用于全盤訓練模型）。

一鍵屏蔽惡意 AI 模型爬蟲機器人，Cloudflare 推出“防扒”網(wǎng)絡工具

如果不確定如何處理這些 AI 爬蟲，站長們也可以使用 Block AI Scrapers and Crawlers 功能，一鍵屏蔽所有 AI 爬蟲。

一鍵屏蔽惡意 AI 模型爬蟲機器人，Cloudflare 推出“防扒”網(wǎng)絡工具

互聯(lián)網(wǎng)為許多大語言模型（如 OpenAI 的 GPT 模型和谷歌的 Bard）提供了大部分的訓練數(shù)據(jù)，如今許多廠商為了刷自家 AI 模型分數(shù)，大肆通過網(wǎng)絡爬蟲“拿來式”地獲取訓練數(shù)據(jù)，從而讓本應你情我愿的行為變得“污名化”，各大網(wǎng)絡商直接推出此類禁用 AI 爬蟲的服務也在意料之中。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

關鍵詞：cloudflare，AI 模型，網(wǎng)絡爬蟲

一鍵屏蔽惡意 AI 模型爬蟲機器人，Cloudflare 推出“防扒”網(wǎng)絡工具

相關文章

一鍵屏蔽惡意 AI 模型爬蟲機器人，Cloudflare 推出“防扒”網(wǎng)絡工具