Cloudflare 宣佈推出新工具,以防止生成式 AI 系統竊取資訊。

宣佈「AI 獨立」,保護網絡內容

是咁的:上星期,微軟 AI 負責人表示,公開網絡上的內容係「免費軟件」,意味住呢間市值數萬億嘅公司可以隨便利用網絡上嘅所有內容嚟推動佢嘅高端產品。呢個失言引起巨大反響,促使網絡內容提供者重新考慮佢哋與微軟等公司嘅關係。呢啲 資料搜刮者 圖從內容創作者嘅辛勤工作中獲利,但卻幾乎冇回報。Cloudflare 為呢啲創作者提供咗一個重要嘅防禦武器。

提供全面保護

Cloudflare 係全球互聯網服務和托管公司,負責大約 20% 嘅網絡流量。Cloudflare 提供 DDoS 攻擊保護和網站機器人驗證等服務,佢通過龐大嘅服務器基礎設施為各類公司提供安全層,從而提升網絡嘅整體質量。

昨日,Cloudflare 宣佈將推出一項新功能,該功能將向所有用戶開放,甚至包括免費層嘅用戶。Cloudflare 喺其博客中呼籲用戶宣佈「AI 獨立」,佢嘅新系統允許用戶選擇阻止 AI 機器人和爬蟲等資料搜刮者 訪問網站,從而有效地防止微軟、Google、OpenAI 等公司免費竊取網絡內容。

用戶需求明確

經過用戶調查,Cloudflare 分享咗數據,顯示超過 80% 嘅用戶希望能夠阻止微軟竊取佢哋嘅內容。Cloudflare 表示:「我哋清楚聽到用戶唔希望 AI 機器人訪問佢哋嘅網站,特別係那些不誠實嘅機器人。」Cloudflare 繼續講:「為咗幫助用戶,我哋新增咗一鍵阻止所有 AI 機器人嘅功能。所有用戶,包括免費層用戶,都可以使用呢個功能。」

Generative AI 嘅挑戰

生成式 AI 訓練內容對於 Google 和微軟等公司來講變得越來越有價值。據報導,Google 為獲取 Reddit 嘅所有內容,用於訓練其模型,支付咗超過 6000 萬美元,結果導致 Google 搜索結果中出現大量嘲諷和惡搞內容。

我以前曾寫過,Google 和微軟應該建立一個健康、互利嘅關係,將人類創作者與其生成式 AI 努力結合起來。生成式 AI 無疑喺科技嘅未來中扮演某種角色,但公司仍然掙扎於如何為客戶提供具體價值。目前,生成式 AI 似乎最適合用於最基本嘅寫作任務,例如撰寫正式郵件或總結長篇文本。即便如此,AI 喺完成基本任務時仍存在問題,因為用戶需要檢查 AI 嘅輸出以避免「幻覺」錯誤。

財務與環保挑戰

運行 AI 非常昂貴。AI 查詢對 Google 嘅減排努力造成衝擊,我懷疑微軟嘅情況亦好唔到邊。即使唔考慮氣候影響,現時嘅商業模式似乎也唔可行。微軟免費提供 Copilot,但我唔明白點解我要為佢付費。

Google 和微軟選擇嘅一個簡單功能係搜索摘要。我哋喺 Windows Central 生成成千上萬嘅指南,而微軟 Copilot 現在會直接從文章中提取內容並重現,從而剝奪我哋嘅流量和收入。呢對我哋唔利,但對微軟和 Google 亦唔利。如果人類內容創作者無法有效地實現貨幣化並賺取生計,越來越多嘅互聯網內容將由 AI 生成。就像 JPEG 壓縮一樣,內容質量會隨著 AI 開始從其他 AI 而唔係人類創作者那裡學習而下降。由於 AI 並唔「理解」佢重現嘅內容,只能通過與人類內容進行比較來推斷上下文。呢種現象稱為模型崩潰,係嚴肅嘅 AI 科學家中嘅一個真實擔憂。但目前,Google、微軟等公司只關心搶先一步。

要使呢種技術真正普及,仍然需要人類干預。微軟 AI 負責人嘅「免費軟件」言論所引起嘅警報,加劇了持續嘅反彈。現在,Cloudflare 等公司正站出來幫助抵抗。唔使好耐,其他公司亦會跟進,而微軟可能不得唔面對其對內容盜竊嘅隨意態度。