亞馬遜正在調查 Perplexity 涉嫌抓取網路內容的指控



亞馬遜官員表示,該公司的雲端部門正在調查人工智慧新創公司 Perplexity 未經批准從網站上刪除內容的指控。在此之前,多家媒體指責 Perplexity 非法挖掘內容。

據稱,Perplexity AI 正在繞過名為「機器人排除協定」的網路標準。根據《連線》 報道,該協議通常被稱為 robots.txt,網站透過該協議定義搜尋引擎、人工智慧和其他爬蟲可以存取哪些頁面。福布斯也指責這家人工智慧新創公司抄襲記者的作品。

另請閱讀:軟銀以 30 億美元的估值投資Google的 Perplexity AI 替代方案

對於使用 Amazon Web Services (AWS) 託管或伺服器的網站,必須遵守 robots.txt。儘管大多數網站都遵循該標準,但法律並未強迫任何人遵循協議。

據稱困惑違反了網路標準

亞馬遜發言人 Samantha Mayowa 週五表示,該公司正在評估有關 Perplexity 違反協議的資訊。一家新聞媒體《連線》指責 Perplexity 從禁止此類行為的新聞網站竊取內容。請務必記住,Perplexity 使用 AWS 來滿足其伺服器需求。

梅奧瓦在聲明中表示,

「[亞馬遜] 服務條款禁止濫用和非法活動,我們的客戶有責任執行這些條款,」資料來源: 美聯社

發言人表示,該公司經常收到來自各種來源的有關涉嫌不當行為的投訴。他還補充說,AWS 與客戶合作以了解報告的問題。

Perplexity AI 的代表 Sara Platnick 表示,該公司的機器人不會以違反 AWS 使用條款的方式存取網站。 《連線》本月稍早發布了一份調查報告,聲稱從其新聞網站提供了有關人工智慧模型 Perplexity 的頭條新聞以及有關特定主題的提示。結果顯示,故事經過了嚴格的釋義,其中包括《連線》雜誌的虛假聲明。

眾多出版品指責人工智慧獨角獸抓取內容

福布斯也對 Perplexity 提出了指控,稱其透過一項名為 Perplexity Pages 的新功能進行抄襲。該出版物聲稱,Perplexity 在其平台上策劃的頁面顯示的內容與彭博社和 CNBC 等媒體的原創貼文類似。

令人擔憂的是,Perplexity 因正確地將內容歸因於其創作者而贏得了聲譽。 《富比士》聲稱,這些獲得數千瀏覽量的貼文在文中並未提及原始出版商。他說,Perplexity 只將容易錯過的連結歸功於具有小徽標的創作者。

另請閱讀: OpenAI 和微軟起訴侵犯版權

美聯社還報導稱,Perplexity 編造了虛假引言,並將其歸咎於真人,這令人不安。 Perplexity 吸引了科技投資者的關注,最近估值達到 30 億美元。

該新創公司已從亞馬遜創辦人 Jeff Bezos、Meta 首席科學家 Yann LeCun 和 Google 首席科學家 Jeff Dean 等投資者籌集了超過 1 億美元。最近,日本軟銀也承諾向這家新創公司投資10至2000萬美元。

Perplexity 執行長 Aravind Srinivas 表示,《連線》雜誌提出的問題反映了對 Perplexity 如何開展業務的「深刻而根本的誤解」 。它表示,該出版物在內容抓取過程中找到的IP位址是由提供網路抓取和索引服務的第三方所經營的。


阿米爾謝赫 (Aamir Sheikh) 的《加密城》報道