斯坦福:35%的新網站由人工智能創建 - ForkLog:加密貨幣、人工智能、奇點、未來

ИИ AI искусственный интеллект artificial intelligence 2# 史丹佛:35% 新網站由人工智慧創建

到 2025 年中,約有 35% 的新網站是完全或部分由人工智慧創建的。這一結論來自史丹佛大學的研究人員

在 OpenAI 的 ChatGPT 於 2022 年 11 月正式推出之前,這一比例為零。在幾年的時間裡,人工智慧生成內容的比例已增長到網路上最後一部分出版物的三分之一以上

由人工智慧完全生成的網站比例(紅色),以及利用神經網絡創建的網站比例(紫色)。資料來源:GitHub 研究人員分析了來自 Wayback Machine 的 33 個月網站存檔副本,使用 Pangram v3 檢測器。目的是了解人工智慧文本的增長如何重塑全球網絡的結構

主要變化

研究人員發現語義多樣性降低。由神經網絡生成的頁面比人類撰寫的文本更相似,達到 33%。不同網站越來越多地用幾乎相同的短語重述相同的想法。

作者認為,這不僅僅是大量使用人工智慧進行的抄襲問題。問題更深層:表達方式和思想的多樣性逐漸縮小。大型語言模型(LLM)本質上選擇最“平均”的回答,從而重複模板化的話語

發布內容的情感色彩也發生了變化。人工智慧內容比人類內容更積極,達到 107%。在史丹佛,這與已被記錄的 LLM 傾向於阿諛奉承的特性相關

在訓練過程中,開發者優化神經網絡,使其產生令人愉快、安全且社會上可接受的回答。結果,許多新網站創建了一個“純淨友好”的信息環境。這裡較少激烈的評價和衝突,但也少了人類的活力辯論

未被證實的觀點

一些流行的擔憂未得到統計證明。研究人員未發現人工智慧內容增長與事實準確性下降、明顯錯誤增加或文本風格趨於一致之間的顯著相關性

左側:人工智慧內容與假設之間的相關性。右側:同意每個假設的美國成年人口比例。資料來源:GitHub。研究人員特別指出一個至今主要在理論上討論的效應——模型崩潰(model collapse)

如果用大量人工智慧內容訓練新神經網絡,系統會開始“吞噬”自己的平均回答。這會降低變異性,損害質量,並威脅未來 LLM 不再向人類學習,而是向“合成回聲”學習前輩的答案。

專家與 Internet Archive 一起計劃將此研究轉變為持續監測網路中人工智慧內容比例的系統

提醒一下,四月中旬,史丹佛大學指出人工智慧的發展速度已超前。研究人員表示,神經網絡在完成電腦任務方面幾乎已與人類持平。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆