OpenAI 著作權訴訟發酵,官方稱ChatGPT的訓練數據將接受檢查

分享

OpenAI 首次允許檢查其訓練數據,以回應作者群針對OPENAI 著作權訴訟的指控,這一事件可能對未來人工智慧的發展及著作權保護帶來重大影響。

OpenAI 著作權訴訟影響

根據9月24日的法庭文件,OpenAI 與一群知名作家,包括莎拉·席佛曼(Sarah Silverman)、保羅·崔布雷(Paul Tremblay)以及泰納西斯·科特斯(Ta-Nehisi Coates),達成協議,允許他們的代表進行數據檢查。這些作者指控 OpenAI 在未經授權的情況下,使用他們的作品來訓練其生成式 AI 模型 ChatGPT,這可能構成直接的著作權侵權行為。此次檢查協議的達成,標誌著訴訟進程的重要一步,未來結果可能為人工智慧訓練數據的合法性設定界限。

訴訟進度與法院裁決

今年7月,美國地方法院法官阿賽利·馬丁尼茲-奧爾金(Araceli Martínez-Olguín)駁回了有關不公平商業行為、疏忽和非法獲利的指控,但保留了對 OpenAI 的直接著作權侵權指控。原告的指控集中於 OpenAI 透過網路影子圖書館非法下載數十萬本書,並利用這些書籍作為 AI 訓練數據的基礎,導致 ChatGPT 生成了侵權內容,如書籍摘要和深入的主題分析。

- 廣告 - 內文未完請往下捲動 -

作家與OPENAI 將檢查訓練數據

根據雙方達成的協議,檢查過程將在 OpenAI 位於舊金山的辦公室內進行,並採取嚴密的安全措施。檢查人員不得攜帶任何錄音設備或網路設備進入檢查室,只能使用 OpenAI 提供的有限電腦來做筆記,這些筆記將在每日結束時由 OpenAI 代表監督並拷貝到另一設備中。此外,檢查人員需簽署保密協議,並記錄訪客資料。這些規定確保了訓練數據的保密性,同時也避免了資料外洩的風險。

AI公司的反駁與公平使用的辯護

在此類訴訟中,AI 公司往往否認直接複製作品,而是主張其模型的訓練依賴於建立參數框架,該框架基於這些作品來界定內容的結構和語義。

因此,OpenAI 可能會在未來的法庭辯論中提出「公平使用」的辯護,聲稱其行為是合法的「轉化性使用」。該辯護理論強調,若使用被視為對原著進行了明顯轉化,則即使未經授權也可能被允許。

出版商針對著作權的反應

儘管 OpenAI 在去年停止了披露其訓練數據的具體內容,以保持競爭優勢並降低法律風險,但其使用版權作品的指控仍無法避免。與此同時,OpenAI 與多家大型出版商達成了協議,例如 Axel Springer、Condé Nast 和美聯社,試圖通過授權方式合法使用其資料。

這些協議表面上看似矛盾,因為 OpenAI 似乎已經利用這些出版物來訓練其模型,但仍然願意支付費用。這或許與 OpenAI 試圖透過這些協議減少法律風險有關,尤其是在像《紐約時報》這樣的大型出版商已經提起訴訟的情況下,這些協議可視為一種和解方式,避免進一步的法律糾紛。

著作權法與未來挑戰

OpenAI 的訴訟案只是人工智慧和版權問題的冰山一角。隨著更多作者和出版商提出訴訟,這些案件可能會對整個 AI 行業產生深遠影響。例如,《紐約時報》已針對 OpenAI 提起訴訟,聲稱該公司未經授權使用其作品進行訓練,並試圖通過 ChatGPT 直接與《紐約時報》競爭。如果法院最終支持《紐約時報》的主張,OpenAI 可能面臨數十億美元的損害賠償。

同樣,這些訴訟結果還可能導致對於人工智慧訓練數據的規則進行重大改革。如果 OpenAI 被認定違法,未來 AI 公司將不得不支付更高昂且規模更大的授權費用來合法使用這些訓練數據,這可能會擠壓小型 AI 公司的生存空間,使市場進一步集中於大型科技巨頭,如 Google、Microsoft 和 Meta。

更多相關新聞報導
超級智慧人工智能即將降臨?AI的未來是福還是禍?
美國AI技術革命!OpenAI執行長推動百億美元AI基礎建設計劃

推薦閱讀

你可能也喜歡

其他人都在看