馬斯克威脅要起訴微軟將Twitter數(shù)據(jù)訓練人工智能系統(tǒng)

馬斯克發(fā)推文說,“微軟公司非法使用推特的數(shù)據(jù)訓練人工智能系統(tǒng)。”
馬斯克日前表示要對微軟公司提起訴訟,這一威脅是在Mashable和其他媒體報道微軟公司將從其廣告平臺上刪除推特之后發(fā)出的,該平臺使廣告買家能夠在一個地方管理他們所有的社交媒體賬戶。
馬斯克也是特斯拉公司和SpaceX公司的CEO,他經常在推特上發(fā)布從未實現(xiàn)的計劃,似乎也沒有人對他提起訴訟。推特的新聞專線沒有對置評請求做出有意義的回應,微軟公司的代表也拒絕對此置評。
馬斯克發(fā)出威脅是最新的一個跡象,表明數(shù)據(jù)所有權正迅速成為生成式人工智能熱潮中一個令人擔憂的戰(zhàn)場。大型科技公司正在努力開發(fā)像OpenAI公司推出的GPT這樣的尖端人工智能模型,數(shù)據(jù)所有者正在尋求阻止它們或對其內容的使用收費。
微軟公司開發(fā)了自己的大型語言模型,并出售OpenAI公司的人工智能模型的使用權。微軟公司去年向OpenAI公司投資了100億美元,這是一筆不同尋常的結構化交易。馬斯克在2018年退出OpenAI公司董事會之前是該公司的聯(lián)合創(chuàng)始人,最近他抱怨OpenAI公司從非營利模式研究組織轉變?yōu)槭芪④浌居绊懙母邇r值業(yè)務部門。
像GPT這樣的大型語言模型需要TB級規(guī)模的訓練數(shù)據(jù),其中大部分是從Reddit、StackOverflow和Twitter等網站上抓取的。來自社交網絡的訓練數(shù)據(jù)很有價值,因為它捕捉到了非正式的對話。
隨著這些新的人工智能模型從研究實驗室和大學進入企業(yè)界,數(shù)據(jù)的所有者開始提出要求。
例如,Reddit公司在本周早些時候表示,將向訪問其編程界面的企業(yè)收費,該界面用于將Reddit用戶之間的對話輸入人工智能訓練軟件。環(huán)球音樂集團日前也表示,采用該公司藝人的音樂對人工智能系統(tǒng)進行這種訓練將既違反協(xié)議,也違反版權法,例如稱使用人工智能模仿說唱歌手Drake的歌曲視頻。
圖片庫GettyImages正在起訴Stable Diffusion,指控該公司復制其內容來訓練其人工智能圖像生成器。
馬斯克在去年12月表示,推特將暫停允許OpenAI公司對其數(shù)據(jù)庫的訪問。此外他還宣布,其成立的TruthGPT公司將構建自己的大型語言模型。

































