如果互聯(lián)網(wǎng)上越來越多地充斥AI生成的內(nèi)容,就將可能成為AI公司自己的麻煩。
最近,關(guān)于AI污染網(wǎng)絡(luò)環(huán)境的消息多了起來。
前段時間,一篇名為《AI,正在瘋狂污染中文互聯(lián)網(wǎng)》的文章刷屏,文中有網(wǎng)友發(fā)現(xiàn)某平臺上一個AI賬戶,以極快的速度將未經(jīng)核實的信息輸出到中文互聯(lián)網(wǎng),并且誤導(dǎo)了Bing AI,以至于Bing給出了錯誤答案。
這不是孤例,而且不止國內(nèi),海外的情況也是如此。
美國生活雜志《國際生活》的主編Jennifer Stevens在第一次聽說ChatGPT后,她想知道這對她編輯的雜志意味著什么。
幾個月后,她萬萬沒想到,自己花了很多時間在篩選無用的文章。
據(jù)報道,包括Stevens在內(nèi)的很多在線新聞主編看到,人工智能生成了越來越多的質(zhì)量遠遠低于他們標(biāo)準(zhǔn)的內(nèi)容,他們認(rèn)為這是一種新型的垃圾信息。
生成式AI可以根據(jù)簡單的提示回答問題、生成圖像,甚至生成文章。其中一些技術(shù)還有望增強數(shù)據(jù)分析,消除單調(diào)的寫作任務(wù),就像計算器改變了數(shù)學(xué)一樣。
但最近的情況也顯示了生成式AI垃圾信息激增并可能在互聯(lián)網(wǎng)上蔓延的潛力。
5月初,新聞網(wǎng)站評級公司NewsGuard發(fā)現(xiàn)了49家使用AI生成內(nèi)容的假新聞網(wǎng)站。據(jù)該公司聯(lián)合創(chuàng)始人Gordon Crovitz說,截至6月底,這一數(shù)字已達到277個。
“這是指數(shù)級增長,”Crovitz說。
Crovitz曾擔(dān)任專欄作家和出版人,他說,這些網(wǎng)站的創(chuàng)建似乎是為了通過谷歌的在線廣告網(wǎng)絡(luò)賺錢。
研究人員還指出,人工智能技術(shù)有可能被用來制造政治虛假信息和用于黑客攻擊的有針對性的信息。
網(wǎng)絡(luò)安全公司Zscaler表示,現(xiàn)在斷定犯罪分子是否正在廣泛使用AI還為時過早,但該公司預(yù)計,AI將被用于創(chuàng)建高質(zhì)量的虛假網(wǎng)絡(luò)釣魚網(wǎng)頁,這些網(wǎng)頁旨在誘騙受害者下載惡意軟件或泄露他們的在線用戶名和密碼。
在YouTube上,ChatGPT淘金熱正如火如荼,數(shù)十個關(guān)于“如何靠生成式AI技術(shù)賺錢”的視頻觀看次數(shù)在十萬次以上,許多博主提出的建議疑似涉及垃圾內(nèi)容。一些博主告訴觀眾,他們每周可以賺數(shù)千美元,敦促他們寫電子書,或者創(chuàng)建AI運營的博客賬號,賬號內(nèi)容可以通過出現(xiàn)在谷歌搜索中來產(chǎn)生廣告收入。
OpenAI的一位發(fā)言人曾說,ChatGPT善于回答問題,但它偶爾會產(chǎn)生錯誤的答案。
“很多人認(rèn)為它(ChatGPT)是一個搜索引擎,但它不是。”
美國知名科幻電子雜志《克拉克世界》(Clarkesworld)的總編Neil Clarke說,今年早些時候,該雜志不得不暫時停止接受在線投稿,因為其被數(shù)百篇人工智能生成的故事給淹沒。
Clarke說,這些投稿是由在線視頻推動的,這些視頻建議使用ChatGPT給Clarkesworld投稿。
他說,他的雜志拒絕所有AI生成稿件,這些稿件很容易識別,它們“拼寫和語法都沒問題,但卻是一個完全不連貫的故事”。
“通常,它們從一個世界即將結(jié)束的大問題開始,1000個字后,這個問題就以某種方式結(jié)束了,沒有任何解釋。”
《國際生活》的Stevens則說:
“它們都是以一種相當(dāng)平淡和普通的方式寫成的,語法上都是正確的,只是覺得很公式化,對我們來說真的沒用。”
分析稱,如果互聯(lián)網(wǎng)上越來越多地充斥AI生成的內(nèi)容,就將可能成為AI公司自己的麻煩。
因為AI生成的內(nèi)容本身就存在不夠準(zhǔn)確的問題,AI模型獲得大量互聯(lián)網(wǎng)數(shù)據(jù),但卻無法很好地辨別信息的真實性和可信度,而如果ChatGPT這些大模型使用AI生成的內(nèi)容進行訓(xùn)練,模型就會變得不那么有用,這種現(xiàn)象被稱為“模型崩潰”。
不僅僅是垃圾內(nèi)容會導(dǎo)致模型崩潰,越來越多的人已經(jīng)在使用人工智能來生成整體內(nèi)容了。
上個月,洛桑聯(lián)邦理工學(xué)院的研究人員在網(wǎng)上聘請了自由撰稿人,對《新英格蘭醫(yī)學(xué)雜志》上發(fā)表的摘要進行總結(jié),結(jié)果發(fā)現(xiàn)其中超過三分之一的人使用了人工智能生成的內(nèi)容。
當(dāng)AI生成的內(nèi)容越來越多,未來想找到未被AI訓(xùn)練的數(shù)據(jù),將難上加難。
牛津大學(xué)應(yīng)用與理論機器學(xué)習(xí)小組的研究員Ilia Shumailov認(rèn)為,模型崩潰是不可避免的,但有一些潛在的技術(shù)解決方案可以解決這個問題。例如,能夠訪問真人生成內(nèi)容的公司,仍然能夠構(gòu)建高質(zhì)量的大型語言模型。
來源:華爾街見聞
紅商網(wǎng)優(yōu)質(zhì)內(nèi)容還將同步分發(fā)到公眾號、視頻號、頭條號、西瓜抖音、網(wǎng)易號、搜狐號、企鵝號、百家號、好看視頻、新浪微博等國內(nèi)主力流量平臺。