|
今年6月,烏鴉君曾寫過,反AI平臺Cara在短短一周時間里,用戶量就從4萬增至80萬,一躍成為美國社交應(yīng)用榜Top5,甚至超過了X、Reddit、Discord等。(詳見《9天用戶暴漲80萬,躋身美國社交APPTop5!這款反AI產(chǎn)品火了》) 今天,烏鴉君給大家講下另一個成功的反AI產(chǎn)品,GPTZero。 與Cara主打防止AI偷圖不同,GPTZero能夠準(zhǔn)確識別AI創(chuàng)作的內(nèi)容,進(jìn)而有效防止AI生成內(nèi)容的濫用。 隨著AI技術(shù)的滲透,GPTZero的客戶群體正在快速增長,用戶畫像已經(jīng)從單一的教師群體擴(kuò)展為,政府采購機(jī)構(gòu)、慈善機(jī)構(gòu)、招聘經(jīng)理、數(shù)據(jù)標(biāo)注員等。在過去6個月里,GPTZero的用戶規(guī)模從100萬增長到400萬,增長300%。 不僅用戶量越來越多,收入還蹭蹭漲。隨著用戶量的快速上漲,GPTZero的ARR(經(jīng)常性年收入)增長了500%,并已經(jīng)實(shí)現(xiàn)盈利。 / 01 / 越好懂越是AI GPTZero有打假絕招 這兩年,最先開始打假AI的是美國中學(xué)老師,他們從去年4月就開始了。 老師為什么要打擊AI呢?經(jīng)常寫家庭作業(yè)的朋友們就知道了,有軟件幫忙寫作業(yè)是多么爽。而無論是中國還是美國的孩子,都非常依賴借助AI來寫作業(yè),所以我國AI搜題工具(作業(yè)幫旗下Quetion.AI和字節(jié)旗下Gauth)出海成績優(yōu)異。這個現(xiàn)象在ChatGPT發(fā)布后變得更猖狂。 道高一尺魔高一丈,從去年開始就有一些聰明的老師想到,用AI來打敗AI。他們廣泛地使用一個叫做GPTZero的AI文本檢測工具。GPTZero公司也迅速與美國教師聯(lián)合會達(dá)成了協(xié)議。 有了這個工具,媽媽再也不用擔(dān)心AI幫孩子寫作業(yè)了。 AI最懂AI,作為一個反AI產(chǎn)品,GPTZero主打的是識別文本中的AI成分。老師們只需要在網(wǎng)頁上放上GPTZero,那么你在作業(yè)里放了任意GPT-4、Claude等大模型生成的文本內(nèi)容,都逃不過它的眼睛。 它還有相對精確的數(shù)據(jù),能算出小孩抄了多少,情節(jié)嚴(yán)重者當(dāng)然會引起老師的重視。 這樣的AI工具,對于慣用AI搜索的人群也有意義。AI搜索有時會引用純AI生成的文章,普通人有時很難辨別出AI生成的內(nèi)容,從而錯誤地引用。 比如用Perplexity搜索“谷歌前CEO Eric Schmidt的AI無人戰(zhàn)斗機(jī)”,谷歌引用一條信息來源(網(wǎng)頁中文章名為《谷歌前CEO Eric Schmidt正在研發(fā)軍用人工智能無人機(jī)》),其文章被檢測出AI成分達(dá)到了98%。 ▲用Perplexity搜索“谷歌前CEO Eric Schmidt的AI無人戰(zhàn)斗機(jī)”,Perplexity的回答出現(xiàn)了問題,P2為Perplexity引用的網(wǎng)址,該網(wǎng)頁刊登AI生成文章的網(wǎng)頁 為了更好地了解GPTZero打假AI的能力,烏鴉君將不同類型的內(nèi)容交給GPTZero識別。從結(jié)果來看,GPTZero基本能夠準(zhǔn)確分辨人或者AI創(chuàng)作的內(nèi)容。 比如,在我的提示下,GPT-4創(chuàng)作了小故事《西游記新編(一)》,GPTZero準(zhǔn)確地檢測出AI內(nèi)容(AI生成內(nèi)容占比100%)。另外,對于Claude和文心一言創(chuàng)作的內(nèi)容,GPTZero也能夠得出較準(zhǔn)確的結(jié)論。 而面對AI和人類共同創(chuàng)作的內(nèi)容,比如我和GPT-4共同撰寫的小故事《西游記新編(二)》,GPTZero識別的結(jié)果會相對偏離真實(shí)情況。 說起來,GPTZero的工作原理其實(shí)并不復(fù)雜,就是通過AI算法分析文本的復(fù)雜度和模式,從而判斷其可能的來源。 烏鴉君將其翻譯成下面這個秘訣,記住它,你也能變成一眼識AI: 越簡單的文字越可能是AI寫的,越難懂的文字越可能是人類寫的。 對比AI來說,人類寫出的東西的不難被理解,而且還會不自然。這有些逆反普通人的認(rèn)知了。當(dāng)GPTZero對一段文字的困惑越多,說明這篇文章越接近人類寫作的特征。 原因在于,AI生成的文本內(nèi)容,文字會更可能通順而自然,也更容易預(yù)測,不會給GPTZero造成理解障礙。而人類的寫作則不同,它往往會包含更具創(chuàng)意的詞語選擇,甚至偶爾還會出現(xiàn)拼寫錯誤等問題,會讓GPTZero萌生出多個問號。 還有一個識別AI的訣竅,就是人類寫作的節(jié)奏感,AI學(xué)不來。 文字的節(jié)奏感,指的是人們文字在表達(dá)過程中通過聲調(diào)、節(jié)奏、押韻等方式所形成的音樂感和流暢感。這東西AI根本學(xué)不會,AI比人類偏好書寫句子長度平均、結(jié)構(gòu)常規(guī)、風(fēng)格單調(diào)的東西。 說完了訣竅,我們看看GTPZero還有哪些功能。除了最核心的AI文本內(nèi)容檢測外,GTPZero還內(nèi)置了“人類寫作認(rèn)證”,這是他們基于專有寫作模式分析器推出的功能(認(rèn)證文檔確實(shí)由人類寫作,而非AI生成)。 GPTzero在去年1月走紅,最初的客戶是教師群體,宣稱自己可以幫忙檢測AI生成的學(xué)生作業(yè),到如今,GPTZero的客戶群體已經(jīng)從單一的教師群體擴(kuò)展為,政府采購機(jī)構(gòu)、慈善機(jī)構(gòu)、招聘經(jīng)理、數(shù)據(jù)標(biāo)注員等。 GPTZero將遠(yuǎn)期目標(biāo)定位于AI幻覺檢測。由于幻覺是生成式AI行業(yè)的難以根除的問題,這家公司預(yù)備推出基于LLM訓(xùn)練數(shù)據(jù)集的免費(fèi)AI文本版權(quán)檢查,幫助他們生成更廣泛的幻覺檢測訓(xùn)練數(shù)據(jù)。 / 02 / AI打假方興未艾 盤點(diǎn)五大AI打假工具 隨著AI生成創(chuàng)新工具集中爆發(fā),AI假圖假視頻盛行。 從去年開始,AI打假應(yīng)用發(fā)展迅猛,可檢測的類型涵蓋文字、圖片、視頻、音頻等內(nèi)容形態(tài),技術(shù)涉及分類器、水印和元數(shù)據(jù)等。 除了剛剛提過的文字檢測工具,在圖像檢測領(lǐng)域,也出現(xiàn)了許多檢測圖像的真實(shí)性、來源以及是否經(jīng)過篡改的反AI工具。比如通過分析圖像的像素特征、元數(shù)據(jù)、與已知數(shù)據(jù)庫的對比等方式來進(jìn)行判斷,例如AI or Not和Nuanced。 在聲音、音頻內(nèi)容檢測工具方面,有以下一些技術(shù)可以實(shí)現(xiàn),如基于音頻特征分析(細(xì)分為韻律特征、頻譜特征分析),還有利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型(細(xì)分為訓(xùn)練分類器、異常檢測)等。例如Project Mockingbird(聲音檢測)、AI-generated Detector(音樂檢測) 以下是一些烏鴉君認(rèn)為值得關(guān)注的AI檢測型工具: 1、多媒體內(nèi)容審核工具Hive AI,打擊電商虛假宣傳 AI生成時代,可能會讓虛假宣傳更加猖獗。就拿網(wǎng)購來說,如果大量商家使用AI生成式圖片,普通人可能會相信虛假的效果而去購買商品。商家有必要去克制AI假圖、假視頻在購物平臺上的含量。 Hive AI就是當(dāng)下較為全能的AI檢測工具,無論是文本、圖像還是視頻,都能幫助客戶識別AI內(nèi)容。通過將上傳的照片與在線文本材料、圖片、視頻庫進(jìn)行對比,找出AI生成的內(nèi)容。 Hive AI如今已經(jīng)有各種各樣的使用案例,主要應(yīng)用于社交和電子商務(wù)平臺,比如支付平臺Visa、網(wǎng)劇平臺Netflix、社交平臺Reddit。憑借在多個平臺進(jìn)行識別的優(yōu)勢,Hive AI在去年完成新一輪2億美元融資(但信息未公開)。 2、高端多媒體檢測工具AI or Not,已獲10萬用戶 AI or Not是面向新聞媒體、社交平臺、電子商務(wù)的多媒體檢測工具,和上述工具不同的是,它能提供詳細(xì)的分析報告。 具體來說,AI or Not可以分析文本內(nèi)容,識別是否由AI生成,如GPT-3或其他語言模型。圖片方面,它可以利用深度學(xué)習(xí)技術(shù)檢測圖像是否經(jīng)過AI生成或編輯,識別深偽(Deepfake)圖像,也就是說,它對AI圖像檢測的力度更大。 另外,它也可以分析視頻內(nèi)容,檢測是否經(jīng)過AI生成或修改,如Deepfake視頻。提供幀級別的分析,確保檢測結(jié)果的準(zhǔn)確性和細(xì)節(jié)。 目前月度收費(fèi)為個人版5美元/月,企業(yè)版250美元/月。該收費(fèi)工具目前已經(jīng)獲得了10萬用戶,看來國外比較愿意為這種社交內(nèi)容打假付費(fèi)。 ▲使用范例 3、監(jiān)控也要防范AI造假,Nuanced準(zhǔn)確率高達(dá)97% 相比上面主要面向深度仿真、藝術(shù)原創(chuàng)性的AI or Not,Nuanced更適用于超市監(jiān)控、貨物倉儲情況等對圖像質(zhì)量要求不高的低端場景。 Nuanced這個詞本身有“微妙的”“具有細(xì)微差別的”的意思。也就是說,Nauanced可以對一段監(jiān)控報告視頻進(jìn)行精細(xì)的檢測。具體來說,Nauanced不只是檢測人和貨物,還能辨別細(xì)微差別,例如面部表情、人們之間的互動以及環(huán)境背景。 另外,Nuanced實(shí)時高效處理大量圖像,適合在線和離線應(yīng)用。 4、預(yù)防電話詐騙,檢測工具Project Mockingbird準(zhǔn)確率達(dá)90% AI聲音的影響可能比我們想象中得更大,不法分子盯上老年人,利用AI生成的聲音進(jìn)行詐騙。央視網(wǎng)報道,去年11月,有騙子用AI生成的受害者親人的聲音詐騙,騙去40萬。 殺毒軟件McAfee公司推出聲音檢測工具Project Mockingbird,幫助用戶檢測、阻止AI生成的語音詐騙行為的項目。它基于由AI驅(qū)動的 “深度偽造” 音頻檢測技術(shù),在聆聽給定的語音之后,可檢測音頻是否為真人發(fā)音。 為了在視頻中精準(zhǔn)定位并識別可能由AI生成的音頻片段,Project Mockingbird還融合了 AI 驅(qū)動的上下文、行為和分類檢測模型。官方聲稱該工具成功率超過90%,目前還不向用戶收取額外費(fèi)用。 5、一分鐘掃5000首歌,幫助唱片平臺防止發(fā)布的AI音樂侵權(quán) AI生成的音樂一直伴隨著版權(quán)爭議,就連OpenAI都有暗示過GPT-4o生成的音樂可能會侵犯別的音樂的版權(quán)。 音樂發(fā)行商如何自我防范?現(xiàn)在已經(jīng)有專門檢測AI生成式音樂的工具——AI-Generated Detecto,這項工具一分鐘內(nèi)可以掃描5000首曲目!并保證準(zhǔn)確率高達(dá)98.5%。 這是巴黎蓬皮杜音樂技術(shù)研究中心IRCAM的IRCAM Amplify公司推出的識別AI生成音樂的工具,目標(biāo)客戶主要是唱片公司、出版商、版權(quán)管理組織和音樂流媒體平臺。 文/朗朗
|
|
|