近期,ChatGPT概念席卷A股,截至2月10日,概念股中已有(yǒu)股票(piào)斬獲“7連闆”。
ChatGPT一經問世,便成為(wèi)輿論焦點,如今亦化身資本寵兒。但(dàn)關于ChatGPT本身仍然存在不少(shǎo)疑問,這究竟是一個(gè)怎樣的技(jì)術(shù)?在AI發展的曆史長河(hé)中,ChatGPT的誕生(shēng),究竟算(suàn)一個(gè)怎樣的事件?
近日,《每日經濟新聞》記者專訪了美亞柏科(SZ300188,股價15.21元,市值130.73億元)人(rén)工智能科學家(jiā)、AI研發中心總經理(lǐ)趙建強博士。趙建強畢業于西安交通(tōng)大(dà)學計(jì)算(suàn)機科學與技(jì)術(shù)專業,獲得(de)博士學位。多(duō)年來(lái),趙建強及其研發團隊在美亞柏科從事人(rén)工智能相關研究。
趙建強表示,2022年被業內(nèi)稱為(wèi)AI生(shēng)成的元年,ChatGPT是一個(gè)裏程碑式的産品。同時(shí),ChatGPT背後所依托的超大(dà)規模語言模型技(jì)術(shù)也将在各行(xíng)各業産生(shēng)深遠影(yǐng)響。
“除了OpenAI的GPT預訓練模型,實際上(shàng),谷歌(gē)、微軟、Meta、百度也有(yǒu)推出類似的模型,但(dàn)他們暫時(shí)沒有(yǒu)把這些(xiē)功能開(kāi)放成一個(gè)聊天機器(qì)人(rén)。”趙建強告訴記者。
是AI文本生(shēng)成領域的裏程碑
“在文本理(lǐ)解和(hé)智能問答(dá)技(jì)術(shù)方面,ChatGPT是一個(gè)裏程碑式的産品。”趙建強說。
記者注意到,ChatGPT之所以能夠火(huǒ)爆出圈,重要原因是其交流的流暢度和(hé)知識的豐富程度比之前的類似産品有(yǒu)很(hěn)大(dà)提高(gāo)。
“在業界,我們把2022年稱為(wèi)AI生(shēng)成的元年,不僅是ChatGPT,實際上(shàng)OpenAI還(hái)開(kāi)放了圖像生(shēng)成的一些(xiē)模型(DALL•E 2),隻是沒有(yǒu)像ChatGPT這麽熱。ChatGPT在AI生(shēng)成內(nèi)容方面或者AI創作(zuò)方面是一個(gè)裏程碑的節點,是比較有(yǒu)影(yǐng)響力的一個(gè)階段性成果。”趙建強認為(wèi)。
他介紹,ChatGPT的相關技(jì)術(shù)模型此前早已有(yǒu)之。“OpenAI之前就發布了ChatGPT的大(dà)語言模型。ChatGPT實際上(shàng)是基于GPT-3.5這個(gè)版本的超大(dà)規模自然語言預訓練模型,之前已經發布過GPT1.0、2.0和(hé)3.0版本,現在用的是GPT-3.5的版本。ChatGPT基于GPT模型,利用人(rén)類反饋強化學習訓練的方式,學習人(rén)類提問機器(qì)答(dá)、機器(qì)提問人(rén)類答(dá)等模式,不斷訓練叠代,以實現智能對話(huà)聊天功能。”
趙建強向記者解釋:“ChatGPT交流得(de)非常順暢,基本上(shàng)聊到的內(nèi)容都能回答(dá),這主要得(de)益于其具有(yǒu)的超大(dà)規模自然語言預訓練模型GPT3.5,模型在訓練時(shí)使用了海量人(rén)類在互聯網上(shàng)所編輯生(shēng)成的多(duō)種類文本數(shù)據集。OpenAI的官方介紹顯示,GPT訓練使用了超萬億級單詞量的數(shù)據。此外,模型的參數(shù)規模也非常大(dà),3.5版本的參數(shù)規模就達到了1750億。目前來(lái)看,可(kě)能隻有(yǒu)一些(xiē)AI超級巨頭才具備這樣的數(shù)據量和(hé)計(jì)算(suàn)能力。”
趙建強認為(wèi),由于具備了生(shēng)成能力,ChatGPT将會(huì)對很(hěn)多(duō)行(xíng)業産生(shēng)影(yǐng)響。
“以前我們理(lǐ)解的AI更多(duō)處在計(jì)算(suàn)智能和(hé)感知智能階段,比如圖像識别、人(rén)臉識别、文本觀點分析等。現在AI已經具備認知智能的能力,可(kě)以根據命令需求,創作(zuò)生(shēng)成各類文稿、文案,也可(kě)以通(tōng)過文本場(chǎng)景描述生(shēng)成圖像和(hé)視(shì)頻。所以說以後AI在內(nèi)容生(shēng)成創作(zuò)、文本生(shēng)成文本、文本生(shēng)成圖像、文本生(shēng)成視(shì)頻等方面,都具有(yǒu)廣闊的應用前景。ChatGPT解鎖了多(duō)樣化的文本內(nèi)容生(shēng)成能力,帶來(lái)AI創造世界更豐富的想象空(kōng)間(jiān),将會(huì)應用于文本理(lǐ)解、文本創作(zuò)、文案撰寫、知識推理(lǐ)、翻譯、智能客服、文本生(shēng)成圖像,代碼理(lǐ)解、審查和(hé)生(shēng)成等多(duō)個(gè)方向,具體(tǐ)跟一些(xiē)行(xíng)業應用結合起來(lái),将會(huì)産生(shēng)比較大(dà)的行(xíng)業影(yǐng)響。”趙建強表示。
利用大(dà)語言模型反詐騙
此前,美亞柏科在投資者互動平台上(shàng)表示:“公司從2020年開(kāi)始關注這類AI技(jì)術(shù)濫用與犯罪的行(xíng)為(wèi),研究對深度合成內(nèi)容的檢測識别和(hé)鑒定相關技(jì)術(shù),研發了針對視(shì)頻圖像僞造生(shēng)成檢測鑒定的産品,積極參與人(rén)工智能合成和(hé)生(shēng)成技(jì)術(shù)合規應用的行(xíng)業标準的制(zhì)定,協助執法部門(mén)維護網絡空(kōng)間(jiān)安全,規範人(rén)工智能技(jì)術(shù)的良性發展。”
趙建強所在的部門(mén)一直在從事AI方面的研究。“以ChatGPT為(wèi)代表的超大(dà)規模語言預訓練模型技(jì)術(shù)出現之後,大(dà)大(dà)推動了AI業務,特别是AI生(shēng)成內(nèi)容類業務落地的進程。”
美亞柏科的主要業務領域包括電(diàn)子數(shù)據取證、大(dà)數(shù)據智能化、網絡空(kōng)間(jiān)安全、智慧城市等。
“我們的做(zuò)法也類似,我們采用‘超大(dà)規模預訓練模型+下遊任務遷移’的技(jì)術(shù)思路,利用超大(dà)規模的語言預訓練模型,再結合具體(tǐ)的項目和(hé)數(shù)據,訓練形成具有(yǒu)行(xíng)業特色的應用模型。實際上(shàng),美亞柏科在自然語言處理(lǐ)、OCR、計(jì)算(suàn)機視(shì)覺以及人(rén)工智能安全這些(xiē)領域已經開(kāi)展了多(duō)年的業務實踐,基于在電(diàn)子數(shù)據取證和(hé)執法部門(mén)大(dà)數(shù)據智能化領域多(duō)年的深耕和(hé)知識經驗的積累,對行(xíng)業客戶數(shù)據特點和(hé)業務需求的深刻理(lǐ)解,提出了文本智能分析理(lǐ)解、不良多(duō)媒體(tǐ)文件分析、反詐騙信息鑒别、多(duō)模态信息檢索等多(duō)個(gè)獨有(yǒu)的核心算(suàn)法模型,并已經在打擊犯罪、社會(huì)治理(lǐ)、智慧城市建設等方面發揮了實戰價值。”趙建強稱。
比如在反詐騙領域,大(dà)語言模型的識别效果要遠超此前的識别模型。趙建強提到:“比如之前面對小(xiǎo)模型或者小(xiǎo)數(shù)據量的情況下,在文本的理(lǐ)解和(hé)識别上(shàng)所實現的效果不是很(hěn)理(lǐ)想,超大(dà)規模語言預訓練模型技(jì)術(shù)将有(yǒu)效推動這類業務落地。”
“通(tōng)過利用已有(yǒu)的大(dà)規模語言預訓練模型,結合詐騙場(chǎng)景下的語言特點,我們就可(kě)以去學習訓練相關的識别模型。詐騙通(tōng)常是通(tōng)過文本聊天交流,具有(yǒu)一定的語言特征,也就是詐騙話(huà)術(shù),在理(lǐ)解這些(xiē)話(huà)術(shù)之後,再去檢測識别。”趙建強說。
趙建強繼續解釋:“比如有(yǒu)些(xiē)受害人(rén)會(huì)被拉到一些(xiē)所謂的理(lǐ)财群裏,詐騙人(rén)員以推銷交流虛假理(lǐ)财投資産品的名義誘導受害人(rén)。我們就可(kě)以通(tōng)過訓練針對投資理(lǐ)财類聊天文本識别模型去鑒别,如果出現類似內(nèi)容就可(kě)以檢測出來(lái)。還(hái)有(yǒu)一類就是識别發現各種詐騙網站(zhàn),通(tōng)過對詐騙網站(zhàn)網址、頁面文本內(nèi)容、圖像內(nèi)容等的特征學習,訓練形成針對不同類别詐騙網站(zhàn)識别的模型,提升海量網站(zhàn)數(shù)據中打擊詐騙網站(zhàn)的能力。目前,我們已經把這些(xiē)技(jì)術(shù)和(hé)能力應用到了反詐預警當中。”
此外,有(yǒu)不少(shǎo)投資者也在投資者互動平台上(shàng)問及美亞柏科的相關業務。美亞柏科回複稱:“公司将ChatGPT的相關技(jì)術(shù)融合應用到産品售後支持部門(mén),基于取證産品知識庫,研發智能客服機器(qì)人(rén)系統,提升服務水(shuǐ)平。公司将在國家(jiā)相關法律法規許可(kě)的框架下持續關注、研究、利用ChatGPT等新技(jì)術(shù),并與公司大(dà)數(shù)據智能化、電(diàn)子數(shù)據取證等業務融合,積極參與相關行(xíng)業标準制(zhì)定,并适時(shí)布局新業務。”