您的位置:首頁 >綜合 > 財經(jīng)要聞 >

觀點:龍頭三天兩板!ChatGPT是如何獲得理解力的?前景又如何

能夠“理解”輸入信息的含義并輸出內(nèi)容,這類AI模型,在一定程度上擁有和人腦同樣的能力——創(chuàng)造力。

近期大火的AIGC(AI-generated content)和ChatGPT都屬于這類模型,即生成式AI。從廣義上看,ChatGPT是文字模態(tài)的AIGC應用,負責生成自然語言,能夠和使用者進行問答式對話。


(相關資料圖)

其他形式還包括AI寫詩、AI作曲、AI繪畫、AI換臉……甚至有人認為,游戲中導入圖片生成模型的“捏臉系統(tǒng)”都是AIGC。相關熱門應用也層出不窮,包括Stable Diffusion、QQ小世界AI畫匠/異次元的我、盜夢師、玩句等。

其中,ChatGPT被稱為AI里程碑式應用,它是明星公司Open AI在2020年推出的自然語言生成式模型——GPT 3的衍生產(chǎn)品。此前也不是沒有這類應用,AI客服、聊天機器人、語音工作助手、小說衍生器等都屬于此類。

ChatGPT的智能化遠遠超出了這些“前輩”。與此前的模型相比,ChatGPT亮點主要包括:

(1)新增代碼理解和生成能力,對輸入的理解能力和包容度高,能在絕大部分知識領域給出專業(yè)回答。

(2)加入道德原則。即ChatGPT能夠識別惡意信息,識別后拒絕給出有效回答。

(3)支持連續(xù)對話。ChatGPT具有記憶能力,提高了模型的交互體驗。

上線5天,ChatGPT的用戶突破100萬。連特斯拉創(chuàng)始人馬斯克也稱:“許多人陷入了該死的瘋狂ChatGPT循環(huán)中。”

那么,作為生成式AI的代表,ChatGPT是如何獲得理解力的呢?

這一過程離不開大模型、大數(shù)據(jù)、大算力。整體技術路線上,ChatGPT在效果強大的GPT 3.5大規(guī)模語言模型(LLM,Large Language Model)基礎上,引入“人工標注數(shù)據(jù)+強化學習”來不斷訓練語言模型,主要目的是讓GPT模型學會理解人類的命令指令的含義。

簡單來說,就是基于優(yōu)秀的機器學習算法和強勁的算力,通過海量的數(shù)據(jù)訓練,讓AI學會“思考”。Open AI在2020年從微軟取得GPT 3的獨家授權后,一直在Azure AI超算基礎設施(由V100GPU組成的高帶寬集群)上訓練該模型,主要使用的公共爬蟲數(shù)據(jù)集有著超過萬億單詞的人類語言數(shù)據(jù)集。

國盛證券進一步認為,生成算法、NLP(自然語言處理)與算力決定AIGC能否運行,而高質量的數(shù)據(jù)集決定了AIGC質量與商業(yè)模式。相關公司包括

另外,AI需要利用大量的標注語料進行訓練和學習,標注數(shù)據(jù)的數(shù)量和質量對于模型的輸出結果至關重要,數(shù)據(jù)標注/ AI訓練數(shù)據(jù)因此也被視作增量需求。

漢王科技的自由書寫文稿識別技術即依托于海量數(shù)據(jù)訓練,本周一至今,該股三天內(nèi)收獲兩個漲停板(分別為12月5日、12月7日)。

漢王科技K線圖

A股公司中,從事數(shù)據(jù)訓練業(yè)務的還有海天瑞聲、四維圖新等。在A股公司互動易上,已有投資者向AI 訓練數(shù)據(jù)提供商海天瑞聲提問:ChatGPT方面應用方向?是否為人工智能+訓練數(shù)據(jù)業(yè)務?

不過,海天瑞聲的回復并沒有提及ChatGPT,僅表示將持續(xù)關注大模型領域新趨勢,并根據(jù)客戶的需求變化,適時推進公司產(chǎn)品創(chuàng)新、技術創(chuàng)新,滿足更多客戶、更新領域的AI訓練數(shù)據(jù)需求。

▍下一目標:大規(guī)模商業(yè)化

對于這些AI工具的創(chuàng)造者們來說,下一步要考慮的是大規(guī)模商業(yè)化。

從GPT進化到GPT 3的過程相當燒錢——參數(shù)量從1.17億增加到1750億,預訓練數(shù)據(jù)量從5GB增加到45TB,其中GPT 3訓練一次的費用是460萬美元,總訓練成本達1200萬美。高額投入使得B端變現(xiàn)更具可行性。

如今很多C端應用均為免費版,國泰君安表示,當前AI繪畫的用戶付費意愿不強,60%的用戶從未在AI繪畫相關方面付費,在C端付費形式刺激度較低的情況下,未來B端或將成為AI繪畫軟件的核心客戶。

并非沒有愿意掏錢的消費者。ChatGPT不限于普通聊天,還可解決具體難題,比如協(xié)助寫代碼等,部分用戶在社交媒體上表達了對ChatGPT的付費意愿,AI繪畫小程序“盜夢師”從10月1號開始商業(yè)化后,已經(jīng)有很多用戶付費,該產(chǎn)品負責人表示,目前次日留存率大概40%,七日留存率接近30%。

另外,版權問題是生成式AI繞不開的一道坎,絕大多數(shù)原創(chuàng)作品的版權擁有者會介意AI提取自身作品的部分元素。

最新動態(tài)
相關文章
觀點:龍頭三天兩板!ChatGPT是如何獲得...
環(huán)球微動態(tài)丨港股沖高回落恒指收跌3.22%...
世界實時:國家外匯局:我國持續(xù)推動穩(wěn)...
世界快看:銀行財眼|違反反洗錢等多項...
銀行財眼|農(nóng)行兩分支行合計被罰55萬元...
銀行財眼|吉林銀行被罰款50萬元 因投...