在過去幾個月中,隨著ChatGPT在全球范圍迅速火爆,國內(nèi)AI大模型賽道的熱度也隨之急速升溫。各路業(yè)界大神紛紛推出自己的大模型產(chǎn)品,八仙過海,各顯神通。誰將打造出比肩ChatGPT的中國人自己的AI應用?誰將成為中國的Open AI?這兩個極具挑戰(zhàn)性的問題,不斷刺激著國內(nèi)眾多互聯(lián)網(wǎng)大廠和科技大佬們的神經(jīng)。同時,這兩個問題的提出,也預示著中國AI產(chǎn)業(yè)發(fā)展趨勢,已經(jīng)從1.0版的“分封割據(jù)”期,邁入了 2.0版的“戰(zhàn)國”時代。圍繞“大模型”的發(fā)布,國內(nèi)AI界正在上演著一場“大混戰(zhàn)”。
國內(nèi)生成式AI大模型界進入“五霸七雄”爭鋒時代
縱觀眼下國內(nèi)涉足AI大模型賽道的玩家,如果按照已有相關(guān)產(chǎn)品落地的行業(yè)屬性來分,主要分為“互聯(lián)網(wǎng)界”和“AI科技派”這兩大流派。所謂“互聯(lián)網(wǎng)界”,指的是目前已經(jīng)有具體產(chǎn)品的互聯(lián)網(wǎng)大廠,其中又以百度、阿里、騰訊、網(wǎng)易、京東這5家為代表。先是百度和阿里爭相推出各自的超大規(guī)模語言模型“文心一言”和 “通義千問”,并開放內(nèi)測;后有騰訊、網(wǎng)易、京東也競相公開自家的大模型產(chǎn)品“混元”、“玉言”和“ChatJD”,且紛紛預告上線發(fā)布。由此,也成就了這5家互聯(lián)網(wǎng)企業(yè)大模型界“五霸”稱號。另外,知乎、網(wǎng)易、360等一桿互聯(lián)網(wǎng)企業(yè),也紛紛推出新品或研發(fā)計劃。
而與此相對應的則是“AI科技派”,即以AI硬核科技企業(yè)為主的單位。它們也不甘寂寞,紛紛爭先恐后地推出自己的大模型方案和發(fā)展計劃。其中又以華為、商湯科技、科大訊飛、深蘭科技、昆侖萬維、出門問問、智源研究院這7家最具代表性。尤其是今年4月份集中爆發(fā),如華為、商湯、深蘭科技、昆侖萬維、出門問問等科技企業(yè)分別推出了“盤古”、“日日新”、 “硅基知識”、“天工”和“序列猴子”大模型, 5月初,科大訊飛也發(fā)布測試很久的“星火”大模型。因此,這7家科技企業(yè)也被業(yè)界譽為大模型界的“七雄”。由此,國內(nèi)生成式AI領(lǐng)域的“大模型混戰(zhàn)”,就此全面開打。
“通用派”和“垂類派”的路線之爭
但如果換一個角度,我們發(fā)現(xiàn)今天國內(nèi)AI企業(yè)界,除了分為“互聯(lián)網(wǎng)派”和“AI科技派”以外,還存在大模型開發(fā)的類型派系之爭。從以上這些企業(yè)推出的大模型來看,基于目標人群、用途和適用場景的不同,又可以分為通用和垂類兩種大模型開發(fā)企業(yè)。由此,也誕生了“通用派”和“垂類派”這兩大派采用不同大模型開發(fā)路線的企業(yè)群體。其中,開發(fā)通用類大模型的企業(yè),目的是為了做理論框架的搭建、大模型的訓練以及算法等,且這一類大模型的目標人群基本是針對所有人,適用范圍也很廣。說穿了,這一派做通用大模型的企業(yè),就是在做通用AI的技術(shù)攻關(guān),目的是為了打造中國版的ChatGPT。而開發(fā)垂類大模型的企業(yè),則是以深度解決垂直領(lǐng)域問題為主,以產(chǎn)品開發(fā)為目的,即企業(yè)在自己擅長的領(lǐng)域開發(fā)一個產(chǎn)業(yè)版ChatGPT,然后直接應用到自己的相關(guān)AI產(chǎn)品上,使該產(chǎn)品實現(xiàn)或增強某種功能。這一類大模型的搭建相較于通用大模型而言,在算力上的要求相對較低,但在數(shù)據(jù)量和算法上針對性會比較強。由于在用戶群體規(guī)模體量和應用場景適用范圍上,通用大模型都要遠遠大于垂直應用類大模型,所以其開發(fā)周期和所需要投入繁榮財力、人力也遠高于垂直應用大模型。因此,目前國內(nèi)做通用大模型的企業(yè),基本上都是互聯(lián)網(wǎng)或科技大廠。像百度、阿里、華為等這些互聯(lián)網(wǎng)大廠和科技巨頭,就是屬于“通用派”系。而就內(nèi)容反饋數(shù)據(jù)來說,相較于通用大模型,垂直應用大模型生成的內(nèi)容更符合特定垂直類場景的需求,質(zhì)量更高。因此,也就吸引了眾多AI科技企業(yè)參與其中。如深蘭、出門問問、有道等聚焦AI具體賽道的企業(yè),就是典型的“垂類派”企業(yè)。就目前市場關(guān)注度而言,由于受Open AI成功開發(fā)ChatGPT并迅速走紅的影響,國內(nèi)社會各界把目光大都集中到“通用派”企業(yè)和大模型上來,相反“垂類派”企業(yè)和產(chǎn)品卻受到了冷遇。顯然,ChatGPT的成功,正在潛移默化地引導著國內(nèi)AIGC產(chǎn)業(yè)發(fā)展的走向。
諸神混戰(zhàn)之下,誰主沉???
那縱觀這些參戰(zhàn)的企業(yè),到底誰能在這場“大模型混戰(zhàn)”中存活下來,并最后拔得頭籌?先后競相登場的那些大模型,它們的未來會是星辰大海,還是一地雞毛呢?下面我們就來盤點一下。首先,來看目前市場上曝光率最高的大模型四巨頭“BATH”,即百度的“文心一言”、阿里的“通義千問”、騰訊的“混元”和華為的“盤古”。這幾個大模型有以下幾個共同特點,那就是都布局了NLP、CV、跨模態(tài),適用范圍和對標人群都很廣,且都動用了海量數(shù)據(jù)參數(shù)進行了預訓練。但這也導致了這四家的大模型同質(zhì)性太強,應用上基本沒有區(qū)隔,正式進入市場后,非但難以發(fā)揮各自優(yōu)勢,反而極易導致“內(nèi)斗”,就好比在一個“浴缸”里養(yǎng)了4條鯊魚,妥妥坐實了“BATH”之名。然后,再來看市場上已公開的垂直應用大模型。這一類模型的特點是目前已經(jīng)正式對外公開的不多,名氣也沒有“BATH”的響,且都不是獨立推出,而是附身于企業(yè)開發(fā)的某個具體AI產(chǎn)品上。如有道近期推出的自研教育場景下類ChatGPT模型“子曰”,就是服務于AI口語老師和中文作文批改應用上的;而面向金融領(lǐng)域的AI企業(yè)百融云創(chuàng),也將研發(fā)的與ChatGPT采用同源技術(shù)的智能語音機器人應用于金融行業(yè)的零售業(yè)務上;另外在4月23日舉行的全國工商聯(lián)物聯(lián)網(wǎng)委員會年會暨物聯(lián)網(wǎng)與人工智能高峰論壇期間,中新社報道深蘭科技開發(fā)的國內(nèi)首款強化學習個人數(shù)字化產(chǎn)品metamind已經(jīng)應用了自主知識產(chǎn)權(quán)的“硅基知識”大模型…這些都是AIGC大模型在垂直應用領(lǐng)域的成功案例。從市場營銷角度來看,一個產(chǎn)品問世后,正確的市場手段是創(chuàng)造一個新的消費領(lǐng)域,以此避免自己陷入原有紅海市場的競爭。這對于AIGC大模型開發(fā)應用來說,也是完全適用的。因此,像“子曰”、“硅基知識”這一類產(chǎn)品技術(shù)的研發(fā),可以說是在AIGC大模型實際應用上的一次突破創(chuàng)新。而從另一方面來說,目前國內(nèi)市場上所出現(xiàn)的大小廠都一窩蜂地去做類ChatGPT產(chǎn)品,對整個產(chǎn)業(yè)發(fā)展而言,并不是一個好的現(xiàn)象,只能說是脫實務虛,其中絕大多數(shù)企業(yè)應該是走不遠的。就以“BATH”這四巨頭而言,最終也很有可能陷入內(nèi)耗式競爭。相反,企業(yè)如果能集中力量,聚焦某個具體應用領(lǐng)域,開發(fā)垂直應用大模型,也許會有意想不到的收獲。就以“硅基知識”大模型為例,不同于傳統(tǒng)意義上的類ChatGPT大模型,“硅基知識”是專為深蘭個人數(shù)字化產(chǎn)品Matemind研發(fā)的,具備內(nèi)容生成、記憶和發(fā)現(xiàn)三大功能,不僅能智能生成內(nèi)容,還能將所生成的內(nèi)容轉(zhuǎn)化為用戶個人記憶整體保存下來,作為“數(shù)字分身”基礎(chǔ)數(shù)據(jù),以備未來生成新內(nèi)容和延續(xù)個人“硅基生命”所需,有效解決了個人數(shù)字化所必需的數(shù)字分身在知識學習、積累和應用方面的問題。簡單地說,“硅基知識”不僅實現(xiàn)了人生命的“數(shù)字化永生”,還指出了一條人工智能產(chǎn)業(yè)發(fā)展的新路。透過“硅基知識”大模型這個案例,我們甚至可以說每一款垂直應用大模型,都是一盞點亮人工智能產(chǎn)業(yè)發(fā)展新方向的明燈。
搞大模型,瞄得越小,做得越好
自從進入21世紀以來,我們分別經(jīng)歷了互聯(lián)網(wǎng)熱、電商熱、大數(shù)據(jù)熱……每一次熱潮開始,都會引得各方都爭先恐后地涌入,但潮水退去之后,就會發(fā)現(xiàn)當時那些蜂擁融入的弄潮兒們,絕大多數(shù)都不知所蹤,真正活下來的都是那些默默耕耘,在某個具體領(lǐng)域做出成績的企業(yè)。那面對大模型混戰(zhàn)愈演愈烈的今天,中國企業(yè)應該如何參與其中?在我看來,做大模型既要看準大方向,也要瞄準小目標,切忌貪大求全,只有這樣才不至于重蹈以前那些失敗者的覆轍。百度的李彥宏就曾表示,ChatGPT作為一個通用模型,對于某些特定領(lǐng)域并不擅長,而大公司一般都從通用型產(chǎn)品開始做起,初期他們并不會特別關(guān)注某個細分垂直領(lǐng)域,但當你在某個細分領(lǐng)域內(nèi)做到極致,你就會發(fā)現(xiàn)你的產(chǎn)品和所積累的用戶需求,很難被其他產(chǎn)品直接復制,此時你再去拓展應用領(lǐng)域,就會比較有競爭力。錢學森在《系統(tǒng)工程論》提出這樣一個核心觀點,那就是做任何技術(shù)產(chǎn)品,都要從現(xiàn)有條件出發(fā),不求單項技術(shù)的先進性,只求總體設計的合理性,充分利用現(xiàn)有資源;以總體設計負責對各個分系統(tǒng)的技術(shù)協(xié)調(diào)提升改造現(xiàn)有的工業(yè)技術(shù)。把這個理論放在大模型的開發(fā)上,一樣適用。大模型再厲害,也只是一項技術(shù),它必須應用到具體產(chǎn)品上,才能發(fā)揮最大作用。因此一個企業(yè)做大模型,并不是做得越大越通用就越好,而是應該基于產(chǎn)品,聚焦在某個需求上,合理開發(fā)和利用,進而實現(xiàn)大模型在產(chǎn)品中功能的最大化。不跟風,堅持做自己,保持一顆平常心,這一點對所有涉足中國AI領(lǐng)域的企業(yè)來說,都尤為重要,無論你是否參與了這場混戰(zhàn)。做AIGC大模型本身就不是一場百米賽,而是一場馬拉松,比拼的不是看誰眼前跑得快,而是看誰今后走得遠。無論是百度、阿里、騰訊這些互聯(lián)網(wǎng)巨頭,還是商湯、科大訊飛、出門問問、深蘭科技這些AI賽道能手,誰能走到最后,關(guān)鍵還是看誰現(xiàn)在的做法對頭。因此,有必要在這里潑潑冷水,讓大家都冷靜冷靜,千萬不要盲目跟風,被ChatGPT引燃的這股通用大模型“虛火”,給引火燒了身。文:AI產(chǎn)業(yè)研究中心
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!