來源:博觀科技日期:2022-04-19 15:59:12
距離被阿里“通義千問”刷屏還不到一周時間,4 月 11 日,阿里云峰會又再放大招。
活動現場,阿里巴巴集團董事會主席兼 CEO、阿里云智能集團 CEO 張勇在云峰會上表示,阿里巴巴所有產品未來將接入“通義千問”大模型,釘釘、天貓精靈已率先接入通義千問測試,并會在評估認證后正式發布新功能。
不僅如此,阿里云還將開放通義千問的能力,幫助每家企業打造自己的專屬大模型。張勇表示,面向 AI 時代,所有產品都值得用大模型重新升級。
當大家還在就通義千問跟 ChatGPT、文心一言的對比效果而津津樂道時,阿里再進一步,已搶先在其應用中率先測試,讓外界深切地感受到,生產力變革真的要到來了,中國 AI 下半場激烈競爭的號角也正式吹響。
國產AI模型大混戰
接下來,有多場大模型相關發布會扎堆舉辦。
4月10日,商湯“日日新SenseNova”大模型體系問世;4月11日,毫末智行自動駕駛生成式大模型DriveGPT雪湖·海若發布;由昆侖萬維和奇點智源合作研發的天工大模型3.5發布在即,并將于4月17日啟動邀請測試;5月6日,科大訊飛“1+N認知智能大模型”即將發布……
互聯網巨頭、人工智能公司、智能硬件公司、自動駕駛公司等各方力量,都積極參與到大模型這一場盛宴中來。
行業監管也迅速出手。4月11日,國家網信辦發布通知,就《生成式人工智能服務管理辦法(征求意見稿)》面向社會公開征求意見。
根據計算機科學家、自然語言模型專家吳軍的說法,ChatGPT背后是一個叫做語言模型的數學模型在發揮作用,這項語言模型技術早在1972年就已經有了,是由他的導師弗萊德里克·賈里尼克(Fred Jelinek)在IBM期間帶領團隊研發出來的。
只是到了今天,由于算力不斷提升,語言模型已經從最初基于概率預測的模型發展到基于Transformer架構的預訓練語言模型,并逐步走向大模型的時代。
復旦大學計算機學院教授、MOSS系統負責人邱錫鵬曾這樣描述大模型的能力飛躍:“當模型規模較小時,模型的性能和參數大致符合比例定律,即模型的性能提升和參數增長基本呈線性關系。然而,當 GPT-3/ChatGPT 這種千億級別的大規模模型被提出后,人們發現其可以打破比例定律,實現模型能力質的飛躍。這些能力也被稱為大模型的‘涌現能力’(如理解人類指令等)。”
每當有革命性的技術誕生,無一不是由其在具體行業的商用化應用來實質性地推動行業進步。作為連接技術生態和商業生態的橋梁,大模型也將在很多行業應用落地。
只是,這波來勢兇猛的大模型熱,究竟會催生萬物生長改變萬千業態,還是繼區塊鏈、元宇宙之后又一個看上去很美的泡沫?
AI大模型成功的兩大要素
盡管阿里并不是國內第一個公布類GPT的,但阿里卻是國內最早著手AI大模型研發的大廠之一。
阿里云智能 CTO 周靖人表示,“對我們行業內的人來講,我們并不認為這條道路好像就是 2023 年突然出現。這是一個長期以來技術發展的演進過程。”在他看來,大模型通義千問既不是起點,也不是終點,而是一個中間節點。
實際上,阿里達摩院在NLP(自然語言處理)等前沿科研領域布局多年。2019年阿里啟動大模型研發,當年即發布大規模預訓練語言模型structBERT并登頂全球NLP權威榜單GLUE,成為近年中國公司在AI領域的核心突破之一。
此后,阿里陸續發布國內首個超百億參數的多模態大模型及語言大模型,訓練實現全球首個10萬億參數AI模型。在2022年,達摩院推出集大成的通義大模型,在語言及多模態能力、超大模型、通用統一模型等多個技術維度上,均處于國內第一梯隊。
在周靖人看來,阿里對AI大模型的投入及研發,已通過自身實踐錘煉出了國內唯一支撐過萬億參數以上大模型的“飛天智算基礎設施”。
此次云峰會上,他首次全面詮釋了“飛天智算基礎設施”可提供的三層系統服務能力:
智算IaaS服務包括可支持最大十萬卡GPU單集群規模、可承載多個萬億參數大模型同時在線訓練的智算集群,可為萬卡規模AI集群提供無擁塞通訊的自研RDMA網絡架構等;
智算PaaS服務以機器學習平臺PAI為核心,可支持萬卡的單任務分布式訓練規模,AI訓練效率提升可達10倍,推理效率提升可達6倍,覆蓋全鏈路AI開發工具與大數據服務,深度支持了通義大模型的研發;
智算MaaS服務包括通義大模型系列和以之為基礎的企業定制大模型,以及國內首個“模型即服務”開放平臺魔搭社區,魔搭現已匯聚超800個優質開源模型,總用戶量超100萬,模型累計下載次數超1600萬,成為國內規模最大的模型社區。
“這一系列都是幫助我們在人工智能的時代更好的訓練自己的模型,更好的把我們模型服務推向我們的業務去解決我們實際的問題。”周靖人總結說到。
不少業界人士認為,這是通義千問問世背后的關鍵因素——深厚的大模型技術積淀、強大的云基礎設施能力,對大模型的研發來說缺一不可。
AI人才遭瘋搶
AI已經成為了時代的風口,這個風口的風力有多大呢?
一個月12-20萬。
對,一個月120000-200000元!
如果說,步入2023年最火的是什么,那一定就是ChatGPT所引領的開放式AI了,這個東西有多火呢?
現在就連查個百度都要問一下AI是什么看法了。
如此火熱的項目,自然少不了大廠之間的相互競爭,而競爭的第一步,便是招兵買馬。
據了解,現在獵頭正在尋找多位AI方向投資經理,base北京,并且開出待遇:薪資范圍60k-90k。招聘網站顯示,AI方向VP-MD,最高月薪200K。
與此同時,AI大模型也是一塊香餑餑,在某招聘平臺上搜索AI大模型相關崗位,相關詞條可多達數頁,圖像識別、算法研究員、深度學習等崗位的年薪均已達百萬元。而在此之前,傳聞百度文心一言大模型團隊內的研發人員遭到其他公司的“挖角”。
造成這一現象的原因除了AI產品本身的火熱,還有因為市場未來的趨勢一定是走向大數據。“國內肯定要有自己的大模型,這是通往未來的船票。”這已經成為了業內的共識,那么如何拿到這張船票,就成了國內大廠研究的重點。
但這張船票是有門檻的,而且很高。
關于AI大數據的花費有多大呢?計算機科學家、自然語言模型專家吳軍談及ChatGPT的訓練成本時介紹:“大概可能是3000輛特斯拉的電動汽車,每輛跑到20萬英里,把它跑死,這么大的耗電量,才夠訓練一次,這個非常花錢的一件事”。
也正因為如此,目前宣布自家AI產品的,無一不是大廠,截至目前,國內AI賽道參與的玩家有:百度“文心一言”、阿里巴巴“通義千問”、360“360智腦”,可能有些紕漏,大家還可以在評論區指出來,我們可以看出,AI已經成為了大廠的競爭,小公司已經完全沒有了立足之地。
綜合這三家測試的媒體反饋來看,目前國內相關產品相較于行業領先的產品仍有一定的差距,還需要大量的訓練改進才能有更好的發展。國內的AI市場應該會是未來幾年,大家內卷的目標。
鄭州博觀電子科技有限公司是一家提供科技類物聯網開發軟硬件定制化方案服務商、也是中原地區領先的物聯網終端設備解決方案提供商。致力共享換電柜、智能充電樁、共享洗車機、物聯網軟硬件等服務平臺的方案開發與運維。總部位于河南省鄭州市高新區,已取得國家高新技術企業認證證書。經過10多年的業務開拓,公司已經形成了以中原地區為中心、業務遍布全國的經營格局。
* 為了您的權益,您的一切信息將被嚴格保密