• <th id="aseqy"><track id="aseqy"></track></th>
    <tbody id="aseqy"><pre id="aseqy"></pre></tbody>
  • <span id="aseqy"></span><th id="aseqy"><pre id="aseqy"><rt id="aseqy"></rt></pre></th>
    <dd id="aseqy"><track id="aseqy"></track></dd>

    首頁 > 財經 >

    華為不想走ChatGPT的老路

    2023-07-11 05:10:17 市界

    經歷了上半年的喧囂,ChatGPT帶來的大模型熱潮正在迎來第一輪冷靜期。今年6月,ChatGPT的訪問量首次出現了月度下滑,而年初接入ChatGPT聊天功能的新版必應(Microsoft Bing),市占率也在近期出現下滑,甚至低于改版之前。

    一切都在預示著,大模型賽道“看熱鬧”的時刻過去了,市場正在對大模型的實用性提出更高的要求。與C端市場的集體狂歡相比,現在大家更關心大模型如何在B端行業落地,僅僅只會“Chat”(聊天)的大模型,已經滿足不了需求。


    (資料圖片僅供參考)

    新的競爭局勢已經出現。就在剛剛過去的人工智能大會上,一批聚焦不同行業和場景的大模型開始涌現。從華為、騰訊、阿里到科大訊飛等等,都在試圖讓大模型在商用層面落地。和以前“寫詩作畫”的賣點相比,現在大家更關心如何讓大模型幫助用戶解決實際問題。

    可以說,主流的大模型玩家們終于開始腳踏實地準備做實事了。

    而華為作為國內最早投入大模型研發的科技巨頭,早在2021年就推出了盤古大模型1.0。但是在今年的行業熱潮中,卻遲遲沒有拿出來自自家的當家產品。直到7月6日世界人工智能大會,華為輪值董事長胡厚崑才正式預告了盤古3.0的發布,并提到,未來人工智能的發展,關鍵是要“走深向實”,賦能產業升級。7月7日,在華為云開發者大會(HDC2023)上,華為云正式發布了盤古大模型的3.0版本。

    和ChatGPT不同,盤古3.0并不是一款主打“聊天”的大模型,華為方面甚至提到,盤古大模型在一段時間內都不會開放給個人用戶使用,這也不是產品的主要方向。盡管華為并未透露這個時間具體是多久,但至少印證了,“Chat”(聊天)不是盤古大模型研發的重點。

    “我們從來沒有和ChatGPT比較過,沒有叫盤古Chat,也沒有叫Chat盤古,我們沒時間聊天”。華為常務董事、華為云CEO張平安在7月7日媒體溝通會中提到。

    據華為介紹,盤古3.0大模型不是一個單獨的大模型,而是一系列大模型集群和工程應用平臺的總稱,共分為三個層級,既包括了底層(L0)的通用大模型,也包含了第二層(L1)的行業大模型和第三層(L2)的細分場景模型。

    應當說,在整個大模型賽道都在爭相比拼誰更擅長寫詩作畫的時候,盤古3.0選擇了一條全新的路,其發力點不僅在于通用能力的迭代,同時也聚焦于專業能力的進化,以滿足不同行業和場景的多樣化需求。

    華為顯然已經意識到了,大模型要想真正落地,必須要落地解決實際需求。大模型必須要在不同行業和場景中具有高度專業的實用能力,才能生存下去。

    不做下一個ChatGPT

    我們到底需要什么樣的大模型?當ChatGPT以意想不到的速度在全球躥紅之初,可能就連最頭部的科技巨頭也沒想清楚這個問題的答案。在微軟迫不及待地對旗下搜索引擎“必應”進行激進改版后,事實證明效果并不理想。

    但所有人都相信,隨著生成式AI的智能化水平跨過一個特定節點,必將徹底重塑整個世界的生產方式——其效果可能不遜于計算機帶來的上一輪信息革命。

    在這次大模型團戰中,作為最晚入局大模型賽道的國內科技巨頭,華為選擇從自身最擅長的To B市場入局。經過上半年的“折騰”,整個大模型賽道也逐步意識到,To C市場雖然熱鬧,但最終大模型還是必須要做深做實,才能在商用層面落地。

    “華為的大模型不作詩,只做事?!痹?月7日華為云開發者大會上正式發布盤古3.0時,華為常務董事、華為云CEO張平安如此表示。

    作為國內最早投入大模型研發的廠商,華為早在2021年就推出了盤古1.0大模型,而這次正式發布的盤古3.0則是對盤古1.0的一次重大升級。正如GPT3.0到GPT4.0的升級一樣,盤古3.0也是一次革命性的迭代,并且走了和ChatGPT完全不同的路。

    三年磨一劍。在過去兩三年,盤古大模型在架構和訓練方法上都進行了重大升級。

    在架構方面,盤古3.0首創了三層架構,其最底層是CV(視覺)、NLP(中文語音)、多模態、預測決策、科學計算、搜索推薦等一系列通用大模型,第二層是礦山、氣象、藥物分子、電力、金融等行業大模型,第三層則是解決具體問題的場景模型,具有高度定制化的功能性特征。

    而在訓練方法上,盤古3.0也升級了一套從通用到專精的訓練模式,既有行業常見的預訓練方法,訓練大模型的通用能力。同時還加入了針對性的特調訓練,可以通過SFT的數據進行精調,滿足不同行業需求,并且還有RHLF訓練,可以針對客戶的標注和反饋再進行強化學習。

    此外,作為行業首個完全分層解耦的大模型集群,盤古3.0對自身的不同能力進行了區分,而不是像ChatGPT一樣直接打包成一個巨無霸大模型,讓用戶可以按需取用。

    通俗來說,就是盤古3.0的各項能力之間可以獨立運行互不干擾。因為不同行業不同客戶的需求是不一樣的,例如鐵路行業可能主要需要視覺模型的能力,氣象行業可能主要需要科學計算的能力,分層解耦的設計適合針對不同行業的定制化需求。

    “分層解耦的模式可以把大模型的商業模式構筑得很好,讓行業客戶就像抓藥一樣想要什么就拿什么?!睆埰桨苍?月7日接受媒體群訪時提到。

    依托于全新的三層架構和分層解耦能力,盤古大模型的核心定位是對各行各業進行賦能,其中華為主要專注于L0層級和通識的L1層級。

    當然,不管架構和能力上有何創新,大模型的核心競爭力最終還是體現在訓練成果上,這背后必須依賴于龐大的數據量和算力支撐。

    在數據方面,盤古大模型預訓練數據中包含了超過3萬億tokens,使用了超過1000+TB的數據訓練,指令微調數據也在千萬級。而且和其他通用大模型相比,盤古行業大模型還采用了不少行業公開客戶數據和行業客戶授權數據進行訓練,針對性的行業數據訓練進一步提升了盤古3.0解決行業問題的能力。

    在算力方面,由于眾所周知的原因,華為并不能使用通用GPU架構,只能自己搭建框架和平臺。據張平安透露,盤古大模型算力基于華為昇騰AI算力集群,核心是達芬奇架構的昇騰芯片適配神經網絡計算。但據華為介紹,盤古3.0基于昇騰AI集群的模型訓練效率對比GPU架構提升了1.1倍。

    為了進一步提升算力規模,7月7日張平安在大會上宣布,單集群 2000P Flops 算力的昇騰 AI 云服務在華為云的烏蘭察布和貴安 AI 算力中心同時上線。相較于火遍全球的GPU架構,未來昇騰AI算力集群希望成為國內AI算力另一極。

    在多重創新下,盤古大模型在多項能力上實現了行業領先,其中盤古NLP大模型是業界首個千億參數的中文大模型,具備強大的文本理解和生成能力,CV大模型則首次兼顧了圖像判別與生成能力,在ImageNet 1%、10%數據集上的小樣本分類精度上,達到了業界最高水平。

    進入6月以來,不少AI行業人士都坦承,在年初ChatGPT爆紅之初,整個行業是存在一定炒作的。當所有企業都在搶著發布千篇一律的聊天大模型時,也預示了這一方向可能開始陷入了一定的誤區。

    今年2月,任正非在“難題揭榜”火花獎座談會上就曾提到,未來AI大模型會風起云涌,不會只是微軟一家。而人工智能軟件平臺公司對人類社會的直接貢獻可能不到2%,98%都是對工業社會、農業社會的促進。

    如今即便是OpenAI也在考慮進入行業市場,很大程度說明了,行業化或將是整個行業的必由之路。如何進一步改造工業社會和農業社會,將是各個大模型玩家需要共同思考的問題。

    深耕行業,落地場景

    當行業內的玩家都逐步意識到,行業化正在成為未來大模型競爭的焦點之后,圍繞不同行業的深入水平,將成為決勝的關鍵——誰能掌握行業的真實需求,并切實為行業解決問題,誰就能最先跑通大模型的商業模式。

    作為全球最大的通信設備廠商,華為在政企市場有著長達數十年的積累,在行業的縱深上有著很大優勢。最近兩年,華為陸續成立了20大軍團,下到礦山、煤井里面去,就是為了進一步打入行業,深度服務政企客戶。

    在7月7日的媒體群訪中,華為云CEO就提到,華為最大的優勢就是,行業業務做得比較深,行業哪里有問題,就能把科學家、數學家送到哪里去。

    “我們的科學家、數學家可以下到煤礦井里,可以蹲在車間一個月、三個月。我們敢下到田頭、地頭,別人可能下不去或者不愿意下去,這就是華為在大模型上最重要的優勢?!睆埰桨脖硎?。

    從實際運用來看,此前軍團作戰深耕的不少行業,確實也成為了盤古行業大模型最先運用的領域。

    例如在華為比較擅長的政務市場,盤古政務大模型通過對超過20萬條政務數據進行精調,包括12345熱線、政策文件、政務百科等,掌握了豐富的法律法規、辦事流程等行業知識。在深圳市福田區政務服務數據管理局的應用案例中,基于盤古政務大模型訓練的福田政務智慧助手小福,能夠精準理解民眾咨詢意圖。

    再比如在金融領域,盤古金融大模型通過對銀行的各種操作、政策、案例文檔進行預訓練,能根據客戶的問題,為柜臺工作人員自動生成流程和操作指導,將原來需要平均5次的操作降低為1次,辦結時間縮短5分鐘以上。

    在氣象領域,盤古氣象大模型則是首個精度超過傳統數值預報方法的AI預測模型,同時預測速度也有了大幅提升。原來預測一個臺風未來10天的路徑,需要在3000臺服務器的高性能計算機集群上花費5小時進行仿真。

    就在這次華為云開發者大會召開之前,7月6日,《自然》雜志發表了華為云盤古大模型研發團隊研究成果——《三維神經網絡用于精準中期全球天氣預報》。論文顯示,盤古氣象大模型突破了AI預報天氣精度不及傳統數值預報的世界性難題,是首個精度超過傳統數值預報方法的AI模型,速度相比傳統數值預報提速10000倍以上。

    此外,在煤礦、鐵路、藥物研發等行業,盤古大模型都推出了專用的行業大模型,進一步幫助行業提升效率。華為表示,盤古大模型的目標是讓每個行業、每個人都擁有自己的“專家助手”。

    “我們始終堅持AI for Industries的戰略,在深耕行業的道路上不斷前行。我堅信大模型將重塑千行百業,而每一個開發者,都將是改變世界的英雄?!比A為云CEO張平安表示。

    而在行業大模型之上,更細分更具體(L2)的場景模型,則是專門為了解決特定問題而生,華為的說法是“開箱即用”。盤古大模型目前已經在超過100個實際場景中取得應用,降低了人工智能的開發門檻,平均節省研發成本80%以上。

    例如在國網重慶供電公司,盤古CV大模型在經過海量無標注電力數據的預訓練和少量數據微調之后,被成功運用到了電力智能巡檢中,很大程度取代了傳統的無人機智能巡檢AI模型。在數據標注能力上,新模型的樣本篩選效率提升約 30 倍,篩選質量提升約 5 倍,以永川每天采集 5 萬張高清圖片為例,可節省人工標注時間 170 人/天。

    在針對司法案件檢索的應用中,盤古NLP大模型針對多個行業難點進行了微調和優化,甚至設計了新的預測函數。最終在中國法律智能技術評測CAIL (Challenge of AI in Law) 大賽中,以NDCG@30分值0.943的總成績位列第一。

    而在貨運列車智慧檢測的運用中,盤古大模型對貨車運行故障實現了精準檢測,可以精準識別442種各類故障。大類故障發現率達到99.99%,一般故障發現率超過98%,總體發現率達到99.8%,超過客戶預期。

    在華為看來,未來大模型將會成為一個從通用到專精的綜合體,其中大語言模型更像是一個內腦中樞,提供了自然語言處理領域的通用解決方案:可以理解人類意圖,并通過調用各種細分行業模型來服務行業,而各種聚焦場景的調優模型,則更像是具體的小功能,專門去解決具體問題。

    毫無疑問,今年以來大模型賽道的爆發,將成為一場科技革命,徹底重塑整個工業社會,很多行業都將被徹底改變。而華為作為一家企業,除了研究和工程化以外,更需要探索新的大模型商業模型,保證大模型的商業成功。

    如今將盤古大模型分為L0到L2的三層模式,并在完全解耦的基礎上,針對不同客戶的需求進行拆分組合,就是為了進一步探索大模型商業化的邊界。

    華為的大模型之路

    幾個月前,國產大模型紛紛橫空出世之時,行業就一直在期待華為大模型的亮相。作為國內AI產業的頭部玩家,華為一直被視為在人工智能方面積累最深厚的企業之一,到底華為會走出一條什么樣的大模型之路,也一直被行業關注。

    雖然盤古3.0的亮相比其他主流玩家都要晚一些,但如果回溯過往,華為對大模型的研究其實由來已久。

    據華為方面披露,早在2020年,華為就判斷未來AI產業將有兩個主要的發展方向,一個是從小模型到大模型的趨勢,另一個則是AI和傳統科技計算的結合,也就是AI for Science。當時華為提出了關于數據模型和知識的6個子課題,其中模型模高的計劃和萬物預視計劃都和大模型高度相關,在GPT-3推出之前華為就一直在朝著這份方向推進。

    但ChatGPT對行業的推動確實不容忽視,特別是在2020年GPT-3推出后,使整個行業注意到了大模型加速崛起的新趨勢。華為也從2020年夏天開始進行大模型NLP、大模型CV方向的研究,后來逐漸擴展到了多模態、個性計算、預測決策進行立項。

    除了入局足夠早,華為在大模型方面的人才積累也足夠深。據華為方面披露,盤古大模型團隊中有50%以上是博士,還有多名天才少年,這個團隊的平均年齡還不到30歲。這樣一個技術過硬,且敢于創新的年輕團隊,是盤古大模型背后最堅實的人才保障。

    如今盤古3.0的亮相,并選擇了扎根行業的路線,意味著華為終于朝著自己選擇的大模型之路上踏出最重要的一步,但接下來的下一步將怎么走,和整個行業一樣,華為也還在摸索之中。

    但是摸索不代表猶豫,據華為云CEO張平安在7月7日的媒體群訪中透露,針對盤古大模型的下一步,華為做了一個非常激進的路線圖,“我們現在是all in盤古大模型,路標圖制定是密密麻麻的?!睆埰桨脖硎?。

    在張平安看來,未來盤古大模型更關注的不是參數有多大,而是對行業的垂直滲透率有多高。除了現在已經切入的鐵路、煤礦、金融、政府等行業,還有更多的行業需要自己的大模型。

    “盤古大模型將來最有價值的不是5000億、上萬億的參數。而是在哪些行業又做深了,又擴展了哪些新的行業?!睆埰桨脖硎?。

    盡管大家現在都在朝著行業化的方向邁進,但華為畢竟不同于其他玩家。由于長期在算力底座、開發框架等方面的積累,盤古大模型還具備了一大優勢,就是全棧研發能力。

    今年大模型賽道火了之后,為了滿足大模型訓練龐大的算力需求,英偉達的GPU一芯難求。國內整個大模型賽道如今都面臨著算力緊缺,而未來英偉達GPU也很可能將會面臨供應限制,這就要求國產大模型必須具備全棧自主研發能力。

    據華為云CTO 張宇昕透露,盤古大模型從算力到算子,再到框架、開發平臺等都是自主創新,沒有使用開源技術。而之所以能夠做到全棧自主研發,主要得益于華為此前在AI底座、算力和芯片等根技術上的積累。

    因為有了昇騰的AI底座,有了Mindspore的計算框架,有了ModelArts訓練平臺等全棧的AI根技術,華為在做大模型的時候,才能針對不同行業和場景做更深入的優化,比其他玩家更深一步。

    正如7月6日華為輪值董事長胡厚崑提到的,當前華為在人工智能發展上主要有兩個著力點,一方面是打造強有力的算力底座,做好產業基礎設施,另一方面就是從通用大模型到行業大模型,服務好千行百業。

    在這次盤古大模型3.0發布時,盤古還公布了全新LOGO,新的LOGO上面頂著天,下面踏著地,是盤古開天地的簡化符號?!肮庞斜P古開天地,萬物新生;今有盤古縱四海,行業重塑?!睆埰桨脖硎?。

    當華為為自家的大模型取名盤古時,或許就意味著,盤古大模型肩扛重擔,如果未來國產大模型也面臨“卡脖子”難題,盤古必須要獨自撐起一片天來。

    作者 | 曾廣

    編輯 | 李原

    運營 | 劉珊

    相關推薦

    少妇高潮久久久久久_亚洲永久免费播放片址778aa_影音先锋A∨中文字幕资源_免费国产最新进精品视频

  • <th id="aseqy"><track id="aseqy"></track></th>
    <tbody id="aseqy"><pre id="aseqy"></pre></tbody>
  • <span id="aseqy"></span><th id="aseqy"><pre id="aseqy"><rt id="aseqy"></rt></pre></th>
    <dd id="aseqy"><track id="aseqy"></track></dd>