在烏鎮,“大模型”成為“高頻熱詞”
光明網記者 雷渺鑫 李飛
“文心智慧體技術,受到人腦快思考慢思考的啟發,在基礎大模型之上研製了基於思考模型的慢思考機制,更理性、更準確。”
“Angel大規模機器學習平臺在規模方面採用了GPU拓撲感知調度, 研發了層次化規約計算, 實現了單任務萬卡的線性擴展。”
“‘認知決策智慧體技術創新及應用’項目通過圖智慧、運籌優化等技術突破,實現了基於萬億級關聯關係、行業知識和專家經驗的實時推理決策。”
……
在11月19日下午舉行的2024年世界網際網路大會領先科技獎頒獎典禮現場,“大模型”多次出現,成為“高頻熱詞”。
自ChatGPT發佈後,以大模型為代表的人工智慧技術正在引領科技創新和産業變革浪潮。如果説普通觀眾是“看熱鬧”的直觀感受,那麼大模型的研究者和從業者,則更關心這條新賽道上更深層次的“門道”。
大模型時代,模型參數超過萬億,訓練數據超過十萬億,如此龐大的規模,給模型訓練和推理帶來三個關鍵挑戰,即通信挑戰,如何實現大規模AI算力節點的高速互聯;效率挑戰,如何實現高效的訓練性能和推理速度;規模挑戰,如何實現萬卡甚至更大規模集群的線性擴展。
對此,騰訊公司副總裁蔣傑表示,“Angel大規模機器學習平臺關鍵技術與應用”項目,通過自研RDMA網路、顯存+主存一體化機制及GPU拓撲感知調度等技術,實現了通信、效率與規模的全面優化,為大規模機器學習模型的訓練和推理提供了強有力的支撐。
“截至今年9月,Copilot已搭載了GPT-4o等領先模型,整合了多項創新功能。例如AI時代的開創性數字工具Copilot Pages,與數據中樞BizChat無縫整合,將網頁數據、工作數據和業務數據整合到用戶的工作流中,構建出全新的多用戶實時、持續的AI協作模式。”微軟全球資深副總裁張祺介紹,諸多獨特優勢,使Copilot不同於其他AI服務,開創了以AI為思維引擎的全新工作模式。
然而,技術的革新並未止步。百度公司發佈的文心智慧體技術,則是對人工智慧模倣人類思考能力的深度探索。百度公司首席技術官王海峰介紹,文心智慧體基於思考模型的慢思考機制,通過思考過程的有監督精調、行為決策的偏好學習、結果反思的增強學習等思考增強訓練,實現了從“模倣”到“思考”的跨越。
這一突破,不僅提升了文心大模型的能力,充分釋放其潛力,更加速了應用的爆發:代碼智慧體、農民院士智慧體、個人助手等“遍地開花”……據了解,截至目前,文心智慧體已凝聚超過80萬開發者、15萬家企業。
技術的創新,最終要真正實現“落地”,才能發揮其價值。在螞蟻科技集團股份有限公司首席技術官何徵宇看來,新一代人工智慧技術在大規模落地中,面臨領域認知能力弱、複雜推理能力差、端到端落地難三大挑戰。此次發佈的“認知決策智慧體技術創新與應用”項目,正是將人工智慧技術深度融入産業實踐的生動例證。
該項目通過研發萬億參數的可信大模型基座、高性能知識決策引擎及行業智慧體開發平臺,實現了人工智慧在醫療、民生、金融等領域的廣泛應用,顯著提升了行業的認知力和行動力。
回顧過去,人工智慧大模型産業的發展已經取得了令人矚目的成就;展望未來,智慧化浪潮勢不可擋,人工智慧將深刻改變我們的生活和工作方式。
在此過程中,我們也應清醒的認識到,人工智慧技術的發展仍面臨數據安全、隱私保護、倫理道德等諸多挑戰和問題,如何平衡好技術創新與社會責任的關係,確保人工智慧技術的健康、可持續發展,亟待解決。
“獨木不成林,單弦難成曲。”人工智慧大模型産業的發展離不開社會各界的共同努力。我們相信,在科技巨頭的引領下,在廣大開發者和企業的積極參與下,人工智慧大模型産業將迎來更加廣闊的發展前景,向著“以人為本、智慧向善”聚力前行。