您的位置:首頁(yè) >社會(huì ) > 正文

開(kāi)啟AIGC新局面 浪潮信息讓生成式AI智慧有數

當前,生成式AI(AIGC)已經(jīng)成為AI產(chǎn)業(yè)化發(fā)展的主戰場(chǎng),隨著(zhù)大模型參數量和數據量的爆發(fā)式增長(cháng),多源異構數據的傳、用、管、存,正在成為制約生成式AI落地的瓶頸之一。為了化解生成式AI的數據存儲與管理瓶頸,浪潮信息在“數智未來(lái)”AIGC數據應用創(chuàng )新論壇上,正式發(fā)布面向生成式AI的存儲解決方案,該方案以極致融合、極致性能、極致節能,和熱溫冷冰四級數據全生命周期管理,助力開(kāi)啟生成式AI新局面,創(chuàng )造智慧時(shí)代新機遇。

生成式AI亟待突破多源異構和存儲性能瓶頸

生產(chǎn)式AI是人工智能從1.0時(shí)代進(jìn)入2.0時(shí)代的重要標志,其具備強大的認知智能,在搜索引擎、藝術(shù)創(chuàng )作、影音游戲,以及金融、教育、醫療、工業(yè)等領(lǐng)域有著(zhù)廣闊的應用前景。Gartner預測,到2023年將有20%的內容被AIGC所創(chuàng )建;到2025年人工智能生成數據占比將達到10%。據分析師預測,到2032年,生成式人工智能市場(chǎng)規模將達到2,000億美元,占據人工智能支出總額的約20%,顯著(zhù)高出當前的5%。換言之,未來(lái)十年市場(chǎng)規??赡苊?jì)赡昃蜁?huì )翻一番。


(資料圖片)

生成式AI主要應用場(chǎng)景涵蓋文本生成、語(yǔ)音生成、圖片生成、視頻生成、代碼生成、虛擬人生成等,在每種應用的背后是基于行業(yè)上下游對數據進(jìn)行采集、標注、訓練、推理、歸檔,其特征是數據量大、多元數據類(lèi)型復雜、服務(wù)協(xié)議多樣、性能要求苛刻、要求服務(wù)持續在線(xiàn)。生成式AI對數據存儲提出如下挑戰:

異構數據的融合:生成式AI訓練模型的數據呈現來(lái)源多、格式多的多源異構現狀,傳統存儲面向單一數據類(lèi)型設計,需要以搬移數據的方式實(shí)現多協(xié)議訪(fǎng)問(wèn),存儲成為應用平臺的關(guān)鍵瓶頸;

持續的低延遲與高帶寬:模型訓練過(guò)程中,頻繁地從數據集取Token,每個(gè)Token一般4字節,實(shí)時(shí)高并發(fā)小IO性能需要極低的延遲;存儲模型Checkpoint時(shí),為Checkpoint數據可快速寫(xiě)入,需要高帶寬;

EB級大容量存儲需求:越多的數據投喂結果越精準的工作原理,決定了大模型訓練存在深度學(xué)習網(wǎng)絡(luò )層數多、連接多、參數和數據集種類(lèi)復雜、數據量大的特征,隨著(zhù)模型參數和數據量的快速增長(cháng),對于存儲的大容量和擴展需求也迫在眉睫。

數據存儲產(chǎn)業(yè)需要進(jìn)行全方位的技術(shù)升級,通過(guò)在多源異構融合、數據高速傳輸、海量數據管理等方面持續創(chuàng )新,打造專(zhuān)業(yè)的生成式AI存儲產(chǎn)品與解決方案。

浪潮信息讓生成式AI智慧有數

浪潮信息是最早布局大模型的企業(yè)之一,打造了算力、算法、數據全棧的解決方案能力。在數據存儲領(lǐng)域,浪潮信息準確識別行業(yè)痛點(diǎn)、積極布局,經(jīng)過(guò)持續攻關(guān),在融合存儲架構、系統性能設計、數據全生命周期管理算法等方面不斷突破,打造出生成式AI存儲解決方案。

浪潮信息生成式AI存儲解決方案基于A(yíng)S13000融合存儲系統,可以支撐AIGC產(chǎn)業(yè)上中下游業(yè)務(wù)應用,并針對不同業(yè)務(wù)階段的數據存儲需求,提供熱溫冷冰四級存儲,實(shí)現數據在各級存儲間自動(dòng)流轉。用高性能節點(diǎn)形態(tài)來(lái)滿(mǎn)足數據訓練、數據推理兩個(gè)階段的高帶寬、低延時(shí)、高并行讀寫(xiě)性能存儲需求,用大容量節點(diǎn)形態(tài)來(lái)滿(mǎn)足數據采集、數據準備、數據歸檔三個(gè)階段的海量多元數據存儲需求,方案具備極致融合、極致性能、極致節能三大能力,以及熱、溫、冷、冰四級數據全生命周期存儲管理能力,助力生成式AI突破海量數據存力瓶頸,加速釋放數據的價(jià)值。

目前,浪潮信息生成式AI存儲解決方案已經(jīng)在全球領(lǐng)先的中文語(yǔ)言大模型“源1.0”中成功落地,面對千億級參數量和數據量帶來(lái)的挑戰,浪潮信息通過(guò)AS13000高吞吐并行存儲系統實(shí)現了多存儲協(xié)議互通、數據融合,利用全閃的極致性能,助力“源1.0”大模型實(shí)現了16天完成訓練的超高效率。國內AI獨角獸公司采用浪潮信息提供的并行文件存儲,承載5000億參數量的NLP語(yǔ)言類(lèi)大模型的數據集Token和CheckPoint文件,輕松應對大/小文件的讀寫(xiě)挑戰,配置AS13000全閃存儲集群,支持高性能RocE組網(wǎng)和GPU直通存儲功能,帶寬超過(guò)300GB、存儲性能超過(guò)350萬(wàn) IOPS,保證存儲集群的高可用與敏捷擴容。

面對生成式AI掀起的變革熱潮,誰(shuí)能掌握數字化變革的先機,誰(shuí)就能把握未來(lái)AI革命的致勝關(guān)鍵,而數據底座將成為千行百業(yè)創(chuàng )新變革的重要基石。浪潮信息存儲秉承“存儲即平臺”的產(chǎn)品理念,精耕數據存儲產(chǎn)品與解決方案,攜手合作伙伴,助力生成式AI在金融虛擬客服、圖片編輯設計、智能駕駛、跨模態(tài)檢索等場(chǎng)景的落地,激活數據要素新潛能,駕馭智慧化轉型新趨勢,在機遇與挑戰并存的新格局下,為行業(yè)轉型注入新價(jià)值、新動(dòng)能。(柯巖)

免責聲明:本文不構成任何商業(yè)建議,投資有風(fēng)險,選擇需謹慎!本站發(fā)布的圖文一切為分享交流,傳播正能量,此文不保證數據的準確性,內容僅供參考

關(guān)鍵詞:

相關(guān)內容

熱門(mén)資訊

国产福利萌白酱精品一区|国产成人久久精品流白浆|国产一级A级免费视频|久久综合亚洲鲁鲁五月天欧|欧美黑人巨大视频HD