西班牙巴塞羅那2026年3月9日 /美通社/ -- 在2026年巴塞羅那世界移動(dòng)通信大會(huì)(MWC)華為產(chǎn)品與解決方案發(fā)布會(huì)上,華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁袁遠(yuǎn)正式發(fā)布華為AI數(shù)據(jù)平臺(tái)。該平臺(tái)融合知識(shí)生成與檢索、推理加速KV緩存、記憶萃取與召回、統(tǒng)一緩存管理器(UCM)等技術(shù),打通模型與商業(yè)價(jià)值之間的轉(zhuǎn)化鏈路。
盡管AI技術(shù)發(fā)展迅猛,但多數(shù)AI模型尚未深度融入核心業(yè)務(wù)。這一問(wèn)題的主要癥結(jié)在于行業(yè)更側(cè)重模型訓(xùn)練,而非推理環(huán)節(jié),而推理正是模型落地的關(guān)鍵。同時(shí),推理過(guò)程中存在的AI幻覺(jué)、響應(yīng)速度慢、吞吐量受限等痛點(diǎn),也亟待通過(guò)優(yōu)化數(shù)據(jù)處理能力來(lái)解決。
針對(duì)上述挑戰(zhàn),華為數(shù)據(jù)存儲(chǔ)正式推出"3+1"AI數(shù)據(jù)平臺(tái):
通過(guò)多模態(tài)無(wú)損解析與Token級(jí)編碼,將多模態(tài)資源轉(zhuǎn)化為高精度知識(shí),檢索準(zhǔn)確率超95%
對(duì)KV緩存進(jìn)行智能分層與管理,大幅擴(kuò)展上下文窗口,減少重復(fù)計(jì)算,使首令牌生成時(shí)間(TTFT)縮短90%,顯著提升AI響應(yīng)速度
可精準(zhǔn)提取歷史數(shù)據(jù)與經(jīng)驗(yàn),并積累為可召回記憶。該記憶機(jī)制讓模型越用越智能。
通過(guò)三級(jí)緩存對(duì)內(nèi)存數(shù)據(jù)進(jìn)行管理,實(shí)現(xiàn)對(duì)知識(shí)庫(kù)、KV緩存和記憶庫(kù)的智能調(diào)度。
在部署模式上,華為AI數(shù)據(jù)平臺(tái)提供兩種選擇:針對(duì)全新建設(shè)場(chǎng)景的一體機(jī)模式,基于OceanStor A800系統(tǒng)打造,可保障極致性能與靈活的擴(kuò)展能力;針對(duì)存量系統(tǒng)升級(jí)場(chǎng)景的獨(dú)立部署模式,采用"AI數(shù)據(jù)引擎節(jié)點(diǎn)+ OceanStor Dorado存儲(chǔ)"的架構(gòu),企業(yè)可通過(guò)新增數(shù)據(jù)引擎節(jié)點(diǎn)完成現(xiàn)有系統(tǒng)升級(jí),既保護(hù)了前期投資,又能實(shí)現(xiàn)業(yè)務(wù)的AI平滑轉(zhuǎn)型。
袁遠(yuǎn)表示:"華為將持續(xù)深化技術(shù)創(chuàng)新,以AI數(shù)據(jù)平臺(tái)為橋梁,推動(dòng)AI模型能力轉(zhuǎn)化為真正的商業(yè)價(jià)值。"
聯(lián)系人:Zoe Yin,電郵:yinzijun@huawei.com