OneFlow和寒武紀達成適配,共同推進新一代超大模型訓練解決方案
近日,一流科技OneFlow深度學習框架正式和寒武紀思元270智能芯片及加速卡達成適配。這一合作達成,標志著OneFlow新一代深度學習框架的生態(tài)進一步得到完善,與新興AI芯片進一步融合。

目前 OneFlow 通過集成寒武紀的高性能機器學習庫,已經(jīng)支持主流神經(jīng)網(wǎng)絡算子,并能支持在各類應用場景下的模型部署,如分類、檢測、分割、風格轉化等模型。下一步,雙方將持續(xù)深化合作,以“大規(guī)模分布式”為目標,積極探索OneFlow深度學習框架和寒武紀其他產(chǎn)品的打通,豐富訓練模型和應用場景。
一流科技的OneFlow深度學習框架被稱為“新一代深度學習框架”,其核心優(yōu)勢在于用幾行代碼就可以完成其他深度學習框架需要深度定制才能做到的“超大規(guī)模分布式模型訓練”。OneFlow秉承“效率為王”的開發(fā)理念,擁有完全自主知識產(chǎn)權,所有代碼全部自研。獨創(chuàng)的自動數(shù)據(jù)模型混合并行、靜態(tài)調(diào)度、去中心化和全鏈路異步流式執(zhí)行四大核心技術,使用純軟件技術完美地解決了大數(shù)據(jù)、大模型、大計算所帶來的異構集群分布式橫向擴展挑戰(zhàn),技術水平世界領先。在由中國信通院發(fā)布的《首輪開源深度學習軟件框架測試報告》中,OneFlow深度學習框架在同樣的算法和硬件條件下性能指標大幅領先國外產(chǎn)品。

寒武紀思元270集成了寒武紀在芯片架構領域的一系列創(chuàng)新性技術,基于16nm先進工藝制造,處理非稀疏深度學習模型的理論峰值性能提升至上一代MLU100的4倍,達到128TOPS(INT8),同時兼容INT4和INT16運算,理論峰值分別達到256TOPS和64TOPS,并支持浮點運算和混合精度運算。思元270采用寒武紀自研的MLUv02指令集,可支持視覺、語音、自然語言處理、傳統(tǒng)機器學習等高度多樣化的人工智能應用,同時集成了面向視覺應用的視頻和圖像編解碼硬件單元。在系統(tǒng)軟件和工具鏈方面,思元270繼續(xù)支持寒武紀Neuware軟件工具鏈,方便開發(fā)者更好地挖掘思元270的運算能力和開拓更多的應用領域。

隨著數(shù)據(jù)量級的增長,超大模型訓練已經(jīng)成為業(yè)界共同的訴求,對此,一流科技CEO袁進輝表示:“寒武紀是新興人工智能芯片的領軍企業(yè)之一,很高興雙方可以達成合作。超大模型訓練不是單一技術可以解決的問題,需要算法、算力、數(shù)據(jù)“三駕馬車”的齊頭并進,軟件和硬件的結合是非常重要的。OneFlow作為新一代深度學習框架,從誕生之初就以“大模型分布式”作為設計理念,我們希望通過和像寒武紀這樣優(yōu)秀的硬件合作伙伴共同進行生態(tài)建設,來滿足開發(fā)者和算法科學家對超大模型的應用需求,加快企業(yè)數(shù)據(jù)資產(chǎn)轉化,促進人工智能應用場景落地。”
寒武紀副總裁劉道福表示:“寒武紀做芯片的最終目的是支撐客戶以及開發(fā)者開發(fā)應用,構建完整的生態(tài)。寒武紀自成立起就一直秉承開放的理念,與產(chǎn)業(yè)鏈上下游通力合作,共同促進整個AI產(chǎn)業(yè)的生態(tài)繁榮。此次與一流科技完成MLU270的軟硬件適配,既契合了寒武紀的開放生態(tài)戰(zhàn)略,又將進一步賦能寒武紀云邊端一體、軟硬件協(xié)同、訓練推理融合的新生態(tài),寒武紀將攜手一流科技以及各行各業(yè)為整個AI行業(yè)貢獻更大的動能。”



















