DDN A3I可擴展參考架構
時間:2022-03-24 15:12:02 | 來源:行業(yè)動態(tài)
時間:2022-03-24 15:12:02 來源:行業(yè)動態(tài)
企業(yè)AI系統(tǒng)市場最初由Pure建立,Pure將AIRI(https://www.theregister.co.uk/2018/03/27/pure_nvidia_ai_airi/)的FlashBlade陣列與DGC-1雙響炮結合在一起。后來NetApp攜其A700全閃存陣列/ FGX-1組合加入該市場,后來又推出更快的A800/ DGX-1裝置(https://www.theregister.co.uk/2018/08/03/netapp_a800_pure_airi_flashblade/)。戴爾EMC則推出人工智能完備解決方案(Ready Solution for AI):深度學習(https://www.theregister.co.uk/2018/08/07/dell_emc_ai_deep_learning/ ),思科也推出了C480 AI /機器學習服務器(https://www.theregister.co.uk/2018/09/10/cisco_ai_server_nvlinked_tesla_gpu/)。
所有這些系統(tǒng)都涉及到全閃存,DDN則擁有AI200和AI400全閃存系統(tǒng)以及混合閃存/磁盤AI7990。二者都運行DDN的Exascaler軟件,Exascaler是個基于Lustre的并行文件系統(tǒng)。
AI200是個容量高達360TB的24倍雙端口NVMe閃存驅動器,置于2U機箱內,以4 x EDR InfiniBand(EDR IB)或100Gbit / s以太網(100 GbitE)連接到DGX-1。AI200可提供高達20GB/秒的文件系統(tǒng)順序讀取吞吐量和超過100萬IOPS。
AI400使用相同的機箱,可提供高達40GB/秒的順序讀取吞吐量和高達300萬IOPS。AI400具有8個EDR InfiniBand端口或100GbitE端口,閃存容量與AI200相同。
而較大的AI7990則置于4U機箱內,回歸20Gb /秒的順序讀取性能,可提供高達700,000的IOPS。AI7990支持90 x 3.5英寸的插槽,可用于SSD和磁盤驅動器。最多可以有4個擴展機座,每機座有90個架,可提供高達5.6PB的容量。
DDN 的A
3I解決方案簡介可從網上下載(https://www.ddn.com/?wpdmdl=42534ind=1538608827207),簡介里提供了使用A
3I軟件的示例,例如Resnet-50和Resnet-152,Caffe GoogleNet,Inception V3 。
A
3I解決方案指南(http://www.ddn.com/?wpdmdl=42573ind=1538599065785)提供了Tensorflow,Horovod,TensorRT,Torch,PyTorch提供具有9 x DGX-1服務器和系統(tǒng)性能的AI200及其他AI框架的配置示例。