全国服务热线

浪潮信息对元脑SD200超节点AI服务器进行了大量的软硬件协同创新与优化,实现DeepSeek R1大模型单token生成速度低至8.9毫秒,带动国内AI服务器token生成速度进入“10毫秒时代”。

联想问天 WA7880a G3 是联想为超大规模数据中心研发的高性能AI 服务器,在 8U 的空间内支持2 颗 Intel 第四代或第五代 CPU 和8 颗国产 OAM AI 加速卡,通过 18 个 PCle5.0 插槽和多达 29 个硬盘插槽的支持,满足各种算力架构方案需求,进一步提升系统算力性能。可应用于大模型训练、大模型推理、科学计算等多种人工智能和高性能计算业务场景。

浪潮元脑R1推理服务器NF5688G8是基于浪潮信息全新一代AI超融合架构平台,面向超大规模数据中心的强劲性能、扩展人工智能服务器,算力密度6U空间内搭载1块NVIDIA Hopper架构HGX-8GPU模组,系统支持4.0Tbps网络带宽,支持FP8原生精度下单机部署DeepSeek 671B大模型。

浪潮元脑企智DeepSeek一体机NF5698A7服务器原生支持FP8计算引擎,以1536GB HBM3显存、5.3 TB/s 内存带宽实现了显存容量与通信效率的黄金组合,适配 DeepSeek R1模型“短输入长输出、显存带宽敏感”的技术特性,单机支持全量DeepSeek R1与V3模型推理情况下,仍保留充足的KV缓存空间。