首页 > 资讯 > > 正文

微软上线生成式虚拟机，首都在线布局已久。

来源：韭研公社时间：2023-08-08 13:24:59

IT之家 8 月 8 日消息，微软今年 3 月和英伟达合作，宣布推出 Azure ND H100 v5 VM 虚拟机预览版；经过数月的测试之后，微软今天正式推出该虚拟机，帮助企业更高效处理生成式 AI 任务。

IT之家此前报道，ND H100 v5 VM，是 Azure 迄今更强大和高度可伸缩的 AI 虚拟机系列。

该虚拟机支持的按需配置可达 8 至上千个通过 Quantum-2 InfiniBand 网络互连的 NVIDIA H100 GPU，使得 AI 模型的性能明显提高。相较上一代 ND A100 v4 VM，本次推出的虚拟机包含以下创新技术：8 块 NVIDIA H100 Tensor Core GPU，通过下一代 NV Switch 和 NV Link 互连。在无阻塞胖树网络中，每个 GPU 搭载 400 Gb / s NVIDIA Quantum-2 CX7 InfiniBand 和每 VM / s 的性能。每个 VM 中的 8 块本地 GPUs 之间通过 / s 对分割带宽的 NV Switch 和 NV Link 互联。第四代英特尔至强可扩展处理器。PCIE 第 5 代主机到 GPU 互连，每个 GPU 带宽为 64Gb / s。16 信道的 4800 MHz DDR5 内存。新的虚拟机使用 NVIDIA 的 NVIDIA Tensor Core H100 GPU 和 NVIDIA Quantum-2 InfiniBand 网络，当前仅限于美国东部和西部 Azure 企业访问。

【资料图】

微软补充说，公司正在努力在明年为其虚拟机添加数十万块新的 GPU。微软正式宣布该 Azure 虚拟机之外，还宣布扩展其 Azure OpenAI 服务，在加拿大东部、美国东部 2（East United States 2）、日本东部和英国南部地区上线。

微软表示 Azure OpenAI 服务客户已经超过 11000 名，本季度平均每天吸引 100 名新客户。微软还补充说，ChatGPT AI 平台最强大的版本 GPT-4 也将适用于新的 Azure OpenAI 服务区域。

300846首都在线

公司是一家覆盖全球的云计算服务解决方案提供商，专注于为行业用户提供低延时、高算力、安全存储为核心竞争力的存算一体、云网融合、云边协同的云计算服务。在GPU算力领域，公司率先建立大规模、高覆盖的GPU算力资源池，于2021年底启动GPU算力资源池的建设计划。2021年，公司积极推动泛渲染产品落地，实现了GPU的裸金属服务，可提供从单卡到八卡多种规格的物理服务器租用服务，推出了GPU卡直通的虚拟机产品，同时，根据渲染客户的需要，推出了行业内首个高速NAS云盘产品，单目录最高可达到200Gb带宽和50万IOPS。同时，针对GPU服务器的特殊性，自主开发了自研管理芯片及配套的管理系统，完善了边缘云节点的实施效率及运营能力，初步实现了面向视觉计算行业的泛渲染异构算力公有云平台。

公司的CDS首云异构算力平台，主要面向以GPU算力为主的业务场景，既包括了以深度学习、AI计算、超算为主的算力业务，也覆盖了以影视渲染、实时渲染、云游戏、XR等视觉计算需求。
2023年3月15日，首都在线与燧原科技正式签署AIGC生态共创计划合作协议，双方通过首都在线云计算平台与燧原科技AI算力平台的强强联合，共同聚焦打造全面的AIGC生态圈，将重点针对大模型MaaS（Model-as-a-Service）展开联合攻关。同时，燧原科技以现在部署于首都在线的算力基础设施为首发，结合其过往五年积累的大模型推理与训练深度落地经验，正式对外推出基于云燧i20支撑的AIGC实时推理应用。

关键词：