微软上线生成式虚拟机,首都在线布局已久。

IT之家 8 月 8 日消息,微软今年 3 月和英伟达合作,宣布推出 Azure ND H100 v5 VM 虚拟机预览版;经过数月的测试之后,微软今天正式推出该虚拟机,帮助企业更高效处理生成式 AI 任务。

IT之家此前报道,ND H100 v5 VM,是 Azure 迄今更强大和高度可伸缩的 AI 虚拟机系列。

该虚拟机支持的按需配置可达 8 至上千个通过 Quantum-2 InfiniBand 网络互连的 NVIDIA H100 GPU,使得 AI 模型的性能明显提高。相较上一代 ND A100 v4 VM,本次推出的虚拟机包含以下创新技术:8 块 NVIDIA H100 Tensor Core GPU,通过下一代 NV Switch 和 NV Link 互连。在无阻塞胖树网络中,每个 GPU 搭载 400 Gb / s NVIDIA Quantum-2 CX7 InfiniBand 和每 VM / s 的性能。每个 VM 中的 8 块本地 GPUs 之间通过 / s 对分割带宽的 NV Switch 和 NV Link 互联。第四代英特尔至强可扩展处理器。PCIE 第 5 代主机到 GPU 互连,每个 GPU 带宽为 64Gb / s。16 信道的 4800 MHz DDR5 内存。新的虚拟机使用 NVIDIA 的 NVIDIA Tensor Core H100 GPU 和 NVIDIA Quantum-2 InfiniBand 网络,当前仅限于美国东部和西部 Azure 企业访问。


【资料图】

微软补充说,公司正在努力在明年为其虚拟机添加数十万块新的 GPU。微软正式宣布该 Azure 虚拟机之外,还宣布扩展其 Azure OpenAI 服务,在加拿大东部、美国东部 2(East United States 2)、日本东部和英国南部地区上线。

微软表示 Azure OpenAI 服务客户已经超过 11000 名,本季度平均每天吸引 100 名新客户。微软还补充说,ChatGPT AI 平台最强大的版本 GPT-4 也将适用于新的 Azure OpenAI 服务区域。

300846首都在线

公司是一家覆盖全球的云计算服务解决方案提供商,专注于为行业用户提供低延时、高算力、安全存储为核心竞争力的存算一体、云网融合、云边协同的云计算服务。 在GPU算力领域,公司率先建立大规模、高覆盖的GPU算力资源池,于2021年底启动GPU算力资源池的建设计划。2021年,公司积极推动泛渲染产品落地,实现了GPU的裸金属服务,可提供从单卡到八卡多种规格的物理服务器租用服务,推出了GPU卡直通的虚拟机产品,同时,根据渲染客户的需要,推出了行业内首个高速NAS云盘产品,单目录最高可达到200Gb带宽和50万IOPS。同时,针对GPU服务器的特殊性,自主开发了自研管理芯片及配套的管理系统,完善了边缘云节点的实施效率及运营能力,初步实现了面向视觉计算行业的泛渲染异构算力公有云平台。

公司的CDS首云异构算力平台,主要面向以GPU算力为主的业务场景,既包括了以深度学习、AI计算、超算为主的算力业务,也覆盖了以影视渲染、实时渲染、云游戏、XR等视觉计算需求。
2023年3月15日,首都在线与燧原科技正式签署AIGC生态共创计划合作协议,双方通过首都在线云计算平台与燧原科技AI算力平台的强强联合,共同聚焦打造全面的AIGC生态圈,将重点针对大模型MaaS(Model-as-a-Service)展开联合攻关。同时,燧原科技以现在部署于首都在线的算力基础设施为首发,结合其过往五年积累的大模型推理与训练深度落地经验,正式对外推出基于云燧i20支撑的AIGC实时推理应用。

关键词:

下一篇: 最后一页

相关新闻

精彩推送