9月18日消息,亚马亚马逊云科技宣布由英伟达H200 GPU提供支持的科技可用 Amazon Elastic Compute Cloud P5e(Amazon EC2 P5e)实例现已正式可用。 据了解,实例黄冈市某某商贸厂亚马逊云科技是正式首个将英伟达H200 GPU用于生产环境的领先云提供商。与基于英伟达H100 GPU的亚马Amazon EC2 P5实例相比,Amazon EC2 P5e实例GPU内存容量提升1.7倍,科技可用GPU内存宽带提升1.5倍。实例Amazon EC2 P5e非常适用于复杂的正式大型语言模型(LLM)和多模态基础模型(FM)的训练、微调和推理,亚马黄冈市某某商贸厂用于支持最苛刻和计算密集型的科技可用生成式AI应用,如问答、实例代码生成、正式视频和图像生成、亚马语音识别等。科技可用 据悉,实例Amazon EC2 P5e实例提供8个英伟达H200 GPU,具有1128GB高带宽GPU内存,同时提供第三代AMD EPYC处理器,2TB系统内存和30TB本地NVMe存储。Amazon EC2 P5e实例还提供3,200 Gbps的聚合网络带宽并支持GPUDirect RDMA,从而能够绕过CPU进行节点间通信,实现更低的延迟和高效的横向扩展性能。 Amazon EC2 P5e实例现已可通过Amazon EC2 Capacity Block for ML工具访问并在美国东部(俄亥俄州)区域正式可用。 此外,亚马逊云科技还宣布,将推出Amazon EC2 P5en实例,通过将英伟达H200 GPU与定制的第四代英特尔Xeon可扩展处理器相结合支持PCle Gen5,将提供高达四倍的CPU和GPU之间的带宽,降低网络延迟,进一步提高工作负载性能。(咸咸) 延伸阅读 |