GTX 1070 Ti显卡紧急登场后,NVIDIA 16nm Pascal帕斯卡家族已经彻底完成历史使命,接下来的一代将是12nm Volta伏特。虽然游戏卡还要等到明年春,但在高性能计算领域,新架构新核心的Tesla V100早已经登场,并逐渐打开局面。
在此之前,Google部署了帕斯卡架构的计算卡Tesla P100,而现在,亚马逊则拥抱了新的Tesla V100,用于自家AWS云服务。
Tesla V100拥有5120个CUDA核心、640个Tensor辅助核心,面积达815平方毫米,集成了210亿个晶体管,浮点性能半精度30TFlops、单精度15TFlops、双精度7.5TFlops,Tensor深度学习性能则有120TFlops,搭配16GB HBM2高带宽显存。
相比之下, Tesla P100内置3584个流处理器,单精度浮点性能刚刚接近10TFlops,而且没有专长神经网络训练、推理的Tensor核心。
亚马逊采用了三种不同的方式部署Tesla V100,分别为单路、四路、八路(后两者采用NVLink总线互连),各搭配64GB、256GB、512GB系统内存。
免责声明:科技狗对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除:yzl_300@126.com