滴滴云第一款GPU云服务器产品已经上线。主要针对机器学习、科学计算等场景设计,特别对深度学习在线Inference做了定制及优化。配置Intel Skylake架构CPU及Nvidia Tesla P4 GPU。滴滴云GPU云主机提供了多种CPU数量、内存容量的组合配置供选择。
在性能上,针对用户计算需求和场景进行了特殊的配置,和市场上同类型产品相比有独特的优势。评估GPU计算性能的方法很多,而对于深度学习,大量的矩阵乘应用于全连接层的前向及后向的实现中。
价格不到普通云厂商二分之一
在此,简单评估一下滴滴云P4产品的单精度矩阵矩阵乘,sgemm的性能。所用实现为目前比较高效的Nvidia cuBlas实现。测试程序选择了CUDA 8 Samples内 batchCUBLAS。测试中对比了某普通云厂商的ecs.gn5i-c2g1.large产品,这款产品同样配置了2个CPU以及1个P4 GPU。
不同于普通云厂商的P4产品,滴滴云产品做到了开箱即用。购买实例登录后,GPU驱动,CUDA都默认装好。而在普通云厂商购买这款产品后,需要自行安装CUDA。滴滴云此过程可省略。
上图为batchCUBLAS单精运行结果,本次测试中选择矩阵m,n,k大小均为1024,在单次内核调用及多次调用的测试中,滴滴云的性能均超过了普通云厂商产品。
同时,此款滴滴云GPU产品每小时按量付费售价只有3元,不到普通云厂商价格的二分之一。提供高性价比的云计算资源是滴滴云提供给客户的核心价值之一。
适用于AI应用、音视频处理、科学计算
滴滴云GPU服务器的应用场景包括:
AI应用:各种基于深度学习前向应用场景,诸如图像、语音识别、NLP、检索等。
视频音频处理:超高清的4K视频转码,直播美图美颜,多人视频会议。
科学计算:气象预测、基因工程、粒子物理、程序化交易、CAE、EDA等领域。
滴滴云GPU云服务器
具有超高性价比,较同类产品价格优势明显,适用于图像处理、浮点高性能计算、视频解转码、深度学习推理/预测设计等领域。
用户评论(3)
这个性价比太有吸引力了
哈哈,已经用上了,谢谢
您好,请问您使用 batchCUBLAS测试多卡的浮点性能了吗?