Products/产品中心

加速计算及数字化服务专家

您当前位置> 首页 > 产品中心 > GPU 专业卡

产品中心/Products

NVIDIA Tesla T4
为 TensorRT 超大规模推理平台赋能

T4-1.jpgNVIDIA Tesla T4 GPU

搭载NVIDIA Turing Tensor Core的T4 技工革命性的多精度推理性能,以加速现代人工智能的各种应用。T4封装在节能的小型70瓦PCIe中,可针对横向扩展服务器进行优化,并且旨在实时提供先进的推理。

适用于所有AI推理工作负载T4搭载Turing Tensor Core核心,能够提供革命性的多精度推理性能,以加速各式各样的现代AI应用程序。

训练

搭载NVIDIA Tesla 的服务器借助强大的性能将深度学习训练时间从几个月缩短到几个小时。Turing Tensor核心技术具有多精度计算特性,实现了从FP32、FP16到INT8以及INT4精度的突破性AI技能。与CPU相比,他的训练性能提高9.3倍。

推理

Tesla T4有着突破性的推理性能,引入革命性的Turing Tensor Core技术,具备人工智能推理的多精度计算性能。从FP32、FP16到INT8,又到INT4精度,T4的性能比CPU高出40倍,实现性能的重大突破。

搭载Turing Tensor指数性能飞跃

高速、高吞吐量推理需要依赖强大的平台。NVIDIA Tesla T4 GPU是强大的加速器,适用于所有AI推理工作负载T4搭载Turing Tensor Core核心,能够提供革命性的多精度推理性能,以加速各式各样的现代AI应用程序。

显著节省成本

要使服务器保持多的生产效率,数据的中心管理者需要在性能与效率之间进行权衡。小巧的70瓦外形设计让T4针对可扩展服务器进行了优化,能效相比CPU提高了50倍之多,大大降低了运营成本。对于深度学习推理应用程序和服务而言,一台NVIDIA Tesla T4服务器可取代多台通用CPU服务器,从而降低能耗并节约购置和运营成本。

通用加速器

NVIDIA T4数据中心GPU是适用于分布式计算环境的通用加速器。革命性的多精度性能可加速深度学习训练和推理、视频转码和虚拟桌面。T4支持所有AI框架和网络类型,性能强劲,效率超群。

可实现强大的视频转码性能

随着在线视频的数量呈指数级增长,人们对有效搜索以及从视频中获取洞察力的结局决方案的需求也与日俱增。Tesla T4为人工智能视频应用提供具有突破性的性能,其专用的硬件转码引擎将解码性能提升至上一代GPU的两倍。T4可以解码多达38个全高清视频流,从而可以轻松地将可扩展的深度学习集成到视频管线中,以提供创新的智能视频服务。NVIDIA Tensor RT是高性能推理平台,其中包括优化器、运行时引擎和推理服务器,专用于在生产环境中部署应用程序。相较于CPU系统,Tensor RT至多可将视频流、推荐系统和自然语言处理应用程序的运行速度提升40倍。

先进的实时推理

响应性是提高用户参与度的关键,范围涉及诸多服务,例如:会话式人工智能、推荐系统和可视化搜索。随着模型准确性和复杂性的提高,目前立即交付正确答案所需的计算能力也在呈指数级提升。Tesla T4可提供优于40倍的低延时吞吐量,进而可以实时满足更多的请求。

image.png