Nvidia Turing架构
Turing架构是Nvidia继Pascal架构后于2018年新推出的架构,包括2080Ti等显卡均使用的是Turing架构。Turing架构相较于Pascal架构增加了Cuda Core的数量,引入了DLSS,GDDR6等新的技术。本文简要介绍Turing架构的新特性,性能以及和上一代架构Pascal的对比,选择Turing架构的主要原因是我刚好有一张2080Ti的显卡,并且使用其学习CUDA编程。因此选择从此架构作为落脚点,一步步深入揭开NVIDIA显卡的架构原理。
GPU硬件/软件架构

新特性
New Streaming Multiprocessor(SM)
- 添加了一条可以和floating-point指令通道同时执行的Integer的独立指令通道
- 将unify shared memory,texture caching和memory load caching整合为一体,提升了L1 cache的带宽和速率
RT Core
- SM里面加了一条专用的流水线(ASIC)来计算射线和三角形求交,可以访问BVH
Turing Tenor Cores
- 添加INT8和INT4精度模型
- Depp Learning Super Sampling
Second- Generation NVIDIA NVLink
…..
性能

Pascal VS Turing



参考