目前市场上的 NVIDIA 显卡都是基于 Tesla 架构的,分为 G80 、 G92 、 GT200 三个系列。 Tesla 体系架构是一块具有可扩展处器数量的处理器阵列。每个 GT200 GPU 包含 240 个流处理器( streaming processor,SP ),每 8 个流处理器又组成了一个流多处理器 (streaming multiprocessor,SM) ,因此共有 30 个流多处理器。 GPU 在工作时,工作负载由 PCI-E 总线从 CPU 传入 GPU 显存,按照体系架构的层次自顶向下分发。PCI-E 2.0规范中,每个通道上下行的数据传输速度达到了 5.0Gbit/s ,这样 PCI-E2.0 × 16 插槽能够为上下行数据各提供了 5.0*16Gbit/s=10GB/s 的带宽,故有效带宽为 8GB/s, 而 PCI-E 3.0 规范的上下行数据带宽各为 20GB/s 。但是由于 PCI-E 数据封包的影响,实际可用的带宽大约在 5-6GB/s ( PCI-E 2.0 ×16 )。 在 GT200 架构中,每 3 个 SM 组成一个 TPC ( Thread Processing Cluster ,线程处理器集群),而在 G80 架构中,是两个 SM 组成一个 TPC , G80 里面有 8 个 TPC ,因为 G80 有 128(2*8*8)