Pascal是英偉達公司于2016年推出的新一代GPU架構,用于接替上一代的Maxwel架構。
Pascal GPU內含1500億個由16納米FinFET制造工藝打造的晶體管,是FinFET芯片。
Pascal能讓普通計算機變身為超級計算機,包括可為HPC工作負載提供超過5萬億次的雙精度浮點運算能力。在深度學習方面,與當代GPU架構相比,搭載Pascal架構的系統使神經網絡的訓練速度提高了12倍多(將訓練時間從數周縮短為數小時),并且將深度學習推理吞吐量提升了7倍。
Pascal是率先集成了革新性的英偉達 NVLink?高速雙向互聯的架構。此技術能跨越多個GPU擴展應用程序。
Pascal架構將處理器與數據封裝到一起,采用HBM2的CoWoS?(晶圓基底芯片)技術采用創新型內存設計方法,可提供高于NVIDIA 麥克斯威(上海)商貿有限公司?架構3倍的顯存帶寬性能。
概述
Pascal是Maxwell的接替者,增強了異步計算功能實現硬件層了對DirectX API的更高版本(DirectX 12 Feature Level 12_1 )的支持。除了架構上的改進,還使用了更好的16nm FF+工藝(對比Maxwell所使用的28nm),晶體管密度和性能大幅度提升,功耗發熱進一步降低,高端產品還配備帶寬更高的HBM2顯存,性能和能耗比都有了很大提升。
關鍵技術
臺積電 16nm FF+工藝
英偉達? NVLink? 高速互連技術
HBM2 第二代3D堆棧式高帶寬內存
依靠Async shaders從硬件層面完整實現AsyncCompute
支持DirectX 12 Feature Level 12_1
架構
Pascal的GPC有6個SM,每個SM只含有64個CUDA Core,但是擁有64個FP32單元32個FP64單元,FP64與FP32比例達到了1:2,雙精度性能大幅度提高,而Pascal的FP32單元可以同時執行2個FP16半精度運算,因此FP16浮點性能也同樣獲得極大提升。
產品
GeForce系列游戲顯卡
GTX1050、1050Ti、1060(3G, 5G, 6G)、1070、1070Ti、1080、1080Ti等
QUADRO系列專業顯卡
GP100、P6000、P5000、P4000、P2000、P1000、P600、P400等
Tesla系列加速計算卡
P100、P4、P40
NVS系列多顯示器商用顯卡
暫無Pascal產品
TITAN顯卡
TITAN Xp
參考資料 >
GPU 選擇 深度學習 圖像識別.CSDN博客.2024-03-14
NVIDIA Pascal 架構.NVIDIA.2024-03-14
NVIDIA新Pascal發飆:完整支持異步運算.網易.2018-06-25
工藝大提升:Nvidia全新GPU架構Pascal曝光.IT之家.2018-06-25
NVIDIA 發布全球首例高速 GPU 互聯技術.環球網.2018-06-27
NVIDIA 2016年推Pascal架構GPU:32GB顯存,TB/s帶寬.快科技.2018-06-25
Nvidia連發六款Pascal專業卡:旗艦搭載16GB HBM2顯存.IT之家.2018-06-25