硬件
ROG Strix RTX 4080爲例:
- 供電接口:8pin接口,單個提供225w供電,高功耗可使用多個
該4080提供6個供電接口:
還有背插顯卡,無需外接供電,需搭載特定主板和轉接頭使用:
- 散熱模組由:風扇、鰭片、熱管、均熱板組成
熱管利用汽熱轉換傳遞熱量
- 電路板結構,其中gpu芯片由nvdia、amd、intel三家供應
AIC廠商(如華碩)完成電路板與散熱的設計和生產
- 視頻接口,對外傳輸圖像
- PCIe接口,與主板、cpu、內存等元器件交互,如PCIe4.0單通道傳輸速率爲2GB
- 供電模塊:核心PWM、電容、MOS管、現存PWM、電感組成
-
顯存的總帶寬(每秒傳輸的數據量)由頻率、位寬、倍增係數決定的
- 頻率:每秒傳輸多少個週期
- 位寬:一次(週期)可以傳輸的數據量
- 倍增係數:發揮多少倍性能
-
顯卡的gpu核心
-
SM流式多處理器,負責幾乎所有的圖形運算,例如由76顆SM計算單元,每組SM單元中由128個流處理器,共9728個流處理器(也叫做CUDA核心),【處理器個數越多、頻率越高,性能越強】,若每組看成一個核心,就相當於76個核心,9728個線程的處理器,顯卡核心數量決定算力。
- nvidia ada-lovelace架構,459億顆晶體管
- 顯卡更適合做簡單的四則運算
三角面的頂點座標(x,y,z),用32位的二進制表示,也叫做單精度浮點數(FP32)
每秒能計算的次數就是單精度浮點算力,用於衡量圖形渲染的性能。
GPU對比CPU更加適合圖形渲染
一個CUDA核心能支持FP32計算,也能向下兼容半精度FP16計算。
gpu的效率也和設計架構有關。
架構不同,性能也不同。
- 單精度浮點算力和架構決定了gpu的遊戲性能。
用於AI
CUDA核心的旁邊是第4代Tensor Core張量核心,適合做AI相關的深度學習計算,如AI繪圖軟件可以調用Tensor Core,生成圖片的速度比純CUDA快。
- 主流顯卡TimeSpy跑分天梯圖
- 主流AIC廠商
- 顯卡子型號