頂點著色單元

頂點著色單元

頂點著色單元是顯示晶片內部用來處理頂點(Vertex)信息並完成著色工作的並行處理單元。頂點著色單元決定了顯示卡的三角形處理和生成能力,所以也是衡量顯示晶片性能特別是3D性能的重要參數。

基本介紹

  • 中文名:頂點著色單元
  • 外文名:Vertex shader unit
  • 套用:R520,GeforceFX,8條渲染管道
  • 用途:決定顯示卡的三角形處理生成能力
  • 衡量:3D性能的重要參數
  • 決定:顯示卡的三角形處理和生成能力
簡介,與渲染管線的區別,套用,ATi R520,Geforce FX,8條渲染管道,

簡介

頂點(Vertex)是圖形學中的最基本元素,在三維空間中,每個頂點都擁有自己的坐標和顏色值等參數,三個頂點可以構成成一個三角形,而顯示卡所最終生成的立體畫面則是由數量繁多的三角形構成的,而三角形數量的多少就決定了畫面質量的高低,畫面越真實越精美,就越需要數量更多的三角形來構成。頂點著色單元就是處理這些信息然後再送給像素渲染單元完成最後的貼圖工作,最後再輸出到顯示器就成為我們所看到的3D畫面。而顯示卡頂點處理能力不足,就會導致要么降低畫質,要么降低速度。
頂點著色單元頂點著色單元
在相同的顯示核心下,頂點著色單元的數量就決定了顯示卡的性能高低,數量越多也就意味著性能越高,例如具有6個頂點著色單元的GeForce 6800GT就要比只具有5個頂點著色單元的GeForce 6800性能高:但在不同的顯示核心架構下頂點著色單元的數量多則並不一定就意味著性能越高,這還要取決於頂點著色單元的效率以及顯示卡的其它參數,例如具有4個頂點著色單元的Radeon 9800Pro其性能還不如只具有3個頂點著色單元的GeForce 6600GT

與渲染管線的區別

渲染管線也稱為渲染流水線,是顯示晶片內部處理圖形信號相互獨立的的並行處理單元渲染管線的數量一般是以 像素渲染流水線的數量×每管線的紋理單元數量 來表示渲染管線的數量是決定顯示晶片性能和檔次的最重要的參數之一,在相同的顯示卡核心頻率下,更多的渲染管線也就意味著更大的像素填充率紋理填充率
頂點著色單元頂點著色單元

套用

ATi R520

R520,Radeon X1800將內建8個頂點著色單元。ATi上一代產品集成6個頂點著色單元,但是頂點數據從來不是整體性能的瓶頸。唯一受制於頂點著色的遊戲是3DMARK05,其它所有遊戲都受制於顯示卡的像素著色性能。
已經說過多次,R520內建16條像素著色流水線,ATi喜歡稱作是16條像素著色處理器。
頂點著色單元頂點著色單元
R520可以處理16個紋理,因為它有16個紋理單元。在1個時鐘周期內,可以渲染16個Render Back ends。
R520可以比較16個Z比較單元,在最佳化Z信息方面非常有用處。
R520是1個非常有可程式性的晶片,你可以在這個GPU上處理多達512個執行緒,這意味著,2個R520協同可以同時處理1024執行緒。Intel和ATi相信,這樣的執行緒編程性將給雙R520用戶更多的性能提升。

Geforce FX

Geforce FX圖形晶片支持AGP8x,系統處理器的頂點數據都是通過顯示卡的AGP匯流排傳輸到圖形晶片,進行渲染的過程,因此理論上來說,AGP匯流排的頻寬越大,通過的頂點數據量也就越多,進而加速圖形晶片的渲染過程。但是在實際套用當中,還沒有任何程式可以讓AGP匯流排的數據傳輸處於滿負荷狀態,相對於AGP4x來說,AGP8x對圖形晶片效能提升還無法做出什麼貢獻來,nVIDIA宣稱向GPU傳輸多股HDTV數據流可以讓2.1GB/s的AGP8x匯流排處於滿負荷的狀態。
為了滿足微軟DirectX 9.0對3D圖形晶片的要求,nVIDIA重新設計了Geforce FX核心頂點著色引擎電路。nVIDIA之前的Geforce4 Ti核心集成了2個頂點著色單元,這次的Geforce FX圖形晶片核心集成單頂點著色管線,由多個浮點處理器組成的巨型並行列隊組成。nVIDIA的這種設計類似於3DLabs P10圖形晶片採用的頂點著色架構,不過還不清楚Geforce FX核心單頂點著色管線由多少獨立的處理單元並行工作。
這些並行的浮點頂點處理單元具備專用的多執行緒指令集,並且nVIDIA對這些指令集進行了最佳化,最大限度地提升了圖形晶片的三角形吞吐量。nVIDIA宣稱Geforce FX的三角形生成速率達到了每秒3億7千5百萬個,稍微超過ATi Radeon 9700 Pro的三角形生成速率。不過,Geforce FX圖形晶片的工作頻率也要比Radeon 9700 Pro高出很多。
藉助Geforce FX核心集成的這種頂點著色架構,nVIDIA宣布Geforce FX支持DirectX 9.0當中2.0版本的頂點著色技術規範。實際上Geforce FX圖形晶片在許多方面已經超越了DirectX 9.0 2.0版本的頂點著色技術規範。Geforce FX圖形晶片能夠以比2.0版本VS更多的指令、更多的常數、更多的循環來處理頂點著色程式,在這方面,Geforce FX要強過ATi的Radeon 9700 Pro圖形晶片,Radeon 9700 Pro圖形晶片只支持到2.0版本的頂點著色技術規範。Geforce FX晶片在硬體層面上也集成了更多的暫存器,來支持超越2.0版本的頂點著色功能。
顯然,Geforce FX已經支持到了DirectX 9.0 2.0版本的頂點著色技術規範制定的所有標準。不過未來一年當中的遊戲可能還無法完全發揮Geforce FX在像素和頂點著色方面的優勢。即便是2003年即將上市的設計遊戲大作DOOM 3,大部分也是基於DirectX 8平台進行開發。充分使用到Geforce FX複雜的頂點像素著色功能的遊戲,可能要到2003年下半年末期才能出現。因此,單從紙面參數上來看,Geforce FX的效能要強過Radeon 9700 Pro不少,但是就遊戲來說,Geforce FX強大的技術規格並不能立即轉化成遊戲效能的提升

8條渲染管道

大多數完全支持微軟DirectX 9.0的3D圖形晶片都會集成8條像素渲染管線,如ATi之前推出的Radeon 9700 Pro,這次Geforce FX圖形晶片也不例外,在核心當中集成了8條128-bit完全浮點化的像素渲染管線。
這8條像素渲染管線耗費了Geforce FX大部分新增加的電晶體,也就是這8條像素渲染管線,使得電影級別的畫質和效果得以實現。和Radeon 9700 Pro一樣,Geforce FX圖形晶片在單周期當中,每條渲染管線只能處理一個紋理,因此和Radeon 9700 Pro相比,Geforce FX在填充率方面不具優勢,因此nVIDIA在Geforce FX的顯存控制部分下了功夫,來彌補渲染管線在紋理處理方面的不足,另外更高的主頻速度和整體較高的效率也參加了彌補的工作。和Radeon 9700 Pro一樣,Geforce FX對單像素最多可以處理16個紋理。
在像素著色方面,Geforce FX再次超前,其像素處理單元不僅僅符合微軟DirectX 9.0 2.0版本的像素著色技術規範的規定,更是超越了2.0版本的像素著色技術規範,為用戶提供了Pixel Shader 2.0+的技術功能,具體體現在為著色程式提供更多的指令上。
這裡,我們看到要完全發揮Geforce FX的像素著色功力的話,還要等上1年的時間。另外,Geforce FX支持的色彩精度也大大超過競爭對手。

相關詞條

熱門詞條

聯絡我們