數位生活主圖

Nvidia顯示晶片新旗艦GTX 200系列--特色介紹

推文到網路: 加入Twitter 加入facebook 加入plurk

CNET 特約作者/ J.C 2008/08/06 11:19

今年的確是顯示晶片改朝換代的時間點,二大顯示晶片製造商都在今年中推出新一代的產品,並且不約而同的在台北國際電腦展前後推出。

其中AMD推出的RV770 ( HD 4870 / HD 4850 ),已經在之前的文章做過相關的介紹與效能實測,這次則要分二次來介紹Nvidia的新產品,同樣先介紹新產品的架構,後續則是效能實測部分。

[延伸閱讀] AMD與Nvidia交鋒,新一代繪圖晶片各行其道 ATI Radeon HD 4800系列繪圖晶片--特色介紹篇 效能實測篇

GeForce GTX 280是Nvidia新一代的顯示晶片

Nvidia這次推出的晶片代號為D10U與GT200,正式名稱則是GeForce GTX200系列,現在有二款產品,分別是GTX280與GTX260。在Nvidia推出GeForce 9系列產品後,大家都在想下一代產品的命名方式,沒想到數字變小了,讓熟悉Nvidia晶片的人有些不習慣。

GTX200系列晶片與過去的產品相較,其設計、複雜度及晶片尺寸堪稱是Nvidia產品之最。它有幾個主要設計目標,如擁有二倍8800GTX的效能、提升用電效率及更好的電源管理能力、加強CUDA應用與物理運算能力…等等。

總而言之,更高的效能,不論是遊戲3D或是視訊處理,GTX200系列都能提供最好的表現。在這些目標設定下,的確造就了如同怪物般的新顯示晶片。

不管顯示晶片內部架構如何的改變,最主要就是要能滿足使用者的需求,以目前的應用來說,購買高階顯示卡的主要著重點,還是在遊戲軟體的支援上。遊戲效能與購買成本擁有最佳比例時,將會在市場上較為歡迎。

除此之外,附加的視訊處理能力,亦是近來大家所重視。尤其是高畫質視訊所採用的H.264、VC-1等編解碼能力,對於播放藍光影片有很大幫助。至於其它的應用方式,除非是讓一般使用者有用,否則也只能滿足數量稀少的需求。

GTX200的內部架構


▲ GTX200系列晶片內部區塊說明

GTX200是Nvidia第二代Unified Shader架構設計的產品,據官方的資料表示,它所改善的設計,效能將比GeForce 8、9系列產品平均高上1.5倍。GTX200系列顯示晶片目前仍採用台積電65nm製程所製造,內部的電晶體數量高達14億顆。

這個數量到底有多大,雙核心45nm的Core 2 Duo內部為4億1千萬顆,AMD的RV770則將近十億顆,如此就可以知道GTX200的複雜度有多高了吧。只是這麼複雜的設計,竟然還是使用65nm製程製造,使得晶片面積(575mm2)比RV770(260mm2)及45nm Core 2 Duo(107mm2)大了許多,耗電量也很驚人。


▲ GTX280(右)與Core 2 Duo處理器(左)的尺寸比較

還記得以前GeForce 8採用第一代的Unified Shader時的設計嗎?它在處理器內部設計了許多串流處理器(Streaming Processor)以擁有更好的平行運算能力。GTX200既然是第二代Unified Shader,它當然還是採用類似的設計,但是更為強大了。

在GTX200中,其為數眾多的串流處理器(SP)可分為不同的群組,首先是每八個SP組成一組多重串流處理器(SM,Streaming Multiprocessors),再將三個SM組成一組TPC,在圖形運算時TPC代表Texture Processing Cluster,若是應用於平行計算時,則代表Tread Processing Cluster。

由於Nvidia過往顯示晶片等級的設定,除了工作頻率不同之外,SP數量也有所差別,這與AMD產品僅有頻率差別是有所不同。以下我們就列出GTX200與之前產品在這部分的比較表格。

 
TPC數
每個TPC中SM數
每個SM中的SP數
SP數量總計
GeForce 8/9
8
2
8
128
GeForce GTX280
10
3
8
240

從名稱的差異上,我們知道GTX200擁有二種運算架構,分別是運用於繪圖計算的「圖形運算模式」,及利用它獨特的架構而做為「平行運算模式」。以下用圖形來表示二種模式時的運用差異。

圖形運算模式

在這個模式下,最上方是三種Shader(Geometry、Vertex、Pixel)控制及Setup/Raster,中間部分即是TPC,下方則是ROP(Raster Operations Processor)與記憶體連接介面。

這個方塊圖與前一代產品類似,因此這次並未在這部分解釋太多,當然內部有做更精細的調整,如浮點數精度提升,更高的記憶體頻寬、提升3倍 ROP效能、提高Shader到Texture比例、材質過濾效能…等等,提供遊戲玩家一個更高速、更真實的視覺效果。

平行運算模式

這是GTX200較特別的應用模式,可說是將繪圖引擎做另一種計算功能。在這個模式下,上方變成執行緒排程器(Thread Scheduler),中間為TPC,下方則是稱為Atomic(原子能)、材質快取(Tex Cache)及記憶體連接介面。

Atomic能夠對記憶體做快速的存取與修改,能夠有助於平行資料結構管理及運算。至於材質快取在這種模式下,主要是提升記憶體的存取效率及更高的記憶體讀寫頻寬。

在這個模式之下,TPC有了不同的使用方式,其中每個SM中都有其16K記憶體(Local Memory),可供內部的SP分享資料而不必到外部的記憶體做存取,提升整體的計算能力。

在運算時,TPC運用的是MIMD(Multiple Instruction, Multiple Data)架構,而SM則是採用SIMT(Single Instruction Multiple Thread),從SIMD改良而來的SIMT擁有更好的效能與更容易的可程式化能力。在這樣的方式下,每個SM可以建立、管理、排程與執行32組稱為Warps群組,而每個Warp又是由32個平行執行緒組成,因此GTX200就擁有極高數量的執行緒平行運算能力。


▲ 每一個TPC內部的構造方塊圖

「平行運算模式」其實是GTX200此次推出特別強調的特性,可讓它當成是通用型處理器(GPGPU),在軟體的支援下,使用在一些特別應用上,如視覺運算、科學運算等。在某些應用軟體下,將會有比使用中央處理器提高數十倍,甚至上百倍的計算能力。

如此特別的計算能力,一般使用者用到的機會似乎不高,唯一比較常用到的機會可能是在HD視訊的壓縮吧。若是在支援GTX200運算的視訊處理軟體時,就能大幅縮短運算時間。

GTX200的其它特點

在GTX200的架構當中,浮點數精度的提升是一個重大的改變,它採用了雙精度的64位元浮點運算能力,讓高階的科學、工程與金融應用提供高精確度的運算結果。

在其內部中,每個SM可以當作一個雙精度64位元浮點運算處理單元,在GTX200中最高就擁有30個浮點運算處理器。全部的運算能力將相當於一個八核心的Xeon處理器,即90 Gigaflops!

在Nvidia合併了Ageia取得其物理運算技術後,在GeForce 9產品中開始提供PhysX物理運算能力,讓支援這項技術的軟體得以發揮最好的效能。在GTX200系列上,當然還是有提供PhysX的技援能力。至於Direct3D的支援上,它仍然僅支援DirectX 10.0,尚不支援DirectX 10.1。

運算核心效能的提升,當然也要搭配高速記憶體以滿足其資料來源及結果的需求。GTX200擁有高達512位元的記憶體介面,或是說八組64位元的記憶體介面,記憶體容量可達1GB。目前GTX200搭配GDDR3記憶體,工作頻率最高可達1.1GHz。

至於電源管理部分,GTX200擁有更多動態及彈性的電源管理能力,它擁有四種電源/效能模式,分別為:

1. 閒置或是2D運算,大約為25W。
2. 藍光、DVD播放模式,大約35W。
3. 3D全速運算模式,隨著效能改變,最高大約236W
4. Hybrid Power模式,可完全關閉顯示卡,此時為0W。

GTX200系列兩款晶片的比較表

  GTX280 GTX260
運算核心數(SP) 240 192
繪圖顯示頻率 602MHz 576MHz
處理器頻率 1296MHz 1242MHz
Texture單元數 80 64
ROPs 32 28
記憶體容量 1GB GDDR3 896MB GDDR3
記憶體工作頻率 1107MHz 999MHz
記憶體匯流排 512位元 448位元
最高功耗 236W 182W



  • 1.rickie888 於 2009/08/28 14:18 回應
  • it's a good componant for us....

留下你的意見(提醒:請開啟cookie,網頁會自動儲存您寫的內容。)
會員 * 帳號:
* 密碼:
  1. 欄位可選填,若全不填,則顯示為「匿名」。
  2. 不支援html語法
非會員 姓名:
E-Mail:
Blog:
  重新載入驗證碼
* 驗證碼: 記住我






CNET Towerboard 廣告