JBTALKS.CC

标题: [转载]NVIDIA D10U繪圖核心GeForce GTX 280正式登場 [打印本页]

作者: GloOmY啊豪 时间: 2008-6-17 05:03 PM
标题: [转载]NVIDIA D10U繪圖核心GeForce GTX 280正式登場
NVIDIA D10U繪圖核心
GeForce GTX 280正式登場
文: Kopo Ko / 評測中心

NVIDIA 16 日宣佈推出第二代 Unified 架構繪圖產品，核心代號為 D10U ，並命名為 GeForce GTX 200家族，除核心提升至 240 個 Strreaming Processors ，且大幅改良微架構設計外，更首次加入 ParallelCompute 模式，進一步強化平行運算能力。究竟 NVIDIA 能否憑藉 D10U 核心再創高峰， HKEPC 編輯部找來 MSIGeForce GTX 280 繪圖卡，進行效能測試並深入分析優劣勢所在。

全新 GeForce GTX 200 家族正式發佈

NVIDIA 16 日正式發佈全新 GeForce GTX 200 家族，係為 NVIDIA 第二代 Unified架構產品，其目標不單是提供最強的 3D 繪圖效能，同時亦優化了平行運算能力，為非 3D 軟件提供硬件加速功能，並為繪圖核心加入Parallel Compute 模式，顯見 NVIDIA 繪圖卡產品已不再只定位於 3D 遊戲應用，而是擴大至一般應用軟件層面，並以「Two Personlities 、 One GPU 」作口號，與傳統 CPU 同場較勁。

為凸顯第二代 Unified Shader 引擎產品， NVIDIA 一改沿用已久的產品命名法則，產品階級不再以數字分別，改為 GTX 、GT 、 GS 及 G ，分別代表 Enthusiast 、 High-end performance 、 Mid-rangePerformance 及 Entry Market 。

GeForce GTX= Enthusiast
GeForce GT= High-end performance
GeForce GS= Mid-range performance ( 暫定 )
GeForce G= Entry ( 與 IGP 產品共用 )

接在產品階級後面是一組 3 位數字，分別代表著產品世代及型號，以 GeForce GTX 280 為例，即代表高階第二代 Unified 架構產品，型號為 80 。現時已得悉型號的區分如下︰

GTX= 260 through 290
GT= 230 through 250
GS= 210 through 220
G= 201 through 209

相較上代 GeForce 8 及 GeForce 9 高階產品， GeForce GTX 200 核心變得更為複雜，處理核心數目是上代的1.88x ，同一時間可處理的線程是上代的 2.5x ，加入 Double-Precision Floating-Point支援，擁有更快速的 Geometry Shading 處理能力， 512Bit 記憶體介面，更具效率的指令排序， NVIDIA再度大幅提升繪圖產品的性能，以捍衛得來不易的繪圖江山。

GeForce GTX200 家族核心代號為 D10U ， 6 月 16 日率先上市的是高階型號 GeForce GTX 280 ，定價為$649 美元，緊接著 6 月 26 日將再推出效能級型號 GeForce GTX 260 ，定價為 $399 ~ 449 美元。

[ 本帖最后由 real.gigaleon 于 2008-6-25 07:50 PM 编辑 ]

作者: GloOmY啊豪 时间: 2008-6-17 05:04 PM
D10U ︰ 240 個 Streaming Processors

NVIDIA 指出，全新 GeForce GTX 200 家族為第二代 Unified 架構，其效能約為上代 GeForce 8 及GeForce 9 高階產品的 1.5x ，核心代號為 D10U ，採用 65nm 制程，由台積電 (TSMC) 代工，內建 14億個電晶體，是現時內建電晶體最多、效能最高且最複雜的繪圖晶片。

D10U 繪圖核心與上代 G80 、 G92 相同，均採用 Scalale Processor Array (SPA)架構，即核心內建若干數目的 Texture Processing Clusters (TPC) ，每個 TPC 內擁有若干若數目的Streaming Multiprocessors (SM) ，而每個 SM 則擁有 8 個 Streaming Processor (SP)。

事實上，欲提升繪圖核心的運算能力，最直接的方法就是增加運算處理單元， D10U 擁有 10 個 TPC ，相比 G80 、 G92多出兩個，每個 TPC 內建的 SM 數目亦由 2 組變成 3 組，每組 SM 內建的 SP 數目保持為 8 個，因此， D10U 合計擁有240 個運算處理單元，較 G80 、 G92 高出 1.88x ，運算能力高達 933 GFLOPS 。

雖然號稱為第二代 Unified 架構，但 D10U 仍然不支援 DirectX 10.1 及 Shader 4.1 ，據 NVIDIA回應指，現時支援 DirectX 10.1 及 Shader 4.1 的遊戲絕無僅有，因此 NVIDIA 無意在現階段支援 DirectX10.1 及 Shader 4.1 ，直至市場開始對這項規格有一定需求，而且更不排除跳過 DirectX 10.1 及 Shader 4.1，直接研發下一個版本規格。

	G80 , G92	D10U
TPCs	8	10
SMs per TPC	2	3
SPs per SM	8	8
Total SPs	128	240

D10U ︰ 512Bit 、 1GB Framebuffer

D10U 的記憶體介面由 G80 的 384Bit ，提升至 512Bit ，由 8 組 64Bit 寬度組成，據 NVIDIA表示，提升記憶體介面寬度主因在於， D10U 核心架構擴大後需要再更新平衡記憶體頻寬，以支援現有及未來的負載，而 512Bit 是 D10U最有效率的規格設定。

不單是記憶體介面提升至 512Bit ， D10U 的 Memory Crossbar 亦進一步優化，以往執行 IndexedPrimitive Fetches 時， Front End 與 Data Assembler 會爭奪 Memory Crossbar控制，導致不必要的 Latency ，但新一代 D10U 的 Memory Crossbar 將不會出現此情況。

此外， NVIDIA 高階繪圖卡產品的 Framebuffer 將會提升至 1GB 容量，現今的 3D 遊戲為提升真實度，已使用大量不同的Textures ，包括採用 Normal maps 以提升物件表面的質感、 Cubemaps 提升反射、倒影效果及高像度Perspective Shadow 作 Soft Shadows 應用，意味著 3D 遊戲將使用更多 Framebuffer，因此提升容量是必然的，尤其是在啟動反鋸齒技術時更為顯著。

	G80	G92	D10U
Memory Interface	384	256	512
Default Framebuffer	768MB	512MB	1024MB

D10U ︰擴大內部 Buffer 容量

以往 GPU 面對較長的 Shaders 指令，會導致 Local Register 容量耗盡，需要採用外部記憶體作暫存，進而導致大幅度的Latency 。為令 D10U 在執行複雜且較長的 Shader 之際，能有更佳的執行效率， D10U 核心內建的 LocalRegister 大小是上代 G80 、 G92 的一倍。

據 NVIDIA 表示，增加 Local Register 容量僅會小幅增加 D10U 的 Die Size ，但卻能有效提升 Shader的執行效率。圖下為 NVIDIA 提供的 1x 及 2x Local Register 容量比較，在 3D Mark Vantage進行測試，可以看到明顯的效能增長。

另一方面， D10U 亦增加 Internal Output Buffer ，容量是上代 G80 、 G92 的 6x ，令 D10U擁有更高的 Geometry Shadering 及 Stream Out 效率。同時， D10U 提升了 Post-TransformCache 容量，此項改變有效減少 Geometry 與 Vertex Stage 之間的 Latency 。

作者: GloOmY啊豪 时间: 2008-6-17 05:05 PM
D10U ︰改良 Dual Issue 設計

NVIDIA G80 、 G92 的 Stream Processor 能在同一週期處理一次整數指令、 Floating Point運算或涵數運算，因此 G80 擁有 128 個 Stream Processor ，理論上在同一週期內最多能完成 128 筆資料及指令，另外，G80 加入了 Dual Issue 設計，當進行 MADD(Multiply-ADD) 運算時，則可同時多運算一組MUL(Multiply) 運算。

而新一代 D10U 進一步改良 Dual Issue 設計，當 SP 的 MAD Unit 在處理 MUL 與 ADD 的同時， SFUUnit 可以用相同的時脈處理另一組 MUL ，執行效率較上代 G80 、 G92 大幅提升，最高可達 93 ~ 94% 。

為令 Dual Issue 設計充分發揮， D10U 也更改微架構設計，包括 Register Allocation 、Instruction Scheduling 及 Instruction Issue ，這些改變令 SP 與 SFU 在 Dual Issue處理上盡情揮灑。

D10U ︰ 80 個 Texturing Unit 、 32 個 ROP

擁有 8 個 TPC 的 G80 ，內建 64 個 Texture Filtering Unit 及 32 個 TextureAddressing Unit ，因此，每次可處理 64 個 Pixels 的 Texture Filtering 、 32 個 Pixels的 Texture Addressing 、 32 個 Pixels 的 Anisotropic bilinear Filtering ，或32 個 8 Bit integer 、 16 Bit Floating Point 的 bilinear-Filtered Pixels 。

G92 也有明顯改良，其增至 64 個 Texture Addressing Unit ，令 Texture Addressing 及 8 Bit integer 的 bilinear-Filtered Pixels 處理能力提升至 64 個。

而 D10U 更進一步提升至 80 個 Texture Filtering Unit 及 Texture Addressing Unit，每次可處理 80 個 Pixels 的 Texture Filtering 、 80 個 Pixels 的 TextureAddressing 、 80 個 8 Bit Integer Bilinear-Filtered Pixels 、 40 個 Pixels的 Anisotropic Bilinear Filtering 或 40 個 16 Bit Floating Point 的bilinear-Filtered Pixels 。

此外， D10U 採用更高效率的 Scheduler 排序器，減少不必要的 Latency ，讓晶片的實際執行盡量貼近理論峰值，據 NVIDIA 表示，相較上代 G92 ，新一代 D10U 的 Texture Unit ，效率顯著提升約 22% 。

	G92	D10U
Heretical Bilinear Fillrate	33,600	51,840
Measured Rate	25,600	48,266
Real Performances	76.2%	93.1%
Source : NVIDIA , Complied by HKEPC Hardware , June 2008

ROP 數目方面， D10U 由上代的 G80 的 24 個提升至 32 個，令 D10U 的於高解像度及反鋸齒能力上更上一層樓， D10U可處理每筆 32 個 Pixels (4 pixel per POR Partition x 8 Partition) ，每個 ROPPartition 於 8x MSAA 模式最高支援 32 個 color 及 Z sample ，每個 ROP 內建 2 組Z/Stencil 運算單元，因此單一週期可處理高達 64 個 Stencil Shadow 運算。

此外， D10U 改變了 Z-Culling 效能，尤其是在高解像度方面，由 ZROP Unit 數目增加，令 Early-Z機制的效率有效拉升， D10U 的最高 ZROP cull rate 可達 256 Sample/clock 或 32pixels/clock 。

D10 vs. G80

	GeForce 8800GTX	GeForce GTX 280	Increase%
Core	128	240	87.5%
TEX	64t/clk	80t/clk	25%
ROP Blend	12p/clk	32p/clk	167%
GFLOPs	518	933	80%
Memory Bandwidth	86GB	142GB	65%
Texture Fill	37 GT/s	48 GT/s	29.7%
ROP Blend	7GBL/s	19 GBL/s	171%
Source: NVIDIA, Complied by HKEPC Hardware, June 2008

作者: GloOmY啊豪 时间: 2008-6-17 05:06 PM
D10U ︰新增 Parallel Compute 模式

現今的 GPU 已不再侷限於 3D 繪圖應用，從數學運算 (e.g. MATHLAB)、金融分析、醫學檢查、氣象預測、電子線路設計、生物分子結構分柝及光學模擬運算等專業領域，乃至影像編碼等一般應用程式，皆可運用 GPU進行硬體加速運算，未來應用勢將更為廣泛。

D10U針對平行運算進行了重大修正改變，除原有的Graphics模式，當應用於平行運算時，將改為Parallel Compute模式。Parallel Compute模式，是 D10U 為核心加入了硬體Thread Scheduler (線程排序器)，以及稱為「Atomic」的記憶體處理單元，且在每組SM內部加入Share Local Memory，而這也是首代Unified架構所未見的。

為提升平行運算效率， D10U 加入硬體 Thread Scheduler ，以保証核心的 SP 達至接近 100% 負載。上代Unified Shader 架構，當線程需要讀寫記憶體時，該組 SP 必須等待讀寫動作完成，才會執行其他指令，但 D10U 加入了硬體Thread Scheduler ，當線程需要等待讀寫記憶體， Thread Scheduler 會立即切換該組 SP 進行其他指令，不會讓SP 出現閒置情況。

另外， D10U 新增 8 個「 Atomic 」的記憶體處理單元，可執行極微密的記憶體讀、改、寫動作，並提供粒狀記憶體位置存取，為平行運算帶來更有效的架構管理。

D10U 亦強化了平行運算的記憶體讀寫效能，以往每組 TPCs 內建一組 L1 Cache ，讓 TPC 內每組 SM可共同分享資料，而不需要讀寫外部記憶體以提升效率。新一代的 D10U 更在每一組 SM 內建有 Local Memory ，讓每組 SM內的每個 SP 也能共同分享資料，令平行運算效率大大提升。

不僅如此， D10U 更可在平行運算模式下，將原用於 Texture 用途的 Texture Cache ，也變成平行運算的快速記憶體暫存，以提高記憶體頻寬及讀寫效率。

作者: GloOmY啊豪 时间: 2008-6-17 05:07 PM
D10U ︰可同時處理 30,720 Threads

據悉， NVIDIA Unified Shader 架構支援兩種不同的運算方式，其中針對整個 TPCs 下達執行指令，稱為 Multipleinstruction, multiple data (MIMD) 模式，另一種則是全新的 Single instruction,multiple thread (SIMT) 模式，直接向每個 SM 下達執行指令。

SIMT 運算模式大幅改善純 SIMD(Single instruction, multiple data)模式的執行效率，並且更易編程。值得注意的是， SIMT 不需像傳統 SIMD 模式需要設定 vector 寬度，令核心可以全速執行而不需要理會vector 的大小。

此外，傳統 SIMD 模式入的資料如果小於 MIMD 及 SIMD 寬度時，會減低執行容積，而 SIMT 模式則可以在任何情況下保持最大執行效率。

每個 SIMT 多線程指令最高可擁有 32 個平行線程，稱為一個「 warp 」， D10U 每組 SM 支援 32 個 warps ，即1024 個 Threads ，相比上代 G80 、 G92 每組 SM 僅支援 24 個 waprs ，即 768 個 Threads 。

如果把整顆 D10U 核心與上代 G80 、 G92 比較， D10U 最高可同時處理高達 30,720 個 Threads (1024 x3 x 10) ，相比上代 G80 、 G92 僅 12,280(768 x 2 x 8) ，吞吐量高出 2.5x 。

	G80 , G92	D10U
TPCs	8	10
SMs per TPC	2	3
Threads per SM	768	1024
Total Threads execute	12,288	30,720

D10U ︰支援 Double Precision

D10U 其中一個重要改良是加入了 Double Precision 雙精算及 64-Bit Floating Point 運算支援，鎖定高階科學、工程、財經運算軟件、以及需要高精確度的數學運算。

D10U 的每組 SM 包含了一個 Double Precision 64Bit Floating Unit ，而整顆核心則擁有 30 個。

這 30 個 Duoble Precision 64Bit Floating Unit 如同接上了保險絲的 MAD Unit ，能精確完成MAD 指令，並完全符合 IEEE 754R floating Point 規定，而 D10U 的 Double Precision效能等同於一顆 8 核心的 Xeon 處理器，高達 90 Gigaflops 。

D10U 與上代繪圖核心規格比較︰

	G80	G92	D10U
Fabrication Process	90nm	65nm	65nm
Number of Transistors	681 Million	754 Million	1.4 Billion
Processor Core	128	128	240
Memory Interface	384	256	512
Texture Filtering Unit	64	64	80
Texture Addressing Unit	32	64	80
ROPs	24	16	32
Source: NVIDIA, Complied by HKEPC Hardware, June 2008

作者: GloOmY啊豪 时间: 2008-6-17 05:07 PM
新二代 Unified 架構 MSI GeForce GTX 280 繪圖卡

圖為 MSI 推出的 GeForce GTX 280 繪圖卡，採用 NVIDIA P651 公板設計、高達 14 層 Layers PCB，繪圖卡尺寸為 4.376 x 10.50 inches 、 Dual Slot 設計，需要外接一組 6 Pin 及 8 PinPCI-Express 供電，產品最高功耗僅為 236W 。

GeForce GTX 280 繪圖核心為「 D10U-30 」，晶片印上 G200-300-A2 ，採用 65 奈米制程由 TSMC（台積電）代工，擁有 240 個 Unified Streaming Processor 、 80 個 Texture FilteringUnit 、 80 個 Texture Address Unit 及 32 個 Raster Operations Unit ，核心時脈為602MHz ， Stream Processor 部份為 1296MHz ，其運算效能高達 933 Gigaflops 。

GeForce GTX 280 繪圖核心支援 CUDA 2.0 運算平台，已可在 177.34 驅動程式使用， NVIDIA 已附有 BadaBOOM 視訊編碼軟件及 Folding@Home 等作示範，效果令人滿意。

此外， NVIDIA 在收購 PhyX 公司後，將會在下一版本驅動程式中加入 PhyX 物理運算支援，所有支援 PhyX 的遊戲將會被追加硬體物理運算加速。

顯示輸出方面， D10U 繪圖核心與 G80 相同，並未內建繪圖輸出單元，因此，須使用外置的 NVIO-2 顯示輸出晶片，支援雙Dual-Link DVI 及 7 Pins HDTV 輸出端子，與 NVIO-1 的主要分別在於新增 10-Bit Color 支援。

GeForce GTX 280 支援 HDMI 輸出，但需要配合 NVIDIA 專用的 DVI to HDMI Dongle ，由於 D10U並沒有像 ATI 內建音效 Codec ，因此用家仍需要透過外部 SP/DIF 接線，才能讓 HDMI 接口支援音效輸出。

值得注意的是， P651 預留了日後支援 Display-Port 輸出的佈局，在 PCB 上預留加入 Display-PortTransmitter 晶片的走線，不過 NVIDIA 表示，有鑑於市場上 DisplayPort 屏幕仍未普及，因此短時間內未規劃推出Display-Port 輸出版本。

GeForce GTX 280 採用 D10U-30 繪圖核心

( 左 ) 需採用 NVIO2 顯示輸出 ( 右 ) 留有 DisplayPort 走線，可加入 Transmitter 晶片

支援 512Bit 記憶體介面 -0.8ns GDDR3 記憶體

(左 )Qimonda HYB18H512321BF -1.0ns GDDR3 ( 右 ) 正背面合共 16 顆 GDDR3 顆粒

GeForce GTX 280 支援 512Bit 記憶體介面， P651 PCB 正背面合計 16 顆Hynix H5BS5223CFR -0.8ns 16M x 32 GDDR3 記憶體顆粒，記憶體時脈為 2214Mhz DDR，記憶體頻寬高達 140.8GB/s 。

支援 Hybrid Power 省電技術

作為 NVIDIA 高階繪圖卡產品， GeForce GTX 280 支援 3-Way SLI 技術，以三張 GeForce GTX 280 繪圖卡達成協同運算。此外， GeForce GTX 280 亦支援 ybrid Power 省電技術。

用家如果採用 nForce 790i(MCP65) 、 nForce 780a(MCP72XE 、nForce 750a(MCP72P) 、 GeForce 9200(MCP78U) 及 GeForce 8200(MCP78S)主機板，可將繪圖卡設定為 Save Power Mode ，繪圖卡即會進入休眠狀態，功耗將會下降至接近 0W ，繪圖工作將交由晶片組的 IGP繪圖核心處理，直至用家把繪圖回復正式模式，而切換模式並不需要重啟系統。

據 NVIDIA 表示， GeForce GTX 280 最高功耗為 236W ，這是在 100% 重負載下的最大值，在 2D 閒置下功耗只有 25W ，以 PureVideo 硬件解碼技術進行 Blu-Ray 播放，功耗約為 35W 。

( 左 ) 支援 3 Way SLI 技術 ( 右 ) 需外接 6Pin 及 8pin PCI-E 電源

( 左 ) 雙組 DVI 及 1 組 HDTV 輸出，可外接 HDMI Dongle ( 右 ) 供電模組採用 7 相供電設計

Dual Slot 散熱器、 CoolerMaster 代工

GeForce GTX 280 最高功耗達 238W ，需要一定效能的散熱器才能因應，因此， NVIDIA採用 CoolerMaster 代工的 TM71 散熱器， Dual Slot 設計並擁有 4 支 Heatpipe 導熱管，風扇最高轉速為2900rpm ，工作聲噪由 26 ~ 38 dBA 。

作者: GloOmY啊豪 时间: 2008-6-17 05:08 PM
測試平台︰

	Testing Platform
CPU	Intel Core 2 Extreme QX9770
Motherboard	GIGABYUTE X48-DQ6
Memory	A-DATA DDR2-1066 Extreme CL4 1GB x2
VGA	MSI GeForce GTX 280
	MSI GeForce 9800GTX
	MSI GeForce 9800GX2
	MSI Radeon 3870 X2
PowerSupply	GIGABYTE ODIN GT 1200W
OS	MS Windows Vista SP1
Driver	Forceware 177.34
	ATI Catalyst 8.6

作者: GloOmY啊豪 时间: 2008-6-17 05:08 PM
效能對比︰

	NVIDIA GeForce GTX 280	NVIDIA GeForce 9800GTX	NVIDIA GeForce 9800GX2	ATI Radeon HD 3870 X2
3D Mark 05
16 x 10	19346	18685	20974	21274
19 x 12	18553	17725	20512	20765
16 x 10 8AA	17137	12532	18870	18712
19 x 12 8AA	16001	10816	17823	17658

3D Mark 06
16 x 10	15763	13114	16674	16877
19 x 12	14781	11826	16118	16190
16 x 10 8AA	11128	7367	11886	11735
19 x 12 8AA	9981	6470	10957	11400

3D Mark Vantage 16x10
Total	7297	3553	6319	3971
GPU	6762	3147	5789	3414

3D Mark Vantage 19x12
Total	4908	2097	3305	2082
GPU	4751	2008	3179	2014

Company of Hero (High and On)DX10
16 x 10	58.3	45.0	58.9	50.1
19 x 12	56.9	42.7	58.5	48.8
16 x 10 8AA	56.3	39.3	21.3	42.5
19 x 12 8AA	49.6	29.4	16.8	35.9

Farcry1.4 (Ultra and HDR on)
16 x 10	179.52	132.64	179.11	145.54
19 x 12	170.83	113.29	169.85	126.61
16 x 10 8AA	164.74	118.16	162.51	133.42
19 x 12 8AA	158.96	97.12	156.46	117.81

作者: GloOmY啊豪 时间: 2008-6-17 05:09 PM

F.E.A.R (Max and on+16x AF)
16 x 10	154	86	148	137
19 x 12	125	69	121	107
16 x 10 8AA	135	52	133	63
19 x 12 8AA	108	40	107	52

Crysis (High)
16 x 10	48.33	31.14	47.59	22.26
19 x 12	39.47	25.62	39.36	21.83
16 x 10 8AA	32.78	17.06	32.60	19.48
19 x 12 8AA	26.88	10.48	26.71	15.63

PT Boats- Knights of the sea(High)
16 x 10	65.4	49.6	65.4	45.4
19 x 12	62.9	42.3	63.2	43.8
16 x 10 8AA	35.6	10.3	35.8	4.3
19 x 12 8AA	30.1	8.9	30.7	3.5

擁有 240 個 SP 的 GeForce GTX 280 繪圖卡，在效能表現上大幅壓制採用 G92 繪圖核心的 GeForce9800GTX ，以及兩顆 RV670 的 Radeon HD3870 ，並與擁有兩顆 G92 繪圖核心的 GeForce 9800GX2效能相若，表現令人滿意。

據 NVIDIA 指出，現有的 Forceware 177.34 驅動程式仍未完全優化 GeForce GTX 280 ，相信新驅動程式面世後， GeForce GTX 280 效能仍有提升空間。

此外， GeForce GTX 280 核心針對 PhyX 物理運算作出了優化，雖然 177.34 的驅動程式仍未支援 PhyX加速，但下一代版將追加此功能， GeForce GTX 280 表現將比第一代 Unified 架構的 GeForce 9800 、 8800更勝一籌。

作者: GloOmY啊豪 时间: 2008-6-17 05:09 PM
CDUA 測試︰

	NVIDIA GeForce GTX 280	Intel Core 2 Extreme QX9770
MPEG to H.264 Test
Software	BadaBoom	Main Concept H.264 Encoder
File Size	689.2MB 1080p MPEG2 File
Used Time	17.26 mins	31.7 mins

GeForce GTX 280 支援 CDUA 2.0 平台，為測試其平行運算效能，編輯部找來首個支援 CDUA 2.0 平台的BadaBoom 視訊編碼程式，與著名視訊編碼程式 Main Concept H.264 Encoder 作出對比測試，結果 D10U GPU大勝 3.2GHz Intel 四核心，未來 CUDA 2.0 將會進入不同範疇的應用，日後會否變成 CPU 只是副手，重責大任由 GPU一肩扛起，成為市場焦點所在。

功耗測試︰

	NVIDIA GeForce GTX 280	NVIDIA GeForce 9800GTX	NVIDIA GeForce 9800GX2	ATI Radeon HD3870 X2
Idle	241.2W	210.4W	280.3W	271.4W
3D Rendering (Max)	351.1W	345.6W	360.3W	369.2W

集成了 1.4 Billion 個電晶體，但 D10U 仍採用 65 奈米制程，全因 NVIDIA 在制程技術採取保守主義，雖然成本、 Die Size 與功耗無法降低，但成熟的制程卻帶來優秀的良率。

儘管如此， GeForce GTX 280 的功耗表現還是較兩顆 G92 核心的 GeForce 9800GX2 優勝，不過要進一步下降功耗，看來要等待 NVIDIA 推出半代更新版本。

溫度及聲噪測試︰

	NVIDIA GeForce GTX 280
Ambient Temp	25.5C
Idle	52.2 ~ 53.7C
3D Rendering (20Mins)	73.6 ~ 74.1C

Amibent Noise	48.2 dBA
Idle	52.1 dBA
3D Rendering (20Mins)	53.6 dBA
Full Fan Speed	60.2dBA

看到規格書上寫上 236W 時，還以為 GeForce GTX 280 會是又熱又吵，但測試結果卻出乎意料之外，全因 CoolerMaster代工的 TM71 擁有四支高導熱性能的 Heatpipe，其中一支更把熱傳導至卡的金屬外殼上，令核心的熱力平均、快速地帶走，如此優秀的散熱設計，將對欲推出非公版散熱器的廠商相當困擾，因為要找到優於公板散熱器的代替品著實不易。

作者: GloOmY啊豪 时间: 2008-6-17 05:10 PM
記︰
從 D10U 繪圖架構明顯感受到 NVIDIA 的十足野心，其加入全新 Parallel Compute 模式，擴大至一般應用軟件層面，力拼傳統 CPU ，目標不再只是侷限於 3D 繪圖領域。

GeForce GTX 280 不再只是一張 3D 繪圖卡，如果 CDUA 平台能被業界所採用，未來 PC 系統中 CPU可能只是副手，重責大任都將交由 GPU 處理，雖然只是個開始，距離目標尚遠。成功與否仍是未知之數，但明顯地 NVIDIA至少已找到自已的出路，未來大有機會不再受 Intel 、 AMD 牽制。

毫無疑問地， GeForce GTX 280 是現時 3D 遊戲領域的皇者， AMD 欲以單晶片攻破 D10U ，看來並不容易，不過其高達 699 美元的身價，卻不是每個遊戲玩家所能負擔。

因此，大多數玩家期待同樣採用 D10U 繪圖核心，但定價僅 $399 ~ 449 美元的 GeForce GTX 260 ，究竟 GeForce GTX 260 能否成新一代性價比之王，下星期即可見分曉。

作者: zakumo123 时间: 2008-6-17 08:08 PM
帮你加测试~~~~
http://we.pcinlife.com/thread-951191-1-1.html

作者: zuozi 时间: 2008-6-19 06:44 AM
德国老的测试，但是不是所有游戏可以灭掉280
http://www.forumdeluxx.de/forum/showthread.php?t=500923
至少都可以看到我在跑3片X哇哈哈哈
但是也确会有不顾价钱的玩家拿三片跑SLI
灭GTX 280两块太少,三块还是比GTX 280便宜

作者: zakumo123 时间: 2008-6-19 08:47 PM

原帖由 zuozi 于 2008-6-19 06:44 AM 发表
德国老的测试，但是不是所有游戏可以灭掉280
http://www.forumdeluxx.de/forum/showthread.php?t=500923
至少都可以看到我在跑3片X哇哈哈哈
但是也确会有不顾价钱的玩家拿三片跑SLI
灭GTX 280两块太少,三块 ...

看不懂你在说什么~~~~

作者: zuozi 时间: 2008-6-19 09:38 PM
标题: 回复 #14 zakumo123 的帖子
==你也不懂我在说什么啊，那我自己也不懂我在说什么了哈哈
280真的不值得我下手

作者: zakumo123 时间: 2008-6-19 10:14 PM

原帖由 zuozi 于 2008-6-19 09:38 PM 发表
==你也不懂我在说什么啊，那我自己也不懂我在说什么了哈哈
280真的不值得我下手

哈哈~~~~~em0023
280真的还是不实际，除非有玩跑分和在非常高的分辨率下玩游戏em0020

作者: 油炸鬼 时间: 2008-6-20 10:13 AM

跑风冷的：

作者: zechs 时间: 2008-6-20 10:27 AM

原帖由 油炸鬼 于 2008-6-20 10:13 AM 发表

跑风冷的：
http://resources.vr-zone.com/image_deposit/up/12136013007 ...

有商家赞助的果然不一样= ='' 广告都满满~

作者: GloOmY啊豪 时间: 2008-6-20 11:10 AM

原帖由 油炸鬼 于 2008-6-20 10:13 AM 发表

跑风冷的：
http://resources.vr-zone.com/image_deposit/up/12136013007 ...

这帖貌似我在cari看过

作者: 油炸鬼 时间: 2008-6-20 11:36 AM

原帖由 GloOmY啊豪 于 2008-6-20 11:10 AM 发表

这帖貌似我在cari看过

哈！偷偷和大大说，在cari放此贴（NVIDIA D10U繪圖核心GeForce GTX 280正式登場）的就是小弟本人呀！

作者: 油炸鬼 时间: 2008-6-20 12:32 PM
D10U核心預設700MHz
ZOTAC GF GTX 280 AMP!版本

專攻玩家市場的 Zotac ，近日推出全新 GeForce GTX 280 AMP! Edition ，雖然沿用公版設計、公版散熱器，但選取體質最佳的產品，把核心預設 700MHz 水平，官方預設超頻完全在保固範圍之中，成為追求極致效能的遊戲玩家首選。

700MHz 核心時脈

GeForce GTX280 日前正式發佈， ZOTAC 為搶佔市場，第一時間推出超頻版本 GeForce GTX280 AMP! Edition ，其核心時脈、 Stream Processor 及記憶體預設超頻，使繪圖效能本已十分強勁的 GTX280 再推至高峰，大大提高繪圖卡的吸引力。

ZOTAC GeForce GTX280 AMP! Edition 採用 NVIDIA 全新 D10U 繪圖核心，內建 240 個 Unified Streaming Processor 、 80 個 Texture Filtering Unit 、 80 個 Texture Address Unit 及 32 個 Raster Operations Unit ，此外，核心更支援 CUDA 2.0 運算平台，可配合 BadaBOOM 提供視訊編碼，效果比採用 CPU 更佳。

核心時脈方面， ZOTAC GeForce GTX280 AMP! Edition 預設超頻，時脈為 700MHz ，比較公版的 602MHz 提高近 16% ， Stream Processor 則超頻至 1400MHz ，比公版的 1296MHz 為高。

記憶體方面， ZOTAC GeForce GTX280 AMP! Edition 採用 16 顆 16M x 32 Hynix H5RS5233CFR -0.8ns GDDR3 記憶體顆粒，總容量為 1GB ，記憶體介面為 512bit ，除核心超頻外，記憶體同樣預設超頻，時脈為 2300MHz DDR 。

ZOTAC GeForce GTX280 AMP! Edition 須透過外置的 NVIO-2 顯示輸出晶片支援雙 Dual-Link DVI 及 7 Pins HDTV 輸出端子，並支援 HDMI 輸出，但需要配合 NVIDIA 專用的 DVI to HDMI Dongle ，不過用家需要透過外部 SP/DIF 接線，才能讓 HDMI 接口支援音效輸出。

散熱方面， ZOTAC GeForce GTX280 AMP! Edition 沿用 CoolerMaster 的 TM71 公版散熱器，散熱器採用 Dual Slot 設計，同時內建 4 支 Heatpipe 導熱管，把熱力有效地送走，風扇最高轉速為 2900rpm ，工作聲噪由 26 ~ 38 dBA 。

( 左 ) 採用全新 NVIDIA D10U 繪圖核心 ( 右 ) 繪圖卡內建用 NVIO2 顯示輸出

( 左 ) 採用 Hynix -0.8ns GDDR3 記憶體顆粒 ( 右 ) 繪圖卡提供 SLI 接口，支援 SLI 協同運算

( 左 ) 散熱器採用 Dual Slot 設計，內建 4 支 Heatpipe 導熱管 ( 右 ) 由於功耗有一定要求，因此需要 1 組 pin 及 1 組 8pin 電源

效能參考﹕

	NVDIDA GF280 (602/2214/1296)	ZOTAC GF280 (700/1400/2300)
3D Mark 05
16x 10	19346	19731

3D Mark 06
16 x 10	15763	16620

3D Mark Vantage 16x10
Total	7297	7429
GPU	6762	7138
CPU	13235	13260

Company of Hero (High and On)DX10
16 x 10	58.3	59.4

Farcry1.4 (Ultra and HDR on)
16 x 10	179.52	174.89

Crysis (High)
16 x 10	46.33	46.87

作者: eremitic 时间: 2008-6-20 02:02 PM
gtx280 在还没出之前~被夸大的太严重。。。。~

出来后

~也就跟9800gx2差不多。。。

作者: zuozi 时间: 2008-6-20 02:11 PM
标题: 回复 #22 eremitic 的帖子
应该是说，拿GX2好过拿280==

作者: GloOmY啊豪 时间: 2008-6-20 02:13 PM

原帖由 油炸鬼 于 2008-6-20 11:36 AM 发表

哈！偷偷和大大说，在cari放此贴（NVIDIA D10U繪圖核心GeForce GTX 280正式登場）的就是小弟本人呀！

哈哈。。我转你的帖过来

作者: real.gigaleon 时间: 2008-6-20 02:33 PM

原帖由 zuozi 于 2008-6-20 14:11 发表
应该是说，拿GX2好过拿280==

em0002

driver还不成熟的时候这个280只能拿来作为showoff 用

作者: 油炸鬼 时间: 2008-6-20 02:34 PM

原帖由 GloOmY啊豪 于 2008-6-20 02:13 PM 发表

哈哈。。我转你的帖过来

没关系啦！互相交流！我也是从香港资讯网站传过去的！

作者: zuozi 时间: 2008-6-20 02:41 PM
我好反感的说，最近的那些9800GTX已经要改名叫GTX+好无聊的+
不过将会在这个七月出炉啊

作者: eremitic 时间: 2008-6-20 06:46 PM
标题: 回复 #27 zuozi 的帖子
+ 不是g92b (55nm) 吗？ +clock /- cost 版

作者: zuozi 时间: 2008-6-20 09:12 PM
标题: 回复 #28 eremitic 的帖子
如果要clock倒不如自己clock到一个极限不是好了吗？干嘛还要浪费时间
让他做这些无聊的东西，搞不好到头来问题多多不是自寻死路==

作者: eremitic 时间: 2008-6-21 08:44 AM
标题: 回复 #29 zuozi 的帖子
我个人觉得是市场策略，看过他最新的定价，把原本的9800gtx放在us199,gtx + us 229.

不过论成本来说因该是 + 比较低 die size 好像减到27xmm -2

不过我觉得他的product line 很乱- 一个g92吃完rm3xx~1xxx的市场

作者: 油炸鬼 时间: 2008-6-25 04:53 PM
力抗Radeon HD 4850入侵
NVIDIA GeForce 9800GTX即日減價
文: John Lam/新聞中心

AMD 新一代繪圖核心 RV770 表現強勁， ATI Radeon HD 4850 型號定價僅 $199 美元，但效能與 GeForce 9800GTX 不相上下，令對手 NVIDIA 備受壓力。因此， NVIDIA 20 日宣佈，將現有 GeForce 9800GTX 售價大幅下調至 $199 美元，並新增全新 GeForce 9800GTX+ 型號，採用全新 55nm 版本 G92 核心，核心時脈再提升，合作阻擋 Radeon HD 4850 來襲。

據了解， ATI 新一代 Radeon HD 4850 性價比出乎意料地強勁，採用全新 RV770 繪圖核心， 55nm 、 9.65 億個電晶體，內建了 800 個 Spream Processing Unit ，相比上代 RV670 大幅提升 1.5 倍。核心時脈為 625MHz ，其效能與 GeForce 9800GTX 不相上下。

雖然正式發佈日期為 6 月 26 日，但不少廠商已偷步發售， Radeon HD 4850 定價僅 $199 美元，相比 GeForce 9800GTX 定價 $279-299 美元，令 NVIDIA 整個中階至效能級產品線完全崩潰。

為力保中階市佔有率，不讓對手有機可乘， NVIDIA 20 日宣佈把現有 GeForce 9800GTX 售價下調至 $199 美元，同時宣佈推出全新 GeForce 9800GTX+ 版本，採用全新 55nm 版本的 G92 核心，核心時脈提升至 738MHz ， Shader Processor 時脈提升至 1.836GHz ，定價為 $229 美元，合作阻擋來勢洶洶的 ATI Radeon HD 4850 。

據 NVIDIA 技術行銷經理 Jeff Yen 表示， GeForce 9800 GTX+ 效能平均比 AMD Radeon HD 4850 快 22% ， GeForce 9800 GTX+ 目前以 229 美元市價提供玩家驚人的性價比，而原先的 GeForce 9800 GTX 將降價至 199 美元，為重視預算的玩家們提供難以扺擋的價值，加上 NVIDIA 在遊戲上高兼容性的表現，相信將可壓倒對手。

有繪圖業者表示，對於 NVIDIA 突然降價影響，不少繪圖卡業者感到無奈，雖然取得了 GeForce 9800GTX 差價補償，但手上的原有中階型號卻不在補償之列，為免庫存滿手也只能減價清出，相信有不少廠商被 NVIDIA 減價戰燙傷。

作者: zuozi 时间: 2008-6-25 06:54 PM
标题: 回复 #31 油炸鬼的帖子
nvidia有今天也是活该的。。。。。。。

作者: zechs 时间: 2008-6-25 08:09 PM

原帖由 zuozi 于 2008-6-25 06:54 PM 发表
nvidia有今天也是活该的。。。。。。。

你那么憎恨nvidia哦em0032

作者: ~~堕枫~~ 时间: 2008-6-26 10:00 PM
感觉上很帅。。。。。哈哈

作者: zakumo123 时间: 2008-6-26 10:14 PM

原帖由 zuozi 于 2008-6-25 06:54 PM 发表
nvidia有今天也是活该的。。。。。。。

呵呵~~~~我还是喜欢N，但是从不讨厌A。。。。。。em0014

作者: zuozi 时间: 2008-6-27 08:33 AM
我没有讨厌N也没有喜欢A,只是N每次都把人家压到死死的
就比如大欺负小的，那你们如果看到大欺负小的你们会怎样？
站在那里看他给人欺负吗？如果你是这样的人你真的很缺得
那既然A有今天的成绩也就是某个做大的帮他脱离别人的欺负嘛。。。。。

作者: zakumo123 时间: 2008-6-27 11:16 AM

原帖由 zuozi 于 2008-6-27 08:33 AM 发表
我没有讨厌N也没有喜欢A,只是N每次都把人家压到死死的
就比如大欺负小的，那你们如果看到大欺负小的你们会怎样？
站在那里看他给人欺负吗？如果你是这样的人你真的很缺得
那既然A有今天的成绩也就是某个做大 ...

哈哈~~~~~重要的是我们消费者有利益就好，性价才是我们要的~~~~~~~

作者: zuozi 时间: 2008-6-27 05:40 PM
标题: 回复 #37 zakumo123 的帖子
原来你是那么没有同情心的，你真的很缺得

作者: zakumo123 时间: 2008-6-27 08:14 PM

原帖由 zuozi 于 2008-6-27 05:40 PM 发表
原来你是那么没有同情心的，你真的很缺得

哈哈~~~~~在这种事情方面我就没有同情心的，其他就不一样em0002

作者: zuozi 时间: 2008-6-30 03:12 PM
http://www.techpowerup.com/64351 ... 3DMark_Vantage.html
Two R700s Churn-out X12515 in 3DMark Vantage
两片4870X2已经将280 3way sli暂时打倒哈哈
两片4870X2还是比三片280GTX来得便宜hohoho

作者: GloOmY啊豪 时间: 2008-6-30 03:15 PM

原帖由 zuozi 于 2008-6-30 03:12 PM 发表
 http://www.techpowerup.com/64351/Two_R700s_Churn-out_X12515_in_3DMark_Vantage.html
Two R700s Churn-out X12515 in 3DMark Vantage
两片4870X2已经将280 3way sli暂时打倒哈哈
两片4870X2还是比三片28 ...

by DaMulta (June 30th - 6:53 AM) - Reply
My 3 9800GTX cards murder that score

http://img.techpowerup.org/080630/vantage2.jpg
下面有人写这个。19336。。

作者: zuozi 时间: 2008-6-30 03:19 PM
标题: 回复 #41 GloOmY啊豪的帖子

你要知道Vantage是有很多你还不晓得
就是他前面的字以X就是Extreme比如X123456?
而那个是以P123456?那么谁比较高呢？
P应该是以Premium的意思哈哈不知道

[ 本帖最后由 zuozi 于 2008-6-30 03:21 PM 编辑 ]

作者: GloOmY啊豪 时间: 2008-6-30 03:29 PM

原帖由 zuozi 于 2008-6-30 03:19 PM 发表

你要知道Vantage是有很多你还不晓得
就是他前面的字以X就是Extreme比如X123456?
而那个是以P123456?那么谁比较高呢？
P应该是以Premium的意思哈哈不知道

当然。。我只玩过一次3dmark来看是什么来的。。3dmark 05..还拿到10k左右分数叻

作者: zuozi 时间: 2008-6-30 03:36 PM
标题: 回复 #43 GloOmY啊豪的帖子
05你可以拿到10k左右不错了咯，哎呀这些分数只是让我们用户多知道
那个硬件的极限，价钱是否公道？那再来购买我想也算是个常识

作者: zechs 时间: 2008-6-30 03:43 PM

原帖由 zuozi 于 2008-6-30 03:12 PM 发表
 http://www.techpowerup.com/64351 ... 3DMark_Vantage.html
Two R700s Churn-out X12515 in 3DMark Vantage
两片4870X2已经将280 3way sli暂时打倒哈哈
两片4870X2还是比三片28 ...

nvidia有难了em0032

作者: zechs 时间: 2008-6-30 03:47 PM

原帖由 GloOmY啊豪 于 2008-6-30 03:29 PM 发表

当然。。我只玩过一次3dmark来看是什么来的。。3dmark 05..还拿到10k左右分数叻

05最高40kem0023

作者: zakumo123 时间: 2008-6-30 03:56 PM

原帖由 zuozi 于 2008-6-30 03:12 PM 发表
 http://www.techpowerup.com/64351 ... 3DMark_Vantage.html
Two R700s Churn-out X12515 in 3DMark Vantage
两片4870X2已经将280 3way sli暂时打倒哈哈
两片4870X2还是比三片28 ...

呵呵~~~~~4核对3核赢了很正常啊~~~~~

作者: zuozi 时间: 2008-6-30 03:57 PM
标题: 回复 #46 zechs 的帖子
那个是你吗？我想没有其人拿到40左右的分数了哈哈哈

作者: zechs 时间: 2008-6-30 04:01 PM

原帖由 zuozi 于 2008-6-30 03:57 PM 发表
那个是你吗？我想没有其人拿到40左右的分数了哈哈哈

肯定不是= =''上futuremark看就有了。

作者: zuozi 时间: 2008-6-30 04:02 PM
标题: 回复 #47 zakumo123 的帖子
不正常。。。。。。三片280和两片CF问题相差的多。。。。。另外就是价钱
除非你已经有这个本事拿三片280那我真的无言

作者: zakumo123 时间: 2008-6-30 04:04 PM

原帖由 zuozi 于 2008-6-30 04:02 PM 发表
不正常。。。。。。三片280和两片CF问题相差的多。。。。。另外就是价钱
除非你已经有这个本事拿三片280那我真的无言

我无言~~~~~~

作者: zuozi 时间: 2008-6-30 04:06 PM
标题: 回复 #51 zakumo123 的帖子
哈哈我也是无言了，大家都有自己的理想拉

不应该是硬件理想才对

作者: zakumo123 时间: 2008-6-30 04:16 PM

原帖由 zuozi 于 2008-6-30 04:06 PM 发表
哈哈我也是无言了，大家都有自己的理想拉
不应该是硬件理想才对

你想太多了~~~~~

作者: zuozi 时间: 2008-7-2 12:10 AM
ATI Preparing 'Super RV770' to Challenge GeForce GTX 200 Series
http://www.techpowerup.com/64446 ... GTX_200_Series.html
这个反而我对他没什么信心，反而给他自己麻烦，胜了我就进喜，败了就亲家但残==

作者: zechs 时间: 2008-7-2 12:50 AM

原帖由 zuozi 于 2008-7-2 12:10 AM 发表
ATI Preparing 'Super RV770' to Challenge GeForce GTX 200 Series
http://www.techpowerup.com/64446 ... GTX_200_Series.html
这个反而我对他没什么信心，反 ...

这种叫乘胜追击~再接再厉~

作者: zuozi 时间: 2008-7-2 12:13 PM
标题: 回复 #55 zechs 的帖子
我也希望如此咯哈哈，不过还是没办法的说毕竟原始人不是我们所以这是没办法的
下来就是我心目中的战神已经有sample叻看了都满肚子都是火阿，及时才到我啊

原图来之Techpowerup.com

作者: zechs 时间: 2008-7-2 12:53 PM

原帖由 zuozi 于 2008-7-2 12:13 PM 发表
我也希望如此咯哈哈，不过还是没办法的说毕竟原始人不是我们所以这是没办法的
下来就是我心目中的战神已经有sample叻看了都满肚子都是火阿，及时才到我啊
http://www.techpowerup.com/img/08-07-01/tomsne ...

差不多了~忍耐多一下下就好了。

作者: GloOmY啊豪 时间: 2008-7-2 10:09 PM

原帖由 zuozi 于 2008-7-2 12:13 PM 发表
我也希望如此咯哈哈，不过还是没办法的说毕竟原始人不是我们所以这是没办法的
下来就是我心目中的战神已经有sample叻看了都满肚子都是火阿，及时才到我啊
http://www.techpowerup.com/img/08-07-01/tomsne ...

intel nehalem是多少核？

欢迎光临 JBTALKS.CC (https://jbtalks.my/)