Facebook Sharer
选择您要替换的背景颜色:
【农历新年】背景图片:
个性化设定
 注册  找回密码
查看: 3012|回复: 6
打印 上一主题 下一主题

[转载]全新RV770繪圖核心, ATI Radeon HD 4850繪圖卡

[复制链接]

0

主题

0

好友

132

积分

高级会员

Rank: 3Rank: 3Rank: 3

跳转到指定楼层
1#
发表于 2008-6-26 08:16 AM |只看该作者 |倒序浏览
全新RV770繪圖核心
ATI Radeon HD 4850繪圖卡
文: Kopo Ko / 評測中心



AMD 25 日正式發佈全新效能級繪圖晶片,核心代號為 RV770 ,並命名為 Radeon HD 4800 家族,一改傳統 GPU 研發策略,僅專注效能級市場需求出發,憑著 800 個 Stream Processing Unit ,令 NVIDIA 完全措手不及,迫使 GeForce 9800GTX 大幅降價迎戰。 HKEPC 編輯部找來 MSI Radeon HD 4850 繪圖卡,將解構全新 RV770 核心並進行效能對比測試。




成功搶佔先機   全新 RV770 繪圖核心

按照 GPU 傳統研發時程,繪圖晶片廠商均會先設計高階繪圖晶片,然後將按照該設計刪減並移稙至中低階,由於高階繪圖晶片設計繁複,所需成本、時間甚巨,加上市場空間狹窄,展示意義較實際為高。

據 AMD 資深副總裁暨繪圖產品事業群總經理 Rick Gergman 表示,如果繼續把研發資源和對手拼高階市場,倒不如全力做好效能級繪圖晶片,節省成本、時間,高階市場則以雙繪圖晶片產品補上,提供更具伸延性的產品線。

因此,已連續在數代在繪圖卡市場中失利的 AMD 為創佔先機,一改傳統GPU的研發策略,全新 RV770 繪圖核心以追求終極性價比的目標出發,僅針對主流市場(US$200-$300) ,不與 NVIDIA 追蹤無意義的效能數字遊戲。



由於 NVIDIA 仍按照傳統研發時程推出高階 GT200 ,卻忽略防備 Radeon HD 4800 家族 ,讓 AMD 有機在效能級市場佔下頭香,被迫以上代高階 GeForce 9800GTX 大幅降價迎戰,卻未能阻擋 RV770 的強勁攻勢。

據市調機構 Jon Peddie Research 報告指出, 2008 年全球高階繪圖卡市場 (>US$250) 規模僅約~ 400 萬片,而效能級繪圖卡 ($151 ~ 249) 市場規模卻高達~ 5,400 百萬片, AMD 為了扳回一城,專注於效能級市場絕對是聰明的做法。

根據 AMD 最新規劃, 25 日正式發佈 Radeon HD 4850 及 Radeon HD 4870 產品,建議售價分別為 $199 美元及 $299 美元。此外, AMD 將會於第三季內發佈雙 RV770 高階繪圖卡產品,型號為 Radeon HD 4870 X2 ,建議售價為 $499 美元,預期效能將會比 GeForce GTX 280 還要強勁。



[ 本帖最后由 油炸鬼 于 2008-6-28 01:39 AM 编辑 ]




收藏收藏0

0

主题

0

好友

132

积分

高级会员

Rank: 3Rank: 3Rank: 3

2#
发表于 2008-6-26 08:17 AM |只看该作者
RV770 ︰ 800 個 Stream Processing Unit



ATI Radeon HD 4800 家族採用全新 RV770 繪圖核心,支援 Direct X10.1 及 Shader Model 4.1 規格, 55nm 制程由台積電 (TSMC) 代工,內建 9.56 億個電晶體,晶片面積為 260mm2,是上代 RV670 的 1.4 倍。

RV770 繪圖核心與上代 RV670 、 R600 架構相約,採用 Single Instrucion Multiple Data(SIMD) 架構,每組 SIMD 核心擁有 16 個 Stream Processor (SP) ,每個 Stream Processor 擁有 5 個 32Bit ALU (Stream Processsing Unit) ,合共 80 個 ALU 。

每個 SIMD 核心內建一組控制邏輯、每個 SP 內設有一組 Brand Execution Units 作支分預測工作,可空出一組 ALU 作其他運算, 並設有暫存器用作存放輸出入、輸出數據,最高可同時處理最高 5 筆資料及指令,因此每組 SIMD 核心最高可同時處理 80 筆資料及指令。

每個 SIMD 核心擁有獨立一組 Texture Unit 及獨立的 L1 Cache ,並可透過 16KB 的 Global DataShare 單元,與其他 SIMD 核心進行溝通。不過, RV770 的 Texture Unit 作出了簡化,由原來的 8 個 Texture Address Unit 減至只有 4 個。



上代 RV670 擁有 4 組 SIMD 核心、合共 320 個 Stream Processing Unit ,新一代 RV770 則大幅提升至 10 組 SIMD 核心,合共 800 個 Stream Processing Unit ,增幅超過 2.5x 。

值得注意的是,上代 RV670 的每組 SP , 5 組 ALU 只有其中一組可以作 Integer 整數位元運算,但 RV770 的所有 ALU 均可進行 Integer 整數位元運算,這方面的效能是上代的 12.5x ,主要強化 GPGPU 應用,對於影像處理、壓片、加密及解密相關的運算有很大幫助 。

RV670RV770
SMIDs410
SPs per SMID1616
ALUs per SP55
Total ALUs320800

RV770 ︰ 10 個 Texture Units




AMD 的 Unified Shader 架構,每組 SIMD 核心擁有 1 個 Texture Unit ,因此 RV770 的 Texture Unit 亦由上代的 4 個、大幅提升至 10 個。


RV770 的 Texture Unit (TU) 有一定程度的簡化,每組 Texture Unit 的 Texture Address Unit (TAU) 數目由 8 個減至 4 個、 FP32 Texture Filiter Unit (TFU) 則維持 4 個, FP Texture Samplers (TS) 則減至 16 個。但由於 RV770 的整體 Texture Unit 數目上升,因此 Texture 整體效能仍比上代 RV670 高出甚多,以實際效能來看, 32-Bit Filter Rate 為上代的 2.5x 、 64-Bit Filter Rate 為上代的 1.25x ,最高可達 160 Fetches per Clock 、 128 個 Textures per Pixel 。


據 AMD 繪圖產品事業群 RV770 架構首席工程師 Scott Hartog 指出,由於現代遊戲大幅偏重 Shader Power ,因此提升 SIMD 核心數目對遊戲提升最為直接,在保持現有 Unified Shader 架構,每一組 SIMD 核心擁有一組 Texture Units 下,把 Texture Units 內部架構作出適當平衡,有效提升 Performance/mm2,保持 4 個 Stream Processors 、 1 個 FP32 Texture Filiter Unit 的比例是最符合現今遊戲要求。


RV670RV770
SMIDs410
TU per SMID11
TAU perTU84
TFU per TU44
TS per TU2016
Total TAU3240
Total TFU1640
Total TS80160


回复

使用道具 举报

0

主题

0

好友

132

积分

高级会员

Rank: 3Rank: 3Rank: 3

3#
发表于 2008-6-26 08:18 AM |只看该作者
V770 ︰改良 Cache Design 、 記憶體控制器



為提高 Texture 效率, RV770 進一步改良 Cache 系統, L1 Texture Cache 由以往提供給所有 SIMD 共享,改為每組擁有獨立、較細的 L1 Texture Cache ,讓每組 SIMD 存放與自己相關連、獨立的資料, Latency 大幅下降, L1 Cache 的效率能提升 2x ,整體 Cache 效率提升達 5x 。

沒有了共享的 L1 Texture Cache 架構, RV770 加入了 16KB Globle Data Share ,作為每組 SIMD 的資料溝動渠道。此外,另設獨立的高速 Vertex Cache 以提升 Vertex 及 Geometry 執行效率,讓更多的 Geometry Shader Data 可以放在晶片內,令 Geometry Thread 的處理效率相比上代 RV670 高出 4x 。

此外, L1 及 L2 Cache 的頻寬亦大幅提升了, RV770 的 L1 Texture Cache 最高速達 480Gb/s ,而 L1 與 L2 Cache 之間頻寬亦提升至 384GB/s 。

一直被 AMD 推荐的 Ring Bus 在今代被正式放棄,換回傳統的 Full Distributed with Hub 設計,主要原因是 Ring Bus 在 R600 、 RV670 並沒有顯出其應有的優勢,相反在部份情況下 Latency 提高、佔用更多電晶體及功耗增加,今代 RV770 換回 Fully Distributed 可以說是預期之中。

RV770 最高支援 256Bit 記憶體介面,加入 Fast MemExport/Import 功能, Scatter 及 Gather 動作的速度是上代 RV670 的 2x ,並支援高達每筆 16 個 64Bit exports 或 8 個 128-bit exports 。



RV770 ︰改良 Render Back-Ends 設計


Render Back-End 方面, RV770 與上代 RV670 一樣擁有 4 組,取消了以往專門針對透明及霧化的運算單元,但 Z/Stenicil Unit 由上代 RV670 的 8 個,提供至今代的 16 個,令 RV770 的 depth/stencil 指令執行數由上代的每筆 32 個提升至 64 個。

這項改動令 RV770 在 AA 模式下 32Bit Color 及 64Bit Color 的 Fill Rate 提升一倍,而非 AA 模式下 64Bit Color 的 Fill Rate 亦能提升一倍。

RV670RV770
Depth/Stencil Only32 pix/clk64 pix/clk
32Bit
No MASS16 pix/clk16 pix/clk
2x/4x MSAA8 pix/clk16 pix/clk
8x MSAA4 pix/clk8 pix/clk
64Bit
No MASS8 pix/clk16 pix/clk
2x/4x MSAA8 pix/clk16 pix/clk
8x MSAA4 pix/clk8 pix/clk


回复

使用道具 举报

0

主题

0

好友

132

积分

高级会员

Rank: 3Rank: 3Rank: 3

4#
发表于 2008-6-26 08:19 AM |只看该作者
RV770 ︰ Unified Video Decoder 2



RV770 在影像處理引擎方面進一步改良, AMD 把它命名為 Unified Video Decoder 2 (UVD2) ,加入 Dual-Stream 技術,可同時為兩組 VC-1 、 H.264 及 MPEG-2 Bitstream 作硬體解碼,提供 Picture in Picture ( 畫中畫 ) 功能。

在 HDMI 輸出方案上, RV770 仍保持領先,內建 HD Audio Codec 無需像 NVIDIA 要外接 S/PDIF ,簡單方便。今代 RV770 的 HD Audio Codec 更進一步強化,上代 RV670 僅支援 5.1 Channel Surround Sound ,今代進一步升級 7.1 Channel Surround Sound ,最高 6.144Mbps bit rate 、 192Khz sample rate 、 24 bits/sample ,可支援 AC3 、 DTS 、 Dolby True-HD 及 DTS HD 等編碼。

RV770 針對影像播放質素作出了多項改良,加入了 DVD upscaling to HD 的功能,讓 720 x 480 的影片升檔至 1920 x 1200 ,並減少影像模糊及鬆散。此外,加入 Dynamic Contrast ( 動態光暗對比調整 ) 技術 ,原理像 Photoshop 把圖片作光暗對比,不過 RV770 則是動態針對每幀畫面進行,為影像的光暗位進行優化。

據了解, Corel WinDVD9 、 Cyberlink PowerDVD8 及 Microsoft Windows Media Player 已完全支援 UVD2 ,而 Roxio 、 Nero 及 Arcsoft 將會在短期內推出支援 UVD2 的相關播放軟件。



RV770 ︰ Accelerated Video Transcoding (AVT)




針對影像編碼, AMD 推出全新 Accelerated Video Transcoding(AVT) 技術,提供比影像實際播放時間更快的 1080p 影像編碼能力,支援 H.264 及 MPEG-2 格式,軟件可透過 AVT 介面,把影像資料傳過至用作 GPGPU 的 Compute Abstraction Layer (CAL) ,透過 AMD 驅程程式,交由 GPU 作影像編碼工作。


據 AMD 表示,以 1 小時的 1080p 影像來源,如果以 Intel Core 2 Duo E8500 處理需 9 小時 54 分鐘,而採用 Radeon HD 4800 家族產品僅需 32 分鐘,效率提升高達 19 倍。


現時已得悉 Cyberlink 已正式支援 AVT 技術,全新 PowerDirector 7 可使用 AMD GPU 進行影像編碼加速處理,未來將會加入更多軟件支援 AVT 技術。




回复

使用道具 举报

0

主题

0

好友

132

积分

高级会员

Rank: 3Rank: 3Rank: 3

5#
发表于 2008-6-26 08:19 AM |只看该作者
AMD 支援 Havok 物理運算引擎   力抗 NVIDIA PhyX



早前 NVIDIA 公開喊話,歡迎對手 AMD 採用 PhyX 物理運算引擎,聯手對抗已被 Intel 收購 Havok 物理運算引擎,不過 AMD 看來自有打算,決定與 Intel 聯手共同力挺 Havok 物理運算引擎, NVIDIA 如意算盤幾近落空。

據 AMD 繪圖事業群開發者公共關係處處長 Neal Robison 表示,選擇 Havok 主要原因為較多遊戲支援, Havok 己擁有超過 250 個 AAA 級的遊戲正在使用 Havok ,相反 PhyX 卻寥寥無幾,而近期將有近 135 個新遊戲將基於 Havok 物理引擎研發,在普及性的考量下, AMD 決定支援 Havok 物理運算引擎。

Neal Robison 認為 AMD 是一家開放平台的公司,未來仍會支援具市場領導地位的 Havok 物理運算,而 Havok 亦承諾為 ATI Radeon GPU 提供,並繼續優化 AMD Phenom 處理器,以達至雙贏局面。



RV770 ︰ AMD FireStream 9250



除了應用於 Radeon HD 480 繪圖卡產品上, RV770 亦會針對 GPGPU 應用,推出 AMD FireStream 9250 Processor , Single Slot 設計卻擁有高達 1TFlops 效能,而且功耗性能比超強,高達 8GFlops per Watt 。

對比現時 NVIDIA 最高階的 GT200 核心,擁有 30 個 Double Precision 64Bit Floating Unit 、 90 Gigaflop 運算速度。 RV770 卻完全不把 GT200 放在眼內,每一個 SP 擁有一個 Double Precision 64Bit Floating Unit ,合共 160 個,提供高達 240 Gigaflop 運算速度。

Precision 雙精算及 64-Bit Floating Point 運算支援,常用於高階科學、工程、財經運算軟件、以及需要高精確度的數學運算,   看來 AMD 可以在 GPGPU 領域上,以 RV770 輕鬆力壓 GT200 。

RV770 與上代繪圖核心規格比較︰

RV770RV670
Transistors965 million666 million
Manufacturing Process55nm55nm
Stream Processors800320
Texture Units104
Render Back-Ends1616
System Bus SupportPCI Express 2.0 x16PCI Express 2.0 x16
DirectX Support10.110.1
UVDUVD2UVD+


回复

使用道具 举报

0

主题

0

好友

132

积分

高级会员

Rank: 3Rank: 3Rank: 3

6#
发表于 2008-6-26 08:21 AM |只看该作者
Single Slot 設計 -- ATI Radeon HD 4850 繪圖卡


圖為 MSI 推出的 Radeon HD 4850 繪圖卡,採用 B501 公板設計、 8 層 Layers PCB ,繪圖卡尺寸為 4.376 x 9.25 inches 、 Single Slot 設計 ,需要外接一組 6 Pin 供電,產品最高功耗僅為 110W 。


Radeon HD 4850 繪圖核心為「 RV770PRO 」,晶片編碼 215-0669xxx ,採用 55 奈米制程由 TSMC (台積電)代工,擁有 800 個 Stream Processing Unit 、 40 個 Texture Filtering Unit 、 40 個 Texture Address Unit 及 4 個 Raster Back End ,核心時脈為 625MHz ,其運算效能高達 1 Gigaflops 。


顯示輸出方面, Radeon HD 4850 支援兩組 Dual Link DVI 及一組 TV 輸出端子,兩組 Dual Link DVI 均可配用 DVI to HDMI Adapter ,提供 HDMI 1.2 版本輸出, TV 輸出端子則可配搭 Cable Adapter 支援 S-Video 及 Composite 輸出,或配搭 Component Cable Adapter 支援 HDTV 輸出。



215-0669 代為 RV770PRO 繪圖核心


( 左 ) 僅需 1 組 6 Pin PCI-E 外接電源    ( 右 ) 支援 ATI CrossFireX 技術


( 左 ) Single Slot 全銅散熱器    ( 右 ) NTK 6cm 散熱風扇


DVI to HDMI Adaptor 、 RV770 支援 7.1 聲道輸出


支援 256Bit 記憶體介面    -0.8ns GDDR3 記憶體


Radeon HD 4850 支援最高 256Bit 記憶體介面,雖然 RV770 核心支援 GDDR5 記憶體顆粒,但 Radeon HD 4850 僅採用 GDDR3 顆粒,公版共採用兩家不同品牌的顆粒,分別為 Qimonda -1ns GDDR3 2.0V 及 Samsung -1ns GDDR3 1.9V 顆粒,不過 ATI 統一採用 2.062 VDC nominal 、 2.016 VDC min 、 2.108 vcd max 設定。


此次送測的 MSI Radeon HD 4850 則採用 Qimonda -1ns GDDR3 顆粒, P/N 23CC1287QB1A , 8 顆 16Mx32 顆粒容量為 512MB ,核心時脈為 1.986GHz DDR 。



Qimonda HYB18H512221BF-18


回复

使用道具 举报

0

主题

0

好友

132

积分

高级会员

Rank: 3Rank: 3Rank: 3

7#
发表于 2008-6-26 08:21 AM |只看该作者
測試平台︰



Testing Platform
CPUIntel Core 2 Extreme QX9770
MotherboardGIGABYUTE X48-DQ6
MemoryA-DATA DDR2-1066 Extreme CL4 1GB x2
VGAMSI GeForce GTX 280
MSI GeForce 9800GTX
MSI GeForce 9800GX2
PowerSupplyGIGABYTE ODIN GT 1200W
OSMS Windows Vista SP1
DriverForceware 177.34 / 177.39
ATI Catalyst 8.6

效能對比︰

Radeon HD 4850GeForce 9800GTXRadeon HD 3870
3D Mark 05
16 x 10182361868517666
19 x 12174321772516281
16 x 10 8AA147181253211457
19 x 12 8AA13002108169789
3D Mark 06
16 x 10120231311410676
19 x 1210809118269431
16 x 10 8AA853873676764
19 x 12 8AA759764705885
3D Mark Vantage 16x10
Total428835532736
GPU383531472400
CPU129651321713169
PhyX Driver 8.06.12
Total 4093
GPU 3540
CPU 35741
3D Mark Vantage 19x12
Total281320981640
GPU270120101568
CPU130941310713013
PhyX Driver 8.06.12
Total 2393
GPU 2281
CPU 35789
Company of Hero
(High and On)DX10
16 x 1049.74544.7
19 x 1246.142.741.2
16 x 10 8AA45.739.327.9
19 x 12 8AA4129.414.3
Farcry1.4
(Ultra and HDR on)
16 x 10132.52132.64104.72
19 x 12110.42113.2984.63
16 x 10 8AA133.99118.16105.96
19 x 12 8AA110.6197.184.27
F.E.A.R
(Max and on+16x AF)
16 x 10968666
19 x 12776953
16 x 10 8AA635241
19 x 12 8AA514035
Crysis (High)
16 x 1028.7231.1423.97
19 x 1224.1725.6220.02
16 x 10 8AA25.8417.0619.75
19 x 12 8AA21.1310.4820.02
PT Boats-
Knights of the sea(High)
16 x 1041.349.632.5
19 x 1238.942.329.1
16 x 10 8AA710.34.9
19 x 12 8AA5.98.93.6

擁有 800 個 Stream Processing Unit 的 Radeon HD 4850 表現強勁,迫使對手 NVIDIA 要把高階 GeForce 9800GTX 大幅降價應戰,由於兩者均定價於 $199 美元,故此測試以這兩款產品為軸心。

據測試所得, GeForce 9800GTX 雖以高階身份紆尊降貴,力阻 Radeon HD 4850 入侵效能級市場,卻意外地未有取得優勢,尤其是在開始反鋸齒及較高解像度下, Radeon HD 4850 更是比 GeForce 9800GTX 出色。

據 AMD 表示, ATI Catalyst 8.6 其實並未完全優化 RV770 ,因此 Radeon HD 4850 仍有一定效能提升空間,而未來 Radeon HD 4850 能否保持強勁競爭力,遊戲支援能力、 Havok 物理加速等都是要主要因素, AMD 必需要在驅動程式上多加努力。

值得注意的是, NVIDIA 提供的支援 PhyX 的 Forceware 177.39 驅動程式,讓 3D Mark Vantage 測試支援 PhyX GPU 物理加速,明顯可以看到加入物理加速技術後,令 CPU 分數大幅提升。

不過,這項測試僅供參考,而事實上 RV770 將會加入 Havok 物理技術,與 PhyX 各有捧場客,但 Havok 支援遊戲數量暫時佔優,因此加入 PhyX 加速後的 3D Mark Vantage 增益,卻未能反映兩者在真實物理運算的效能差異。

功耗測試︰




Radeon HD 4850GeForce 9800GTXRadeon HD 3870
Idle161.3W210.4W137.3W
3D Rendering (Max)274.1W345.6W228.2W

雖然 RV770 大幅提升了 Stream Processing Unit 數目,但其功耗表現令人滿意,在同一平台下, Radeon HD 4850 效能與 Geforce 9800GTX 各有高低,但 GeForce 9800GTX 功耗表現上卻大幅落後 Radeon Hd 4850 ,在省電節能電表上勝負立見。

溫度及聲噪測試︰

Radeon HD 4850
Ambient Temp25.5C
Idle63 ~ 65C
3D Rendering (20Mins)95.1 ~ 98.2 C
Amibent Noise48.2 dBA
Idle54.5 dBA
3D Rendering (20Mins)55.4 dBA
Full Fan Speed63.2dBA

老實說,如果要找挑剔 Radeon HD 4850 的地方,相信一定是散熱器設計,儘管 Radeon HD 4850 最高功耗僅 110W ,但 Single Slot 散熱器卻令繪圖卡長期處於高熱狀態,在 2D 模式下核心溫度已達 63 ~ 65C ,進入遊戲後最高達 95.1 ~ 98.2C 。

Radeon HD 4850 採用 Single Slot 設計,僅採用既小又薄的風扇,成為了高熱的罪魁禍首,當超過 106c 時,風扇會突然全速啟動。其實以 Radeon HD 4850 的熱量表現,要保持 Single Slot 散熱其實十分勉強,建議大家可選購非公板散熱器產品,相信會有較好的溫度及聲噪表現。

後記︰

自 Radeon 9700/9800 以後,很久沒看到那麼具吸引的 Radeon 繪圖卡, AMD 放棄高階無意義的效能數字遊戲競逐,搶在對手前面推出新一代效能級產品,讓 AMD 有機會在效能級市場佔下頭香。

RV770 繪圖核心亦沒有讓消費者失望,強勁的性價比表現迫使 NVIDIA 使出玉石俱焚政策,以高階 GeForce 9800GTX 大幅低價力阻 AMD 氣勢,但在整體成本、功耗及效能仍未能有效壓制 Radeon HD 4850 下,此招卻未有收到明顯作用。

再加上 Radeon HD 4850 仍有一定降價空間, GeForce 9800GTX 在成本上難以招架構, NVIDIA 必需在短期內拿出 GeForce GT 200 系列,才能扭轉劣勢。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

JBTALKS.CC |联系我们 |隐私政策 |Share

GMT+8, 2024-7-5 09:16 PM , Processed in 0.116793 second(s), 26 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

Ultra High-performance Dedicated Server powered by iCore Technology Sdn. Bhd.
Domain Registration | Web Hosting | Email Hosting | Forum Hosting | ECShop Hosting | Dedicated Server | Colocation Services
本论坛言论纯属发表者个人意见,与本论坛立场无关
Copyright © 2003-2012 JBTALKS.CC All Rights Reserved
合作联盟网站:
JBTALKS 马来西亚中文论坛 | JBTALKS我的空间 | ICORE TECHNOLOGY SDN. BHD.
回顶部