Board logo

標題: [硬件] 搵左少少die size data [打印本頁]

作者: qcmadness    時間: 2012-5-1 23:05     標題: 搵左少少die size data

IvyBridge core + L1 / L2: 13.2mm^2 (22nm)
Bulldozer module + L1 / L2: 30.9mm^2 (32nm)

IvyBridge die size: 183mm^2
Zambezi (BD 8-core) die size: 315mm^2
作者: cheungmanhoi    時間: 2012-5-1 23:47

引用:
原帖由 qcmadness 於 2012-5-1 23:05 發表
IvyBridge core + L1 / L2: 17.4mm^2 (22nm)
Bulldozer module + L1 / L2: 30.9mm^2 (32nm)
intel
作者: qcmadness    時間: 2012-5-2 00:27

update左
作者: cheungmanhoi    時間: 2012-5-2 10:11

引用:
原帖由 qcmadness 於 2012-5-2 00:27 發表
update左
反而想知 肥2果d一個core幾多mm^2?
作者: qcmadness    時間: 2012-5-2 10:18

引用:
原帖由 cheungmanhoi 於 2012-5-2 10:11 發表

反而想知 肥2果d一個core幾多mm^2?
Deneb / Shanghai core + L1 / L2: 20.5mm^2 (45nm)
作者: qcmadness    時間: 2012-5-2 14:18

Bulldozer係衰係太多L2 cache



作者: Puff    時間: 2012-5-3 23:39

practice 係 fast L1 + small L2 + big L3... IBM, Sun, Intel 全都是如此。

AMD 會唔會改呢?唔知。... lol 不過從 real world 睇,Bulldozer 既 L2 Cache traffic 係幾繁忙下。2x L1 read/write 都算,仲有 coherence traffic,再加上 serve 埋 TLB...。求神拜佛之後仲快得到就要還神啦。一齊睇 AMD 會唔會轉投 Inclusive L3 Cache 啦。

e.g. L3 WB inclusive of L2 WB, L2 WB inclusive of L1 WT


Trinity 係 32nm 既極致,咁即係話,大概同 32nm 差唔多既 28nm... Kaveri 大概真係要有點大作為先有 expected boost 啦。


[ 本帖最後由 Puff 於 2012-5-3 23:49 編輯 ]
作者: qcmadness    時間: 2012-5-3 23:59

L2 cache size太大
但係主要係因為cache miss太多
作者: Puff    時間: 2012-5-4 20:59

引用:
原帖由 qcmadness 於 2012-5-3 23:59 發表
L2 cache size太大
但係主要係因為cache miss太多
L1 cache miss...
作者: qcmadness    時間: 2012-5-4 21:00

引用:
原帖由 Puff 於 2012-5-4 20:59 發表

L1 cache miss...
L1同L2都多
作者: Puff    時間: 2012-5-4 21:02

引用:
原帖由 qcmadness 於 2012-5-4 21:00 發表

L1同L2都多
點介定係「多」?無 processor 唔會無 cache miss 掛。
比起 Small L2,Hit rate 應該更高喎。除非你講緊 large dataset 下 mispredict 既綜合副作用姐。

[ 本帖最後由 Puff 於 2012-5-4 21:04 編輯 ]
作者: qcmadness    時間: 2012-5-4 21:05

引用:
原帖由 Puff 於 2012-5-4 21:02 發表

點介定係「多」?無 processor 唔會無 cache miss 掛。
比起 Small L2,Hit rate 應該更高喎。除非你講緊 large dataset 下 mispredict 既綜合副作用姐。
< 95%
作者: dom    時間: 2012-5-5 01:04

1. AMD need to improve ther prefetching .......
2. L3 ....slow , when will they finally FIX IT UP ?
作者: qcmadness    時間: 2012-5-5 01:06

引用:
原帖由 dom 於 2012-5-5 01:04 發表
1. AMD need to improve ther prefetching .......
2. L3 ....slow , when will they finally FIX IT UP ?
you will faint if you know the l1 speed
作者: dom    時間: 2012-5-5 01:07

32nm Gen2 Product (Trinity / Piledriver )  希望好睇d ,  執翻 Faildozer Module 個 front-end 正常
作者: dom    時間: 2012-5-5 01:13

引用:
原帖由 qcmadness 於 2012/5/5 01:06 發表

you will faint if you know the l1 speed
FX-4100 latency 67.x ns ... (DDR3-1600 CL9)
Phenom II X6 1045T latency 64.5ns (DDR3-1600 CL9)
作者: qcmadness    時間: 2012-5-5 01:33

引用:
原帖由 dom 於 2012-5-5 01:13 發表


FX-4100 latency 67.x ns ... (DDR3-1600 CL9)
Phenom II X6 1045T latency 64.5ns (DDR3-1600 CL9)
I mean L1 cache latency
作者: dom    時間: 2012-5-5 01:38

引用:
原帖由 qcmadness 於 2012/5/5 01:33 發表

I mean L1 cache latency
我估 慢過 Phenom II 一半
作者: XT    時間: 2012-5-5 02:20

引用:
原帖由 dom 於 2012-5-5 01:07 發表
32nm Gen2 Product (Trinity / Piledriver )  希望好睇d ,  執翻 Faildozer Module 個 front-end 正常
AMD 長久以來都處理唔到個latency問題
作者: cheungmanhoi    時間: 2012-5-6 03:10

加埋手機die size先
a5 122
a5x 163
t3 ~80
t2 ~49
exynos 4210 118
intel atom Penwell ~62
Qualcomm Snapdragon S3: 120-150 mm^2 (40nm?)
TI OMAP4430: 85 mm^2 (45nm) /69.7 ?

[ 本帖最後由 cheungmanhoi 於 2012-5-8 18:49 編輯 ]
作者: qcmadness    時間: 2012-5-6 17:28

引用:
原帖由 XT 於 2012-5-5 02:20 發表

AMD 長久以來都處理唔到個latency問題
bandwidth都唔見得好




歡迎光臨 HKSpot (https://bbs.hk-spot.com/) Powered by Discuz! 6.0 Lite