HKSpot » 電子玩物

‹‹ 上一主題 | 下一主題 ››

74 ‹‹1 2 3 45

打印

[硬件] What comes after Piledriver?

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

61^# 大中小發表於 2012-4-15 23:34 顯示全部帖子

引用:

原帖由 Puff 於 2012-4-15 23:33 發表

Good point. 有 paper 做過呢樣野。但係問題係 Prefetching for GPU 值唔值得你咁做，當你有 1000k 個 work-items 加埋係 scattered data 諸如此類。

所以我咪話GPU既shader可以為CPU所用, 就可以hide latency, 不過都唔係呢2-3年做到既野

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

62^# 大中小發表於 2012-4-15 23:34 顯示全部帖子

引用:

原帖由 Henry 於 2012-4-15 23:34 發表

咁點解BD慢咁多啊.....

front-end出事

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

63^# 大中小發表於 2012-4-15 23:37 顯示全部帖子

引用:

原帖由 Puff 於 2012-4-15 23:35 發表

當你達到 4-way, 8-way 甚至 16-way 既時候咪得。
當你有 2-way SMT 既時候，就等於要 Cover 既 Latency 減半，不過相對黎講 Execution Time 多一倍咁解。

而且對於 Serial Workload 無好處。 ...

8-way暫時只fujitsu (?)

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

64^# 大中小發表於 2012-4-15 23:39 顯示全部帖子

引用:

原帖由 Henry 於 2012-4-15 23:38 發表

所以GPU個RAM頻寬奇廣,就係餵唔夠就出事.
個人覺得,GPU個384/512bit GDDR5某程度係Cache多過RAM.

不過係high-latency cache

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

65^# 大中小發表於 2012-4-15 23:42 顯示全部帖子

引用:

原帖由 Puff 於 2012-4-15 23:40 發表

但我 doubt 既就係「GPU 既 shader 可以為 CPU 所用」。或者話，就算唔好似你咁搞法都可以為 CPU 所用。
用係邊樹用黎做乜又係個問題。AMD 自己都比左三大類 workload 出黎啦。 ...

取代SSEx / AVX / FMA部分, 留番truncate / align 之類workload俾番CPU做

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

66^# 大中小發表於 2012-4-15 23:48 顯示全部帖子

引用:

原帖由 Henry 於 2012-4-15 23:46 發表

我真係想知幾時會見到CPU個RAM頻寬好似GPU咁多,然後Parallelism就開始推上去好似GPU咁.
但就保持CPU應有既IO同其他各種指令既處理能力.

memory pad用既die size唔小, Intel / AMD唔會咁放資源落去

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

67^# 大中小發表於 2012-4-15 23:55 顯示全部帖子

引用:

原帖由 Henry 於 2012-4-15 23:52 發表

既然Puff講到Parallelism應該可以減低Latency個效能損失,L2/3應該可以唔洗放咁多,從而減少Die size.
Memory pad就頂上L2/3個位.

以前d人話K8係有好大既L3 cache (memory)
但當K10/Nehalem出左之後, 就無人咁講了

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

68^# 大中小發表於 2012-4-16 00:03 顯示全部帖子

引用:

原帖由 Henry 於 2012-4-16 00:02 發表

咁你都知啦.
GPU要同CPU一做架構上既Fusion,CPU會面對GPU既問題,GPU亦都會面對CPU既問題.

咁易就一早做到啦

Intel / AMD / NVIDIA / IBM都努力緊

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

69^# 大中小發表於 2012-4-16 00:05 顯示全部帖子

引用:

原帖由 Henry 於 2012-4-16 00:04 發表
CPU一有High parallelism結果個Cache一樣越來越多.......

仲會繼續升tim

Intel有transistor budget既話, 16/14nm連50MB都夠膽放落去

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

70^# 大中小發表於 2012-4-16 00:07 顯示全部帖子

引用:

原帖由 Henry 於 2012-4-16 00:06 發表

Core count都有提升添.
但平均L3/core既數字就.....

都會升
Nehalem: 2MB / core
SB: 2.5MB / core

K10: 512KB / core
Bulldozer: 2MB / core

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

71^# 大中小發表於 2012-4-16 00:08 顯示全部帖子

引用:

原帖由 Puff 於 2012-4-16 00:07 發表

So 分開是最好的結果，大家性格都唔夾，無謂一拖再拖啦。

有人追fusion係因為一旦合到, 性能升到你唔信

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

72^# 大中小發表於 2012-4-16 00:13 顯示全部帖子

引用:

原帖由 Puff 於 2012-4-16 00:12 發表

唔做情侶可以做伙伴，一個做 CEO，一個做 CTO. 點解一定要聯席 CEO.

聯席快好多

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

73^# 大中小發表於 2012-4-16 00:15 顯示全部帖子

引用:

原帖由 Puff 於 2012-4-16 00:14 發表

That's the means of APU... 然後大佬 problem 都有好多種架嘛。唔係唔理三七廿一都擲過去 GPU 搞架嘛。
如果唔係 AMD 推 task-based parallelism 既 HSA 做乜？

無著數, 因為software optimization始終唔夠efficient

http://bbs.hk-spot.com

TOP

qcmadness

管理員

Rank: 10

吹水部屋

PM
加為好友
當前離線

74^# 大中小發表於 2012-4-16 00:28 顯示全部帖子

引用:

原帖由 Puff 於 2012-4-16 00:26 發表

It dependsssssssssssssss on what you are doing.

intel / amd cannot control what the user doing
they can only design hardware and tune software for the users

http://bbs.hk-spot.com

TOP

74 ‹‹1 2 3 45

HKSpot » 電子玩物

‹‹ 上一主題 | 下一主題 ››

當前時區 GMT+8, 現在時間是 2026-7-24 09:49

清除 Cookies - 聯繫我們 - 幫助 - 界面風格

Powered by Discuz! 6.0 Lite © 2005-2013 HKSpot
Designed by XT Zone @ Arthur Lee

Processed in 0.028685 Second(s), 9 Queries, Gzip enabled.