打印

[硬件] What comes after Piledriver?

引用:
原帖由 qcmadness 於 2012-4-15 22:40 發表

無共同語言, 就唔會多人用, 呢樣野好現實的
現實只要有 easy to use & efficient 既 software development stack 同 it's worth 就得。
點解要 asm 一樣?asm 係 for low-level optimization 咋喎。而且呢個世界有 LLVM 啦。

TOP

引用:
原帖由 Puff 於 2012-4-15 22:41 發表

現實只要有 easy to use & efficient 既 software development stack 同 it's worth 就得。
點解要 asm 一樣?asm 係 for low-level optimization 咋喎。而且呢個世界有 LLVM 啦。

...
AMD唔會咁既resource

就算Intel都攪唔掂 (GPU part)
你天真地以為AMD做到?

NVIDIA都一樣辛苦

TOP

引用:
原帖由 qcmadness 於 2012-4-15 22:41 發表

我指既係external ISA, 你而家係指定要用邊個先用邊個, 要software揀定用邊個

hardware做到幫你揀埋, 咪唔駛咁難咁tune個complier
依家 HSA 咪 compile to HSA IL...

TOP

引用:
原帖由 qcmadness 於 2012-4-15 22:42 發表

AMD唔會咁既resource
但佢地就係做緊。

HSA.

TOP

引用:
原帖由 Puff 於 2012-4-15 22:42 發表

但佢地就係做緊。

HSA.
certainly a failure

TOP

引用:
原帖由 qcmadness 於 2012-4-15 22:43 發表

certainly a failure
Let's see then.

TOP

引用:
原帖由 qcmadness 於 2012-4-15 22:42 發表

就算Intel都攪唔掂 (GPU part)
你天真地以為AMD做到?

NVIDIA都一樣辛苦
我覺得係又係兩回事。

Intel 自己搞 Graphics Pipeline on Many CPU cores with only texture unit 係佢自己既事,搞 Graphics 無 Graphics Fixed-function Unit 所以先 epic fail。至於 Heterogeneous Computing... Intel 根本都未推過普及產品,得 Ivy Bridge 先叫開始普及 (OpenCL support)。同 AMD 要做既野無衝突。得 Nvidia 係同 AMD 一樣走緊相近既路。

TOP

引用:
原帖由 Puff 於 2012-4-15 22:40 發表
然後我從頭到尾都唔明點解唔可以有 software interception. Multi-core 都要有 software interception 啦。
我想知有無人而家寫Program會睇Assembly code甚至Machine code,有無計過CPU/GPU每個需時幾耐,有幾多Overhead,應該點樣配合之類?
ロストックで風を攫うや思い出す

TOP

引用:
原帖由 Henry 於 2012-4-15 23:01 發表

我想知有無人而家寫Program會睇Assembly code甚至Machine code,有無計過CPU/GPU每個需時幾耐,有幾多Overhead,應該點樣配合之類?
應該唔多, OpenCL會比較好d

TOP

引用:
原帖由 Puff 於 2012-4-15 22:48 發表

我覺得係又係兩回事。

Intel 自己搞 Graphics Pipeline on Many CPU cores with only texture unit 係佢自己既事,搞 Graphics 無 Graphics Fixed-function Unit 所以先 epic fail。至於 Heterogeneous Computing... ...
NV同AMD係想用GPU取代CPU.
AMD個CPU部門唔夠Intel鬥,要避重就輕,另覓路徑.
不過GPU係咪真係可以取代CPU?:shakehand

CPU: 低量複雜工作
GPU: 大量簡單工作
當然最後都想做到一個架構係可以處理到大量複雜工作既時候,GPU係咪真係有全部優勢?
ロストックで風を攫うや思い出す

TOP

引用:
原帖由 Henry 於 2012-4-15 23:06 發表

NV同AMD係想用GPU取代CPU.
AMD個CPU部門唔夠Intel鬥,要避重就輕,另覓路徑.
不過GPU係咪真係可以取代CPU?:shakehand

CPU: 低量複雜工作
GPU: 大量簡單工作
當然最後都想做到一個架構係可以處理到大量複雜工作既時 ...
當年就係AMD知道Intel會玩埋GPU (Larabee) 先買ATi, 唔係AMD唔買ATi的

GPU既優勢係建基於more restriction on coding
CPU既優勢係建基於more die resource (即係容許多d transistor per thread)

TOP

引用:
原帖由 Henry 於 2012-4-15 23:01 發表

我想知有無人而家寫Program會睇Assembly code甚至Machine code,有無計過CPU/GPU每個需時幾耐,有幾多Overhead,應該點樣配合之類?
無,大多都係 critical path 先會用 asm 寫,你可以睇下 x264 codec 既 source code.

TOP

引用:
原帖由 qcmadness 於 2012-4-15 23:07 發表
GPU既優勢係建基於more restriction on coding
CPU既優勢係建基於more die resource (即係容許多d transistor per thread) ...
GPU 既優勢既建基於 simple control unit + wider execution unit
CPU 既優勢既建基於 complex control unit + high ILP + low-latency cache

Restriction in language features depends on implementation. 以往既 Cluase-based ISA + Global Control Flow Unit 好難做到 Virtual function 之類既野.

[ 本帖最後由 Puff 於 2012-4-15 23:13 編輯 ]

TOP

引用:
原帖由 Puff 於 2012-4-15 23:11 發表
GPU 既優勢既建基於 simple control unit + wider execution unit
原因係你唔駛memory / cache hierarchy, 又唔駛做咁多compatibility issue
引用:
原帖由 Puff 於 2012-4-15 23:11 發表
CPU 既優勢既建基於 complex control unit + high ILP + low-latency cache
所以per GFlops既efficiency低

TOP

引用:
原帖由 qcmadness 於 2012-4-15 23:13 發表


原因係你唔駛memory / cache hierarchy, 又唔駛做咁多compatibility issue
GPU 解決 compatibility issue 係通過 LLVM/low-level machine. 然後所有新代既 GPU 一樣有 cache hierarchy.
引用:
所以per GFlops既efficiency低
無問題架。重點係你跑乜 workload. CPU 既優勢就係 dynamic branching + speedy. 如果你整段 serial + branchy 既 code 放上 GPU 跑咪一樣死。

TOP