并行計(jì)算 哪些程序適合在GPU上進(jìn)行并行運(yùn)算?
哪些程序適合在GPU上進(jìn)行并行運(yùn)算?我不專業(yè)。我不專業(yè)。我的理解是“很多輕量級計(jì)算”適合GPU,因?yàn)镚PU本身遵循多核路線,但每個(gè)核的結(jié)構(gòu)相對簡單。例如,一些高端卡可以有上千甚至上千個(gè)計(jì)算單元,并支持
哪些程序適合在GPU上進(jìn)行并行運(yùn)算?
我不專業(yè)。我不專業(yè)。我的理解是“很多輕量級計(jì)算”適合GPU,因?yàn)镚PU本身遵循多核路線,但每個(gè)核的結(jié)構(gòu)相對簡單。例如,一些高端卡可以有上千甚至上千個(gè)計(jì)算單元,并支持大量的數(shù)據(jù)并行計(jì)算。比如“采礦”或者詩@家其原理是對大量數(shù)據(jù)應(yīng)用相同的數(shù)學(xué)公式。操作過程本身并不復(fù)雜,但數(shù)據(jù)量非常大(例如,每組數(shù)據(jù)處理并不復(fù)雜,但有十億組數(shù)據(jù)需要處理)。這時(shí),GPU的多核優(yōu)勢可以體現(xiàn)出來:多個(gè)alu同時(shí)運(yùn)行。另一方面,它更適合在CPU上計(jì)算“少量復(fù)雜操作”。
GPU并行計(jì)算和CPU多線程計(jì)算有什么區(qū)別?
從您的照片中可以看到。。
CPU是8個(gè)諸葛亮,GPU是4096個(gè)鞋匠。。
數(shù)字不同。。
CPU單核計(jì)算能力超強(qiáng),但多核計(jì)算能力需要通過編程來協(xié)調(diào)。這是一門叫做并行計(jì)算編程的科學(xué)。
在CPU從單核到雙核的過程中,一開始的改進(jìn)非常有限,因?yàn)槌绦騿T實(shí)在不愿意再寫代碼了。
隨著程序越來越大,人們發(fā)現(xiàn)如果沒有并行化,編程速度太慢。。因此,我們更加關(guān)注并行編程。
回到主題,CPU和GPU并行編程的區(qū)別是什么。
CPU的并行操作似乎是由幾個(gè)不同的獨(dú)立人員協(xié)調(diào)的。有點(diǎn)像兄弟之間互相幫助。
GPU不同。GPU中的流處理器太多了,基本上有幾千個(gè),所以我們把它們分成一組32個(gè)流處理器,即32個(gè)SPSsm.流媒體這32個(gè)流處理器的操作是相同的。例如,如果為1,則32個(gè)流處理器中的每一個(gè)都將添加一個(gè)。CPU不需要給出不同的指令。
由于這32個(gè)SP位于同一個(gè)SM中,為了提高效率,它們將讀取相同的內(nèi)存。SM上有幾種不同的結(jié)構(gòu),所以我不會重復(fù)。。畢竟,GPU內(nèi)核太多了。。