混合精度的模型雙路系統(tǒng)
發(fā)布時(shí)間:2020/8/22 22:57:24 訪問(wèn)次數(shù):3343
Phoronix進(jìn)行了一項(xiàng)宏偉的測(cè)試,找來(lái)Intel頂級(jí)的至強(qiáng)鉑金8280(28核心56線程),以及AMD頂級(jí)的霄龍7742(64核心128線程),都組成雙路系統(tǒng)。
測(cè)試系統(tǒng)一個(gè)是Ubuntu 19.04,一個(gè)是最新的Ubuntu 20.10 Daily測(cè)試版,后者基于Linux 5.8系統(tǒng)內(nèi)核,編譯器為GCC 10。
測(cè)試項(xiàng)目一共跑了多達(dá)116個(gè),Intel至強(qiáng)平均性能提升了6%,AMD霄龍則只提升了接近4%,看起來(lái)在系統(tǒng)、編譯器、軟件優(yōu)化方面,Intel確實(shí)更勝一籌,隨著時(shí)間可以釋放更多性能潛力。
Intel至強(qiáng)面對(duì)AMD霄龍?jiān)谒袦y(cè)試中依然平均落后多達(dá)14%,硬件性能上的差異,并非軟件優(yōu)化所能完全彌補(bǔ)。
5nm的新一代麒麟1020芯片以及7nm、16nm、28nm的其它芯片,訂單價(jià)值高達(dá)7億美元。
作為全球最大的芯片代工廠,臺(tái)積電擁有全球最先進(jìn)的工藝制程。在其他芯片代工企業(yè)還在研發(fā)7nm芯片的時(shí)候,它已經(jīng)在和三星較量5nm工藝。
麒麟1020芯片預(yù)測(cè)會(huì)在華為Mate40系列產(chǎn)品上首發(fā),保守估計(jì)至少可以供應(yīng)800萬(wàn)臺(tái)Mate40系列產(chǎn)品。臺(tái)積電沒(méi)能按約定提供達(dá)標(biāo)達(dá)量的芯片,華為Mate40系列產(chǎn)品將是第一個(gè)受到影響的產(chǎn)品。
新增Arduino最新款Portenta H7開發(fā)板,進(jìn)一步豐富其龐大的單板機(jī)庫(kù)存。Portenta H7專為滿足規(guī)模企業(yè)、中小企業(yè)(SMB)和專業(yè)創(chuàng)客對(duì)低代碼模塊化硬件系統(tǒng)日益增長(zhǎng)的需求而打造,能夠?yàn)樗麄兊奈锫?lián)網(wǎng)開發(fā)提供支持。Arduino Portenta系列低功耗開發(fā)板設(shè)計(jì)用于工業(yè)應(yīng)用、人工智能(AI)邊緣處理和機(jī)器人,同時(shí)還提供開放式高密度互連新標(biāo)準(zhǔn)以支持先進(jìn)的外圍設(shè)備。Arduino Portenta H7模組具備進(jìn)行物聯(lián)網(wǎng)硬件開發(fā)所需的全部功能,包括加密認(rèn)證芯片及Wi-Fi、低功耗藍(lán)牙和LTE以及窄帶物聯(lián)網(wǎng)通信模塊。其低代碼應(yīng)用開發(fā)平臺(tái)采用模塊化硬件,企業(yè)和創(chuàng)客無(wú)需冗長(zhǎng)的集成項(xiàng)目便能夠進(jìn)行構(gòu)建、測(cè)量和迭代;同時(shí),全新Arduino物聯(lián)網(wǎng)應(yīng)用開發(fā)平臺(tái)(包括Arduino IoT Cloud、云集成Pro IDE、物聯(lián)網(wǎng)UI編輯器)將為用戶帶來(lái)巨大價(jià)值和實(shí)用性,有助于簡(jiǎn)化自定義互聯(lián)產(chǎn)品的創(chuàng)建與投放市場(chǎng)。
第二代IPU GC200,采用臺(tái)積電7nm工藝,晶體管數(shù)量高達(dá)594億個(gè),裸片面積達(dá)到823平方毫米。黃仁勛當(dāng)時(shí)說(shuō)A100是全球最大的7nm芯片,裸片面積為826平方毫米。
英偉達(dá)最新發(fā)布的安培架構(gòu)GPU A100的540億個(gè)晶體管增加了10%。
IPU是一種全新的大規(guī)模并行處理器,推出了基于臺(tái)積電16nm工藝集成236億個(gè)晶體管的GC2 IPU,120瓦的功耗下有125TFlops的混合精度、300M的SRAM能夠把完整的模型放在片內(nèi)。第二代IPU GC2000(MK2)與第一代IPU(MK1)相比,實(shí)際性能提高了8倍。GC200是目前世界上最復(fù)雜的處理器,可使創(chuàng)新者實(shí)現(xiàn)AI的革命性突破。
Mk1 IPU產(chǎn)品與Mk2 IPU產(chǎn)品性能對(duì)比,GC2000芯片內(nèi)部有1,472個(gè)獨(dú)立的處理器內(nèi)核,能夠執(zhí)行8,832個(gè)獨(dú)立的并行線程,所有這些均由900MB的RAM支持。
(素材來(lái)源:21ic和eccn.如涉版權(quán)請(qǐng)聯(lián)系刪除。特別感謝)
Phoronix進(jìn)行了一項(xiàng)宏偉的測(cè)試,找來(lái)Intel頂級(jí)的至強(qiáng)鉑金8280(28核心56線程),以及AMD頂級(jí)的霄龍7742(64核心128線程),都組成雙路系統(tǒng)。
測(cè)試系統(tǒng)一個(gè)是Ubuntu 19.04,一個(gè)是最新的Ubuntu 20.10 Daily測(cè)試版,后者基于Linux 5.8系統(tǒng)內(nèi)核,編譯器為GCC 10。
測(cè)試項(xiàng)目一共跑了多達(dá)116個(gè),Intel至強(qiáng)平均性能提升了6%,AMD霄龍則只提升了接近4%,看起來(lái)在系統(tǒng)、編譯器、軟件優(yōu)化方面,Intel確實(shí)更勝一籌,隨著時(shí)間可以釋放更多性能潛力。
Intel至強(qiáng)面對(duì)AMD霄龍?jiān)谒袦y(cè)試中依然平均落后多達(dá)14%,硬件性能上的差異,并非軟件優(yōu)化所能完全彌補(bǔ)。
5nm的新一代麒麟1020芯片以及7nm、16nm、28nm的其它芯片,訂單價(jià)值高達(dá)7億美元。
作為全球最大的芯片代工廠,臺(tái)積電擁有全球最先進(jìn)的工藝制程。在其他芯片代工企業(yè)還在研發(fā)7nm芯片的時(shí)候,它已經(jīng)在和三星較量5nm工藝。
麒麟1020芯片預(yù)測(cè)會(huì)在華為Mate40系列產(chǎn)品上首發(fā),保守估計(jì)至少可以供應(yīng)800萬(wàn)臺(tái)Mate40系列產(chǎn)品。臺(tái)積電沒(méi)能按約定提供達(dá)標(biāo)達(dá)量的芯片,華為Mate40系列產(chǎn)品將是第一個(gè)受到影響的產(chǎn)品。
新增Arduino最新款Portenta H7開發(fā)板,進(jìn)一步豐富其龐大的單板機(jī)庫(kù)存。Portenta H7專為滿足規(guī)模企業(yè)、中小企業(yè)(SMB)和專業(yè)創(chuàng)客對(duì)低代碼模塊化硬件系統(tǒng)日益增長(zhǎng)的需求而打造,能夠?yàn)樗麄兊奈锫?lián)網(wǎng)開發(fā)提供支持。Arduino Portenta系列低功耗開發(fā)板設(shè)計(jì)用于工業(yè)應(yīng)用、人工智能(AI)邊緣處理和機(jī)器人,同時(shí)還提供開放式高密度互連新標(biāo)準(zhǔn)以支持先進(jìn)的外圍設(shè)備。Arduino Portenta H7模組具備進(jìn)行物聯(lián)網(wǎng)硬件開發(fā)所需的全部功能,包括加密認(rèn)證芯片及Wi-Fi、低功耗藍(lán)牙和LTE以及窄帶物聯(lián)網(wǎng)通信模塊。其低代碼應(yīng)用開發(fā)平臺(tái)采用模塊化硬件,企業(yè)和創(chuàng)客無(wú)需冗長(zhǎng)的集成項(xiàng)目便能夠進(jìn)行構(gòu)建、測(cè)量和迭代;同時(shí),全新Arduino物聯(lián)網(wǎng)應(yīng)用開發(fā)平臺(tái)(包括Arduino IoT Cloud、云集成Pro IDE、物聯(lián)網(wǎng)UI編輯器)將為用戶帶來(lái)巨大價(jià)值和實(shí)用性,有助于簡(jiǎn)化自定義互聯(lián)產(chǎn)品的創(chuàng)建與投放市場(chǎng)。
第二代IPU GC200,采用臺(tái)積電7nm工藝,晶體管數(shù)量高達(dá)594億個(gè),裸片面積達(dá)到823平方毫米。黃仁勛當(dāng)時(shí)說(shuō)A100是全球最大的7nm芯片,裸片面積為826平方毫米。
英偉達(dá)最新發(fā)布的安培架構(gòu)GPU A100的540億個(gè)晶體管增加了10%。
IPU是一種全新的大規(guī)模并行處理器,推出了基于臺(tái)積電16nm工藝集成236億個(gè)晶體管的GC2 IPU,120瓦的功耗下有125TFlops的混合精度、300M的SRAM能夠把完整的模型放在片內(nèi)。第二代IPU GC2000(MK2)與第一代IPU(MK1)相比,實(shí)際性能提高了8倍。GC200是目前世界上最復(fù)雜的處理器,可使創(chuàng)新者實(shí)現(xiàn)AI的革命性突破。
Mk1 IPU產(chǎn)品與Mk2 IPU產(chǎn)品性能對(duì)比,GC2000芯片內(nèi)部有1,472個(gè)獨(dú)立的處理器內(nèi)核,能夠執(zhí)行8,832個(gè)獨(dú)立的并行線程,所有這些均由900MB的RAM支持。
(素材來(lái)源:21ic和eccn.如涉版權(quán)請(qǐng)聯(lián)系刪除。特別感謝)
上一篇:四通道MIPI-DSI多種接口
熱門點(diǎn)擊
- 低功耗長(zhǎng)距離的數(shù)據(jù)傳輸
- 基極電壓與集電極電壓相位相同
- 集成主動(dòng)鉗位電路來(lái)處理感性負(fù)載
- UART控制器的功能集成到FPGA內(nèi)部
- 輕負(fù)載效率降低功率損耗
- ARM處理器的終端類型
- 混合精度的模型雙路系統(tǒng)
- 整合虛擬化和混合現(xiàn)實(shí)環(huán)境
- 脈沖激光器的主要作用
- 電壓超出額定值導(dǎo)致器件故障
推薦技術(shù)資料
- 滑雪繞樁機(jī)器人
- 本例是一款非常有趣,同時(shí)又有一定調(diào)試難度的玩法。EDE2116AB... [詳細(xì)]
- 扇出型面板級(jí)封裝(FOPLP)
- 全球首款無(wú)掩模光刻系統(tǒng)—DSP
- 紫光閃存E5200 PCIe 5.0 企業(yè)級(jí)
- NAND Flash 技術(shù)和系
- 高性能DIMM 內(nèi)存數(shù)據(jù)技術(shù)封
- PCIe Gen4 SSD主控
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動(dòng)IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究