x86擴(kuò)展AVX-512向量自定義AI加速器
發(fā)布時(shí)間:2020/12/13 8:03:59 訪問(wèn)次數(shù):1188
5G 市場(chǎng)期望實(shí)現(xiàn)從邊緣設(shè)備到邊緣服務(wù)器再回到邊緣設(shè)備,往返時(shí)間延遲低至 1ms 的用例。實(shí)現(xiàn)這一目標(biāo)的唯一方法是通過(guò)本地網(wǎng)關(guān)或聚合器,因?yàn)榈竭_(dá)云全程通常需要 100 ms。2019 年秋天推出的 6G 計(jì)劃宣布了 10s μS 延遲的目標(biāo)。
每個(gè)邊緣計(jì)算系統(tǒng)都支持類似的 SoC 架構(gòu),其中包括一個(gè)網(wǎng)絡(luò) SoC、一些存儲(chǔ)、一個(gè)服務(wù)器 SoC,以及現(xiàn)在的一個(gè) AI 加速器或 AI 加速器陣列。每種類型的系統(tǒng)都有自己的延遲、功耗和性能水平。這些系統(tǒng)的一般準(zhǔn)則在進(jìn)行了描述。市場(chǎng)在變化,這些數(shù)字可能會(huì)隨著技術(shù)的進(jìn)步而迅速變化。
制造商:Intel 產(chǎn)品種類:FPGA - 現(xiàn)場(chǎng)可編程門陣列 RoHS: 詳細(xì)信息 產(chǎn)品:MAX 10 邏輯元件數(shù)量:2000 邏輯數(shù)組塊數(shù)量——LAB:125 輸入/輸出端數(shù)量:112 I/O 工作電源電壓:3.3 V 最小工作溫度:- 40 C 最大工作溫度:+ 100 C 安裝風(fēng)格:SMD/SMT 封裝 / 箱體:MBGA-153 封裝:Tray 長(zhǎng)度:8 mm 系列:MAX 10 10M02 寬度:8 mm 商標(biāo):Intel / Altera 自適應(yīng)邏輯模塊 - ALM:- 嵌入式內(nèi)存:108 kbit 最大工作頻率:450 MHz 濕度敏感性:Yes 產(chǎn)品類型:FPGA - Field Programmable Gate Array 工廠包裝數(shù)量:348 子類別:Programmable Logic ICs 商標(biāo)名:MAX 零件號(hào)別名:967126 單位重量:3.137 g
最新的行業(yè)接口標(biāo)準(zhǔn),包括 PCIe 5.0、LPDDR5、DDR5、HBM2e、USB 3.2、CXL、以及基于 PCIe 的 NVMe 和其它基于新一代標(biāo)準(zhǔn)的技術(shù)。與上一代產(chǎn)品相比,這些技術(shù)中的每一種都通過(guò)帶寬改進(jìn)來(lái)降低延遲。
比減少延遲的驅(qū)動(dòng)因素更為突出的是為所有這些邊緣計(jì)算系統(tǒng)增加了 AI 加速。某些服務(wù)器芯片通過(guò) x86 擴(kuò)展AVX-512 向量神經(jīng)網(wǎng)絡(luò)指令 (AVX512 VNNI) 等新指令提供 AI 加速。很多時(shí)候,這種額外的指令集不足以提供預(yù)期任務(wù)所需的低延遲和低功耗實(shí)現(xiàn),所以大多數(shù)新系統(tǒng)中還添加了自定義 AI 加速器。
(素材來(lái)源:ttic和chinaaet.如涉版權(quán)請(qǐng)聯(lián)系刪除。特別感謝)
5G 市場(chǎng)期望實(shí)現(xiàn)從邊緣設(shè)備到邊緣服務(wù)器再回到邊緣設(shè)備,往返時(shí)間延遲低至 1ms 的用例。實(shí)現(xiàn)這一目標(biāo)的唯一方法是通過(guò)本地網(wǎng)關(guān)或聚合器,因?yàn)榈竭_(dá)云全程通常需要 100 ms。2019 年秋天推出的 6G 計(jì)劃宣布了 10s μS 延遲的目標(biāo)。
每個(gè)邊緣計(jì)算系統(tǒng)都支持類似的 SoC 架構(gòu),其中包括一個(gè)網(wǎng)絡(luò) SoC、一些存儲(chǔ)、一個(gè)服務(wù)器 SoC,以及現(xiàn)在的一個(gè) AI 加速器或 AI 加速器陣列。每種類型的系統(tǒng)都有自己的延遲、功耗和性能水平。這些系統(tǒng)的一般準(zhǔn)則在進(jìn)行了描述。市場(chǎng)在變化,這些數(shù)字可能會(huì)隨著技術(shù)的進(jìn)步而迅速變化。
制造商:Intel 產(chǎn)品種類:FPGA - 現(xiàn)場(chǎng)可編程門陣列 RoHS: 詳細(xì)信息 產(chǎn)品:MAX 10 邏輯元件數(shù)量:2000 邏輯數(shù)組塊數(shù)量——LAB:125 輸入/輸出端數(shù)量:112 I/O 工作電源電壓:3.3 V 最小工作溫度:- 40 C 最大工作溫度:+ 100 C 安裝風(fēng)格:SMD/SMT 封裝 / 箱體:MBGA-153 封裝:Tray 長(zhǎng)度:8 mm 系列:MAX 10 10M02 寬度:8 mm 商標(biāo):Intel / Altera 自適應(yīng)邏輯模塊 - ALM:- 嵌入式內(nèi)存:108 kbit 最大工作頻率:450 MHz 濕度敏感性:Yes 產(chǎn)品類型:FPGA - Field Programmable Gate Array 工廠包裝數(shù)量:348 子類別:Programmable Logic ICs 商標(biāo)名:MAX 零件號(hào)別名:967126 單位重量:3.137 g
最新的行業(yè)接口標(biāo)準(zhǔn),包括 PCIe 5.0、LPDDR5、DDR5、HBM2e、USB 3.2、CXL、以及基于 PCIe 的 NVMe 和其它基于新一代標(biāo)準(zhǔn)的技術(shù)。與上一代產(chǎn)品相比,這些技術(shù)中的每一種都通過(guò)帶寬改進(jìn)來(lái)降低延遲。
比減少延遲的驅(qū)動(dòng)因素更為突出的是為所有這些邊緣計(jì)算系統(tǒng)增加了 AI 加速。某些服務(wù)器芯片通過(guò) x86 擴(kuò)展AVX-512 向量神經(jīng)網(wǎng)絡(luò)指令 (AVX512 VNNI) 等新指令提供 AI 加速。很多時(shí)候,這種額外的指令集不足以提供預(yù)期任務(wù)所需的低延遲和低功耗實(shí)現(xiàn),所以大多數(shù)新系統(tǒng)中還添加了自定義 AI 加速器。
(素材來(lái)源:ttic和chinaaet.如涉版權(quán)請(qǐng)聯(lián)系刪除。特別感謝)
熱門點(diǎn)擊
- 高頻長(zhǎng)度大于噪聲頻率相應(yīng)波長(zhǎng)的1/20
- 驅(qū)動(dòng)高采樣率A/D轉(zhuǎn)換器低通響應(yīng)的4階濾波器
- 雙路同步采樣的高速ADC六個(gè)磁芯
- 電磁感應(yīng)式無(wú)線充電功率USON10-2封裝
- Trust&Go安全平臺(tái)的Wi-Fi 單片機(jī)
- 隔離2500Vrms電流傳輸比通道數(shù)電壓
- PMIC和sub-PMIC器件檢測(cè)與運(yùn)算控制
- 離線式電源的BOM元件微處理器VCC
- 768個(gè)流處理器24個(gè)ROP光柵單元
- 低頻去耦短路高頻噪聲芯片的電源管腳根部
推薦技術(shù)資料
- 扇出型面板級(jí)封裝(FOPLP)
- 全球首款無(wú)掩模光刻系統(tǒng)—DSP
- 紫光閃存E5200 PCIe 5.0 企業(yè)級(jí)
- NAND Flash 技術(shù)和系
- 高性能DIMM 內(nèi)存數(shù)據(jù)技術(shù)封
- PCIe Gen4 SSD主控
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動(dòng)IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究