基于當(dāng)代DRAM結(jié)構(gòu)的存儲(chǔ)器控制器設(shè)計(jì)

發(fā)布時(shí)間:2008/8/12 0:00:00 訪問(wèn)次數(shù):625

1、引言

　　當(dāng)代計(jì)算機(jī)系統(tǒng)越來(lái)越受存儲(chǔ)性能的限制。處理器性能每年以60％的速率增長(zhǎng)，存儲(chǔ)器芯片每年僅僅增加10％的帶寬，本文就如何設(shè)計(jì)一種符合當(dāng)代dram結(jié)構(gòu)的高效存儲(chǔ)器控制器進(jìn)行研究。

　　本文第二部分介紹當(dāng)代dram結(jié)構(gòu)特點(diǎn)；第三部分介紹存儲(chǔ)器控制器結(jié)構(gòu)以及調(diào)度算法；第四部分介紹模擬環(huán)境以及性能表現(xiàn)。

2、當(dāng)代dram結(jié)構(gòu)

　　為了提高存儲(chǔ)器的性能，存儲(chǔ)器控制器的設(shè)計(jì)必須充分利用當(dāng)代dram的特點(diǎn)。dram是3d的存儲(chǔ)器（體行列），每個(gè)體獨(dú)立于其他體操作并且一次存取整行。當(dāng)存儲(chǔ)陣列的一行被存�。ㄐ屑せ睿�，存儲(chǔ)陣列的整行被傳輸?shù)竭@個(gè)體的行緩沖。當(dāng)一行在行緩沖中處于激活態(tài)，任何的讀寫（列存取）可以執(zhí)行。當(dāng)完成所有可利用的列存取，被緩沖的行必須依靠外在的操作（體預(yù)充電）寫回存儲(chǔ)陣列，為后來(lái)的行激活操作做準(zhǔn)備。
　　
　　存儲(chǔ)器存取調(diào)度者必須滿足dram時(shí)序和資源限制。共享的地址和數(shù)據(jù)線資源使存取串行化到不同的dram體，但是每個(gè)體的狀態(tài)機(jī)是獨(dú)立的。因此，調(diào)度者必須仲裁要使用單一資源的預(yù)充電、行、列操作。要充分利用存儲(chǔ)帶寬，必須每次行激活下有足夠的列存取并且隱藏其他體的預(yù)充電/激活延遲。

3、存儲(chǔ)器控制器結(jié)構(gòu)及調(diào)度算法

　　存儲(chǔ)器存取調(diào)度是排序dram操作（體預(yù)充電，行激活，列存�。┩瓿僧�(dāng)前掛起的存儲(chǔ)器存取的過(guò)程。操作表示一個(gè)命令（如行激活、列存�。�，被存儲(chǔ)器控制器發(fā)射到dram。訪問(wèn)表示由處理器產(chǎn)生的存儲(chǔ)器訪問(wèn)（如讀訪問(wèn)或者寫訪問(wèn)）。一個(gè)訪問(wèn)產(chǎn)生一個(gè)或者多個(gè)存儲(chǔ)器操作。

　　每個(gè)體有預(yù)充電管理器，行仲裁器。預(yù)充電管理器決定什么時(shí)候?qū)εc他相關(guān)的體預(yù)充電。每個(gè)體的行仲裁器決定哪一行被激活。列仲裁器被所有體共享，授權(quán)共享的數(shù)據(jù)線資源給來(lái)自所有掛起的訪問(wèn)的列存取。最后，預(yù)充電管理器、行仲裁器、列仲裁器發(fā)射選擇的操作給單一的地址仲裁器，地址仲裁器授予共享地址資源給一個(gè)或者多個(gè)操作。

　　預(yù)充電管理器，行仲裁器，列仲裁器可以使用多個(gè)不同的策略選擇dram操作。由于地址線資源的是共享的，地址仲裁器策略決定哪個(gè)預(yù)充電、激活、列操作被執(zhí)行。跟其他調(diào)度策略一樣，按序或者優(yōu)先權(quán)策略可用來(lái)作為地址仲裁器策略。列優(yōu)先調(diào)度策略可以減少到激活行的訪問(wèn)延遲，然而預(yù)充電優(yōu)先或者行優(yōu)先調(diào)度策略會(huì)增加體并行性。

　　下面介紹幾種預(yù)充電管理器，行仲裁器，列仲裁器可能使用的調(diào)度策略：

　　in order：dram操作只會(huì)執(zhí)行最早請(qǐng)求掛起的訪問(wèn)；

　　ordered：越老的訪問(wèn)優(yōu)先級(jí)越高；

　　open：只有在其他行有掛起的訪問(wèn)而激活行沒有掛起的訪問(wèn)才進(jìn)行體預(yù)充電。當(dāng)有顯著的行局部性使得后來(lái)的訪問(wèn)命中前面訪問(wèn)的行，open策略應(yīng)該采用；

　　closed：只要激活行沒有掛起的訪問(wèn)體就預(yù)充電。后來(lái)的訪問(wèn)不太會(huì)命中前面訪問(wèn)的行，closed策略應(yīng)該采用。

4、控制器性能表現(xiàn)

　　傳輸帶寬而不是訪問(wèn)延遲驅(qū)動(dòng)流處理器性能。因此流媒體處理系統(tǒng)是首要的需要存儲(chǔ)器存取調(diào)度。為了評(píng)價(jià)存儲(chǔ)器存取調(diào)度對(duì)于媒體處理器的性能影響，通過(guò)模擬運(yùn)行典型的基準(zhǔn)程序。

4.1模擬環(huán)境及基準(zhǔn)

　　imagine流存儲(chǔ)系統(tǒng)包括2個(gè)地址產(chǎn)生器，4個(gè)交叉存儲(chǔ)體控制器，2個(gè)記錄緩沖按正確順序放置流數(shù)據(jù)在srf。所有這些單元在同一芯片imagine處理器核中。地址產(chǎn)生器支持3種地址模式：常量跨步，間接尋址，位翻轉(zhuǎn)。地址產(chǎn)生器可以產(chǎn)生任何長(zhǎng)度的存儲(chǔ)器訪問(wèn)流，只要數(shù)據(jù)適合srf。對(duì)于跨步訪問(wèn)，地址產(chǎn)生器利用基址、跨步、長(zhǎng)度，連續(xù)的地址依照基地址增加跨步常量。對(duì)于間接尋址，基地址加上來(lái)自srf的變址計(jì)算地址。實(shí)驗(yàn)運(yùn)行在一組微基準(zhǔn)上。

4.2性能表現(xiàn)分析

　　存儲(chǔ)器控制器以執(zhí)行沒有重排序作為性能比較的基礎(chǔ)。即控制器使用按序策略：列存取只執(zhí)行最早掛起的訪問(wèn)。如圖2黑色的條狀代表按序策略性能。unit load取得dram峰值帶寬(2gb/s)的97%，3%的開銷是有時(shí)預(yù)充電/激活延遲；unit load到unit持續(xù)帶寬14%的下降是因?yàn)樽x和寫交叉，讀訪問(wèn)和寫訪問(wèn)轉(zhuǎn)換需要1周期的數(shù)據(jù)引腳高阻態(tài)；unit conflict由于體內(nèi)行來(lái)回交換使得帶寬下降到峰值得51%；random只有unit load 的15%帶寬，因?yàn)榇嫒∫粋€(gè)字需要7 dram周期。

4.3.1 簡(jiǎn)單調(diào)度

　　簡(jiǎn)單的first-ready存取調(diào)度策略平均提高25%性能。first-ready調(diào)度采用ordered優(yōu)先，來(lái)決定所有的調(diào)度。first-ready調(diào)度者考慮所有的掛起訪問(wèn)并且為不違反時(shí)序和資源限制的最早掛起的訪問(wèn)調(diào)度1個(gè)dram操作。這個(gè)調(diào)度算法最明顯的好處就是當(dāng)?shù)却秊榱俗钤鐠炱鹪L問(wèn)的預(yù)充電或者激活操作時(shí)，可以同時(shí)對(duì)其他體進(jìn)行存取，dram內(nèi)部多體并行。

　　first-ready調(diào)度算法比按序在微基準(zhǔn)最多增加性能79%。unit load提高較��；random提高125%，因?yàn)樗麄兡軌蝻@著提高每次行激活列存取的數(shù)量。

4.3.2 復(fù)雜調(diào)度

　　更加具有挑戰(zhàn)性的調(diào)度算

1、引言

2、當(dāng)代dram結(jié)構(gòu)

　　為了提高存儲(chǔ)器的性能，存儲(chǔ)器控制器的設(shè)計(jì)必須充分利用當(dāng)代dram的特點(diǎn)。dram是3d的存儲(chǔ)器（體行列），每個(gè)體獨(dú)立于其他體操作并且一次存取整行。當(dāng)存儲(chǔ)陣列的一行被存�。ㄐ屑せ睿�，存儲(chǔ)陣列的整行被傳輸?shù)竭@個(gè)體的行緩沖。當(dāng)一行在行緩沖中處于激活態(tài)，任何的讀寫（列存�。┛梢詧�(zhí)行。當(dāng)完成所有可利用的列存取，被緩沖的行必須依靠外在的操作（體預(yù)充電）寫回存儲(chǔ)陣列，為后來(lái)的行激活操作做準(zhǔn)備。
　　
　　存儲(chǔ)器存取調(diào)度者必須滿足dram時(shí)序和資源限制。共享的地址和數(shù)據(jù)線資源使存取串行化到不同的dram體，但是每個(gè)體的狀態(tài)機(jī)是獨(dú)立的。因此，調(diào)度者必須仲裁要使用單一資源的預(yù)充電、行、列操作。要充分利用存儲(chǔ)帶寬，必須每次行激活下有足夠的列存取并且隱藏其他體的預(yù)充電/激活延遲。

3、存儲(chǔ)器控制器結(jié)構(gòu)及調(diào)度算法

　　存儲(chǔ)器存取調(diào)度是排序dram操作（體預(yù)充電，行激活，列存�。┩瓿僧�(dāng)前掛起的存儲(chǔ)器存取的過(guò)程。操作表示一個(gè)命令（如行激活、列存取），被存儲(chǔ)器控制器發(fā)射到dram。訪問(wèn)表示由處理器產(chǎn)生的存儲(chǔ)器訪問(wèn)（如讀訪問(wèn)或者寫訪問(wèn)）。一個(gè)訪問(wèn)產(chǎn)生一個(gè)或者多個(gè)存儲(chǔ)器操作。

　　下面介紹幾種預(yù)充電管理器，行仲裁器，列仲裁器可能使用的調(diào)度策略：

　　in order：dram操作只會(huì)執(zhí)行最早請(qǐng)求掛起的訪問(wèn)；

　　ordered：越老的訪問(wèn)優(yōu)先級(jí)越高；

　　closed：只要激活行沒有掛起的訪問(wèn)體就預(yù)充電。后來(lái)的訪問(wèn)不太會(huì)命中前面訪問(wèn)的行，closed策略應(yīng)該采用。

4、控制器性能表現(xiàn)

4.1模擬環(huán)境及基準(zhǔn)

4.2性能表現(xiàn)分析

4.3.1 簡(jiǎn)單調(diào)度

　　簡(jiǎn)單的first-ready存取調(diào)度策略平均提高25%性能。first-ready調(diào)度采用ordered優(yōu)先，來(lái)決定所有的調(diào)度。first-ready調(diào)度者考慮所有的掛起訪問(wèn)并且為不違反時(shí)序和資源限制的最早掛起的訪問(wèn)調(diào)度1個(gè)dram操作。這個(gè)調(diào)度算法最明顯的好處就是當(dāng)?shù)却秊榱俗钤鐠炱鹪L問(wèn)的預(yù)充電或者激活操作時(shí)，可以同時(shí)對(duì)其他體進(jìn)行存取，dram內(nèi)部多體并行。

　　first-ready調(diào)度算法比按序在微基準(zhǔn)最多增加性能79%。unit load提高較�。籸andom提高125%，因?yàn)樗麄兡軌蝻@著提高每次行激活列存取的數(shù)量。

4.3.2 復(fù)雜調(diào)度

　　更加具有挑戰(zhàn)性的調(diào)度算

上一篇：基于鐵電存儲(chǔ)器FM25640在電表數(shù)據(jù)存儲(chǔ)中的應(yīng)用

上一篇：富士施樂選擇賽普拉斯的4-PLL擴(kuò)頻時(shí)鐘發(fā)生器

相關(guān)技術(shù)資料: 7-26MOSFET 電感單片降壓開關(guān)模式變換器優(yōu)勢(shì)特征; 7-26SiC MOSFET 和 IGBT 隔離式柵極驅(qū)動(dòng)器應(yīng)用; 7-26新型電隔離無(wú)芯線性霍爾效應(yīng)電流傳感器; 7-26業(yè)界超小絕對(duì)位置編碼器技術(shù)參數(shù)設(shè)計(jì); 7-26高帶寬、更高分辨率磁角度傳感技術(shù)應(yīng)用探究; 7-26MagAlpha 角度位置傳感器應(yīng)用詳解; 7-25新一代 Cat 1 bis 技術(shù)應(yīng)用簡(jiǎn)述; 7-25世界上最小開源 LoRa + GPS 模塊應(yīng)用探究; 7-25集成 ±0.2°C 溫度傳感器產(chǎn)品詳情; 7-25輸出數(shù)字功率監(jiān)測(cè)器INA745BQWRELRQ1; 7-25高性能超緊湊型OSRAM CT ELLN51.14片式; 7-25帶單線HDQ接口和溫度傳感器BQ2028

相關(guān)IC型號(hào)

浓毛老太交欧美老妇热爱乱,蜜臀性色av免费,妺妺窝人体色www看美女,久久久久久久久久久大尺度免费视频,麻豆人妻无码性色av专区

基于當(dāng)代DRAM結(jié)構(gòu)的存儲(chǔ)器控制器設(shè)計(jì)

熱門點(diǎn)擊

推薦技術(shù)資料