在嵌入式多核集群中利用OCP處理高速緩沖器一致流量
發(fā)布時(shí)間:2008/8/22 0:00:00 訪問次數(shù):425
源于一種基于消息的存儲(chǔ)一致模型
傳統(tǒng)上,多處理器系統(tǒng)中的存儲(chǔ)器一致性都是通過總線偵聽實(shí)現(xiàn)的,每個(gè)內(nèi)核都與一個(gè)通用多層總線連接,能夠偵聽同級(jí)處理器的存儲(chǔ)器存取流量,以調(diào)節(jié)每個(gè)高速緩沖器行的一致狀態(tài)。這樣,每個(gè)內(nèi)核都在本地保持了l1高速緩沖器行的一致狀態(tài),并通過通用總線將狀態(tài)的改變通知同級(jí)處理器。
soc不斷增加的面積和復(fù)雜性導(dǎo)致了多層總線基本哲學(xué)的改變,以利于采用集中流量路由的本地點(diǎn)對(duì)點(diǎn)連接。由于負(fù)載的減少和段長的縮短,這將有助于顯著加速和推動(dòng)現(xiàn)在的本地化總線段的改善。同時(shí),也可以緩解總線爭(zhēng)用問題,同時(shí)增加了本地化數(shù)據(jù)交換吞吐量。為了滿足這一系統(tǒng)架構(gòu)趨勢(shì),出現(xiàn)了ocp(開放內(nèi)核協(xié)議)標(biāo)準(zhǔn),進(jìn)一步鞏固了這一設(shè)計(jì)哲學(xué)。另外,ip供應(yīng)商業(yè)務(wù)模式的出現(xiàn)催化了ip互連和設(shè)計(jì)方法的標(biāo)準(zhǔn)化,有利于在一個(gè)開放標(biāo)準(zhǔn)基礎(chǔ)上實(shí)現(xiàn)設(shè)計(jì)的復(fù)用。
然而,與通過ocp互連段操控一樣,本地化總線執(zhí)行將整個(gè)多核集群上的處理器分拆開。一致方案不能直接基于總線偵聽和依賴總線仲裁來確保存取排序,需要不同的通信方法來確保數(shù)據(jù)存取的一致性。在爭(zhēng)用l1行數(shù)據(jù)請(qǐng)求排序的過程中,其他挑戰(zhàn)也浮現(xiàn)出來。應(yīng)對(duì)這些挑戰(zhàn)的一種方法是給每個(gè)處理單元增加一致消息通信,如圖1所示。這些消息提供了偵聽型緩沖器一致的方法。
圖 1 一致處理系統(tǒng)
一致消息包含了ocp協(xié)議中的一個(gè)新命令。處理器系統(tǒng)中的成員向一個(gè)集中一致管理器發(fā)送一致消息。該管理器提供存取排序(順序化)和消息路由,為同級(jí)成員提供偵聽型存取。這些同級(jí)成員將以其單獨(dú)的l1行狀態(tài)進(jìn)行響應(yīng),并發(fā)出一個(gè)消息響應(yīng)。根據(jù)這些響應(yīng),一致管理器發(fā)起對(duì)內(nèi)核間一致數(shù)據(jù)的數(shù)據(jù)移動(dòng),將存取集中在更高級(jí)別的存儲(chǔ)器層,如l2和l3高速緩沖器。i/o一致單元還可提供一種方式逐漸采用/逐漸淘汰數(shù)據(jù)進(jìn)/出一致地址空間的數(shù)據(jù),它是一致消息交換的一部分。
除了ocp協(xié)議中的新消息類命令外,還需要具體的處理器響應(yīng)一致狀態(tài)請(qǐng)求,因此它們不只是總線處理的發(fā)動(dòng)者(主控)。一致處理系統(tǒng)滿足這一要求的方法可能是通過提供一個(gè)ocp從端口來接收和響應(yīng)一致管理器發(fā)送的消息。處理器的一致請(qǐng)求將利用ocp主端口。在處理集群內(nèi),內(nèi)核間和一致管理器之間的一致消息交換被稱為“干預(yù)”。處理器的ocp從端口接收干預(yù),因此稱為“干預(yù)端口”。
如圖1所示,1004k系統(tǒng)的每個(gè)獨(dú)立處理器都是基于我們多線程處理器架構(gòu)的,可以在單標(biāo)量、9級(jí)流水線范圍內(nèi)提供兩個(gè)獨(dú)立線程并處理上下文。復(fù)制的1級(jí)數(shù)據(jù)高速緩沖器標(biāo)記陣列可同時(shí)用于存取cpu操作和干預(yù)查尋。一致處理系統(tǒng)可支持mesi型高速緩沖器行一致性。
處理系統(tǒng)一致管理器通過其請(qǐng)求單元—ocp從端口,在每個(gè)cpu和i/o一致單元的推動(dòng)下,接收進(jìn)入的消息并對(duì)其進(jìn)行串化。串化的消息按照其地址空間和上下文,或使用“存儲(chǔ)器接口單元”發(fā)送到更高級(jí)別的高速緩沖器層,或使用“偵聽代理”發(fā)送至同級(jí)處理器和i/o一致單元。偵聽代理發(fā)起ocp主處理(干預(yù))來查尋每個(gè)處理器的一致l1高速緩沖器行狀態(tài)。干預(yù)返回到消息發(fā)起者,稱為自我干預(yù),有助于發(fā)起者提供存取排序。對(duì) cpu 發(fā)起的一致消息響應(yīng)和數(shù)據(jù)響應(yīng)是在“響應(yīng)單元”內(nèi)確立的,并發(fā)送到每個(gè) cpu。
一致ocp命令
在1004k cps中使用的ocp命令可以分成三類。
第一類是保持mesi型高速緩沖器行狀態(tài)的一致消息。它們是cpu負(fù)載/存儲(chǔ)操作的結(jié)果,能夠發(fā)起cpu和/或存儲(chǔ)器子系統(tǒng)之間的數(shù)據(jù)移動(dòng)。cps(一致處理系統(tǒng))的所有同級(jí)cpu將接收由一個(gè)發(fā)起者發(fā)送的一致消息,并根據(jù)它們的高速緩沖器行一致狀態(tài)做出響應(yīng)。一致管理器將根據(jù)需要發(fā)起數(shù)據(jù)移動(dòng)。
一致高速緩沖器操作指令用于一致地址空間內(nèi)高速緩沖器行的維護(hù)。i/o流量將新的一致行帶入該域,或?qū)⒁恢律舷挛膹母咚倬彌_器行中移除。另外,還要進(jìn)行存儲(chǔ)器層的同步化操作。
第三類是非一致命令,在一致地址空間外的存儲(chǔ)區(qū)中執(zhí)行ocp主端口處理。它們代表了ocp讀寫命令。
一致消息
一致處理系統(tǒng)可能執(zhí)行四個(gè)一致消息,這四個(gè)消息是由cpu負(fù)載/存儲(chǔ)活動(dòng)產(chǎn)生的l1高速緩沖器行狀態(tài)變化導(dǎo)致的。發(fā)起的cpu將這個(gè)消息以ocp主端口命令發(fā)送。系統(tǒng)的同級(jí)cpu接收基于該行狀態(tài)變化的干預(yù),并以其本地高速緩沖器行狀態(tài)進(jìn)行響應(yīng)。
第一種消息類型是cohreadown,表示在嘗試修改高速緩沖器行時(shí)發(fā)生的高速緩沖器的不命中。同級(jí)內(nèi)核遇到處于“修改”狀態(tài)的該行時(shí),會(huì)強(qiáng)制回寫到存儲(chǔ)器子系統(tǒng)中,并執(zhí)行本地失效。作為優(yōu)化,本地遇到的行數(shù)據(jù)將被轉(zhuǎn)發(fā)到請(qǐng)求方 cpu,以降低存取延遲。請(qǐng)求方cpu將使該行作為“專有”行,并執(zhí)行行修改指令。然后,高速緩沖器行狀態(tài)將變成“修改過的”。在等待行重新填滿的時(shí)候,請(qǐng)求方cpu將繼
源于一種基于消息的存儲(chǔ)一致模型
傳統(tǒng)上,多處理器系統(tǒng)中的存儲(chǔ)器一致性都是通過總線偵聽實(shí)現(xiàn)的,每個(gè)內(nèi)核都與一個(gè)通用多層總線連接,能夠偵聽同級(jí)處理器的存儲(chǔ)器存取流量,以調(diào)節(jié)每個(gè)高速緩沖器行的一致狀態(tài)。這樣,每個(gè)內(nèi)核都在本地保持了l1高速緩沖器行的一致狀態(tài),并通過通用總線將狀態(tài)的改變通知同級(jí)處理器。
soc不斷增加的面積和復(fù)雜性導(dǎo)致了多層總線基本哲學(xué)的改變,以利于采用集中流量路由的本地點(diǎn)對(duì)點(diǎn)連接。由于負(fù)載的減少和段長的縮短,這將有助于顯著加速和推動(dòng)現(xiàn)在的本地化總線段的改善。同時(shí),也可以緩解總線爭(zhēng)用問題,同時(shí)增加了本地化數(shù)據(jù)交換吞吐量。為了滿足這一系統(tǒng)架構(gòu)趨勢(shì),出現(xiàn)了ocp(開放內(nèi)核協(xié)議)標(biāo)準(zhǔn),進(jìn)一步鞏固了這一設(shè)計(jì)哲學(xué)。另外,ip供應(yīng)商業(yè)務(wù)模式的出現(xiàn)催化了ip互連和設(shè)計(jì)方法的標(biāo)準(zhǔn)化,有利于在一個(gè)開放標(biāo)準(zhǔn)基礎(chǔ)上實(shí)現(xiàn)設(shè)計(jì)的復(fù)用。
然而,與通過ocp互連段操控一樣,本地化總線執(zhí)行將整個(gè)多核集群上的處理器分拆開。一致方案不能直接基于總線偵聽和依賴總線仲裁來確保存取排序,需要不同的通信方法來確保數(shù)據(jù)存取的一致性。在爭(zhēng)用l1行數(shù)據(jù)請(qǐng)求排序的過程中,其他挑戰(zhàn)也浮現(xiàn)出來。應(yīng)對(duì)這些挑戰(zhàn)的一種方法是給每個(gè)處理單元增加一致消息通信,如圖1所示。這些消息提供了偵聽型緩沖器一致的方法。
圖 1 一致處理系統(tǒng)
一致消息包含了ocp協(xié)議中的一個(gè)新命令。處理器系統(tǒng)中的成員向一個(gè)集中一致管理器發(fā)送一致消息。該管理器提供存取排序(順序化)和消息路由,為同級(jí)成員提供偵聽型存取。這些同級(jí)成員將以其單獨(dú)的l1行狀態(tài)進(jìn)行響應(yīng),并發(fā)出一個(gè)消息響應(yīng)。根據(jù)這些響應(yīng),一致管理器發(fā)起對(duì)內(nèi)核間一致數(shù)據(jù)的數(shù)據(jù)移動(dòng),將存取集中在更高級(jí)別的存儲(chǔ)器層,如l2和l3高速緩沖器。i/o一致單元還可提供一種方式逐漸采用/逐漸淘汰數(shù)據(jù)進(jìn)/出一致地址空間的數(shù)據(jù),它是一致消息交換的一部分。
除了ocp協(xié)議中的新消息類命令外,還需要具體的處理器響應(yīng)一致狀態(tài)請(qǐng)求,因此它們不只是總線處理的發(fā)動(dòng)者(主控)。一致處理系統(tǒng)滿足這一要求的方法可能是通過提供一個(gè)ocp從端口來接收和響應(yīng)一致管理器發(fā)送的消息。處理器的一致請(qǐng)求將利用ocp主端口。在處理集群內(nèi),內(nèi)核間和一致管理器之間的一致消息交換被稱為“干預(yù)”。處理器的ocp從端口接收干預(yù),因此稱為“干預(yù)端口”。
如圖1所示,1004k系統(tǒng)的每個(gè)獨(dú)立處理器都是基于我們多線程處理器架構(gòu)的,可以在單標(biāo)量、9級(jí)流水線范圍內(nèi)提供兩個(gè)獨(dú)立線程并處理上下文。復(fù)制的1級(jí)數(shù)據(jù)高速緩沖器標(biāo)記陣列可同時(shí)用于存取cpu操作和干預(yù)查尋。一致處理系統(tǒng)可支持mesi型高速緩沖器行一致性。
處理系統(tǒng)一致管理器通過其請(qǐng)求單元—ocp從端口,在每個(gè)cpu和i/o一致單元的推動(dòng)下,接收進(jìn)入的消息并對(duì)其進(jìn)行串化。串化的消息按照其地址空間和上下文,或使用“存儲(chǔ)器接口單元”發(fā)送到更高級(jí)別的高速緩沖器層,或使用“偵聽代理”發(fā)送至同級(jí)處理器和i/o一致單元。偵聽代理發(fā)起ocp主處理(干預(yù))來查尋每個(gè)處理器的一致l1高速緩沖器行狀態(tài)。干預(yù)返回到消息發(fā)起者,稱為自我干預(yù),有助于發(fā)起者提供存取排序。對(duì) cpu 發(fā)起的一致消息響應(yīng)和數(shù)據(jù)響應(yīng)是在“響應(yīng)單元”內(nèi)確立的,并發(fā)送到每個(gè) cpu。
一致ocp命令
在1004k cps中使用的ocp命令可以分成三類。
第一類是保持mesi型高速緩沖器行狀態(tài)的一致消息。它們是cpu負(fù)載/存儲(chǔ)操作的結(jié)果,能夠發(fā)起cpu和/或存儲(chǔ)器子系統(tǒng)之間的數(shù)據(jù)移動(dòng)。cps(一致處理系統(tǒng))的所有同級(jí)cpu將接收由一個(gè)發(fā)起者發(fā)送的一致消息,并根據(jù)它們的高速緩沖器行一致狀態(tài)做出響應(yīng)。一致管理器將根據(jù)需要發(fā)起數(shù)據(jù)移動(dòng)。
一致高速緩沖器操作指令用于一致地址空間內(nèi)高速緩沖器行的維護(hù)。i/o流量將新的一致行帶入該域,或?qū)⒁恢律舷挛膹母咚倬彌_器行中移除。另外,還要進(jìn)行存儲(chǔ)器層的同步化操作。
第三類是非一致命令,在一致地址空間外的存儲(chǔ)區(qū)中執(zhí)行ocp主端口處理。它們代表了ocp讀寫命令。
一致消息
一致處理系統(tǒng)可能執(zhí)行四個(gè)一致消息,這四個(gè)消息是由cpu負(fù)載/存儲(chǔ)活動(dòng)產(chǎn)生的l1高速緩沖器行狀態(tài)變化導(dǎo)致的。發(fā)起的cpu將這個(gè)消息以ocp主端口命令發(fā)送。系統(tǒng)的同級(jí)cpu接收基于該行狀態(tài)變化的干預(yù),并以其本地高速緩沖器行狀態(tài)進(jìn)行響應(yīng)。
第一種消息類型是cohreadown,表示在嘗試修改高速緩沖器行時(shí)發(fā)生的高速緩沖器的不命中。同級(jí)內(nèi)核遇到處于“修改”狀態(tài)的該行時(shí),會(huì)強(qiáng)制回寫到存儲(chǔ)器子系統(tǒng)中,并執(zhí)行本地失效。作為優(yōu)化,本地遇到的行數(shù)據(jù)將被轉(zhuǎn)發(fā)到請(qǐng)求方 cpu,以降低存取延遲。請(qǐng)求方cpu將使該行作為“專有”行,并執(zhí)行行修改指令。然后,高速緩沖器行狀態(tài)將變成“修改過的”。在等待行重新填滿的時(shí)候,請(qǐng)求方cpu將繼
熱門點(diǎn)擊
- 存儲(chǔ)器的地址線(Address Line)數(shù)
- 一套數(shù)字音頻采集、播放和傳輸系統(tǒng)的實(shí)現(xiàn)
- 1-Wire總線與DS18B20應(yīng)用仿真
- 在嵌入式系統(tǒng)中應(yīng)用NAND Flash閃存作
- 基于μPD780822型單片機(jī)的客車CAN總
- 基于USB的ARINC429總線接口模塊設(shè)計(jì)
- 賽普拉斯2Mb/8Mb nvSRAM無需電池
- ST7267單片機(jī)與SIM卡的接口設(shè)計(jì)
- 內(nèi)核棧的使用
- S3C2440 Windows CE的RTC
推薦技術(shù)資料
- MOSFET 電感單片降壓開關(guān)模式變換器優(yōu)勢(shì)
- SiC MOSFET 和 IG
- 新型 電隔離無芯線性霍爾效應(yīng)電
- 業(yè)界超小絕對(duì)位置編碼器技術(shù)參數(shù)設(shè)計(jì)
- 高帶寬、更高分辨率磁角度傳感技術(shù)應(yīng)用探究
- MagAlpha 角度位置傳感
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動(dòng)IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究