以太網(wǎng)保護切換技術(shù)分析
發(fā)布時間:2008/9/4 0:00:00 訪問次數(shù):980
隨著以太網(wǎng)技術(shù)的迅速發(fā)展,其應用范圍越來越廣,以太網(wǎng)的保護切換功能也變得尤為重要。所謂保護切換,就是在網(wǎng)絡某一鏈路出現(xiàn)故障后,網(wǎng)絡設備能將用戶數(shù)據(jù)包的傳輸路徑快速切換到另一條可用路徑上,并保證數(shù)據(jù)包仍能正確到達所期望的目的地。為了提供可切換的新路徑,網(wǎng)絡必須保證兩點之間的物理鏈路不是唯一的,必須有備份的鏈路。
曾有幾家設備廠商提出各自解決方案,但都有一些缺陷。后經(jīng)多次討論,itu-t(國際電信聯(lián)盟遠程通信標準化組)于今年2月制訂了關于以太網(wǎng)單環(huán)網(wǎng)絡的保護切換方案,即g.8032標準。下面介紹一下該標準的基本內(nèi)容,但為了展示其優(yōu)點,先介紹一下ietf(互聯(lián)網(wǎng)工程任務組)于2003年發(fā)布的具有較大影響的以太網(wǎng)自動保護切換方案rfc3619。
一、rfc3619
該方案的實現(xiàn)過程如下:
圖1是由6臺交換機構(gòu)成的環(huán)網(wǎng)。首先,選擇一臺交換機,例如s1,作為主控節(jié)點。在環(huán)上各鏈路均正常的情況下,s1將它的一個端口阻塞,以防止邏輯成環(huán)而產(chǎn)生網(wǎng)絡風暴。s1如何判斷環(huán)路是完好的呢?它定時(比如每隔1秒)從一個端口向外發(fā)送檢測幀,該幀經(jīng)過環(huán)上節(jié)點逐個傳遞。如果該檢測幀能從s1的另一個端口回來,s1認為環(huán)路是完好的。
當環(huán)上某條鏈路發(fā)生故障,例如s3和s4之間的鏈路發(fā)生故障時,s3和s4先把自己與故障鏈路相連的端口阻塞,然后向主控節(jié)點s1發(fā)送link-down類型的消息,告訴它有鏈路故障。主控節(jié)點收到通知后,把它的后備端口打開,發(fā)送類型為flush-down的消息給環(huán)上所有節(jié)點,告訴它們:環(huán)上有鏈路故障,請刷新地址轉(zhuǎn)發(fā)表,如圖2所示。這就實現(xiàn)了網(wǎng)絡的快速保護切換。
在實際環(huán)境中,link-down消息在向主控節(jié)點傳送的過程中有可能丟失。但是,因為主控節(jié)點在定期發(fā)送檢測幀,所以,即使link-down消息丟失,主控節(jié)點也可以根據(jù)收不到檢測幀這一點來判斷環(huán)路出現(xiàn)了故障。不過這種判斷方法的反應速度顯然比較慢。需要說明的是,環(huán)路出現(xiàn)故障后,s1仍繼續(xù)定期發(fā)送檢測幀。
當s3和s4之間的鏈路恢復正常時,檢測幀得以穿過,主控節(jié)點s1發(fā)現(xiàn)檢測幀成功返回,于是認為環(huán)路恢復正常,便再次阻塞其后備端口,并發(fā)送類型為flush-up的消息給環(huán)上所有節(jié)點,告訴它們:環(huán)上鏈路恢復正常,請刷新地址。
仔細分析一下上述環(huán)網(wǎng)保護方法,不難看出它有以下幾個弱點:
。保绻欤椋睿耄洌铮鳎钕⒃谒屯骺毓(jié)點的途中因故丟失,則主控節(jié)點只能依賴檢測幀超時未返回來判斷環(huán)路出現(xiàn)故障,而這個超時時間一般很長。例如,假設檢測幀是每隔1秒鐘發(fā)送一個,主控節(jié)點考慮到個別幀意外丟失的可能,通常需要將其返回的超時時間設定為2秒或3秒以上。這顯然達不到快速切換的目的。
。玻翩溌饭收鲜菃蜗虻,檢測幀超時機制可能檢測不到該故障。舉個例子,假設s3和s4之間的那條鏈路出現(xiàn)的是s4→s3的單向故障(s3→s4是正常的),那么,逆時針方向傳遞的檢測幀仍然能夠順利地在環(huán)上傳遞,s1無法據(jù)此判斷環(huán)路故障,而只能根據(jù)link-down消息來判斷了。
二、g.8032標準
鑒于rfc3619存在上述弱點,有幾家通信設備廠商曾向itu-t提交了自己的方案,但都存在一些缺陷。經(jīng)過多次討論,itu-t于2008年2月制訂了g.8032標準。該標準與rfc3619存在明顯不同,主要區(qū)別如下:
。保话l(fā)送檢測幀。
。玻溌钒l(fā)生故障后,發(fā)生故障的鏈路兩端的節(jié)點開始定期反復發(fā)送link-down消息,以避免消息丟失。發(fā)送link-down消息的時間間隔不是均勻的,它有個特點:開始的三個link-down消息時間間隔很短,短至毫秒級,后面的link-down消息則以秒級的間隔較慢地發(fā)送。顯然,這很好地解決了快速切換和減輕網(wǎng)絡負擔之間的矛盾。
。常溌坊謴驼:,該鏈路相鄰的兩個節(jié)點也開始定期反復發(fā)送鏈路恢復的link-down消息給主控節(jié)點。但是,主控節(jié)點在收到該消息后并不能立即斷定整個環(huán)路恢復正常,而必須等待一段時間,看是否有消息到來。如果沒有link-down消息到來,則可斷定環(huán)路恢復正常。這是考慮到環(huán)上可能出現(xiàn)兩處鏈路故障的情形。我們假設s3和s4之間鏈路發(fā)生故障,s3和s4將反復發(fā)送link-down消息給主控節(jié)點,如果s4和s5之間的鏈路也發(fā)生故障,則s5也將反復發(fā)送link-down消息。若s3和s4之間的鏈路忽然恢復了,主控節(jié)點將收到s3發(fā)來的鏈路恢復的消息,但它不能立即斷定環(huán)路恢復,而必須等待
隨著以太網(wǎng)技術(shù)的迅速發(fā)展,其應用范圍越來越廣,以太網(wǎng)的保護切換功能也變得尤為重要。所謂保護切換,就是在網(wǎng)絡某一鏈路出現(xiàn)故障后,網(wǎng)絡設備能將用戶數(shù)據(jù)包的傳輸路徑快速切換到另一條可用路徑上,并保證數(shù)據(jù)包仍能正確到達所期望的目的地。為了提供可切換的新路徑,網(wǎng)絡必須保證兩點之間的物理鏈路不是唯一的,必須有備份的鏈路。
曾有幾家設備廠商提出各自解決方案,但都有一些缺陷。后經(jīng)多次討論,itu-t(國際電信聯(lián)盟遠程通信標準化組)于今年2月制訂了關于以太網(wǎng)單環(huán)網(wǎng)絡的保護切換方案,即g.8032標準。下面介紹一下該標準的基本內(nèi)容,但為了展示其優(yōu)點,先介紹一下ietf(互聯(lián)網(wǎng)工程任務組)于2003年發(fā)布的具有較大影響的以太網(wǎng)自動保護切換方案rfc3619。
一、rfc3619
該方案的實現(xiàn)過程如下:
圖1是由6臺交換機構(gòu)成的環(huán)網(wǎng)。首先,選擇一臺交換機,例如s1,作為主控節(jié)點。在環(huán)上各鏈路均正常的情況下,s1將它的一個端口阻塞,以防止邏輯成環(huán)而產(chǎn)生網(wǎng)絡風暴。s1如何判斷環(huán)路是完好的呢?它定時(比如每隔1秒)從一個端口向外發(fā)送檢測幀,該幀經(jīng)過環(huán)上節(jié)點逐個傳遞。如果該檢測幀能從s1的另一個端口回來,s1認為環(huán)路是完好的。
當環(huán)上某條鏈路發(fā)生故障,例如s3和s4之間的鏈路發(fā)生故障時,s3和s4先把自己與故障鏈路相連的端口阻塞,然后向主控節(jié)點s1發(fā)送link-down類型的消息,告訴它有鏈路故障。主控節(jié)點收到通知后,把它的后備端口打開,發(fā)送類型為flush-down的消息給環(huán)上所有節(jié)點,告訴它們:環(huán)上有鏈路故障,請刷新地址轉(zhuǎn)發(fā)表,如圖2所示。這就實現(xiàn)了網(wǎng)絡的快速保護切換。
在實際環(huán)境中,link-down消息在向主控節(jié)點傳送的過程中有可能丟失。但是,因為主控節(jié)點在定期發(fā)送檢測幀,所以,即使link-down消息丟失,主控節(jié)點也可以根據(jù)收不到檢測幀這一點來判斷環(huán)路出現(xiàn)了故障。不過這種判斷方法的反應速度顯然比較慢。需要說明的是,環(huán)路出現(xiàn)故障后,s1仍繼續(xù)定期發(fā)送檢測幀。
當s3和s4之間的鏈路恢復正常時,檢測幀得以穿過,主控節(jié)點s1發(fā)現(xiàn)檢測幀成功返回,于是認為環(huán)路恢復正常,便再次阻塞其后備端口,并發(fā)送類型為flush-up的消息給環(huán)上所有節(jié)點,告訴它們:環(huán)上鏈路恢復正常,請刷新地址。
仔細分析一下上述環(huán)網(wǎng)保護方法,不難看出它有以下幾個弱點:
1.如果link-down消息在送往主控節(jié)點的途中因故丟失,則主控節(jié)點只能依賴檢測幀超時未返回來判斷環(huán)路出現(xiàn)故障,而這個超時時間一般很長。例如,假設檢測幀是每隔1秒鐘發(fā)送一個,主控節(jié)點考慮到個別幀意外丟失的可能,通常需要將其返回的超時時間設定為2秒或3秒以上。這顯然達不到快速切換的目的。
2.若鏈路故障是單向的,檢測幀超時機制可能檢測不到該故障。舉個例子,假設s3和s4之間的那條鏈路出現(xiàn)的是s4→s3的單向故障(s3→s4是正常的),那么,逆時針方向傳遞的檢測幀仍然能夠順利地在環(huán)上傳遞,s1無法據(jù)此判斷環(huán)路故障,而只能根據(jù)link-down消息來判斷了。
二、g.8032標準
鑒于rfc3619存在上述弱點,有幾家通信設備廠商曾向itu-t提交了自己的方案,但都存在一些缺陷。經(jīng)過多次討論,itu-t于2008年2月制訂了g.8032標準。該標準與rfc3619存在明顯不同,主要區(qū)別如下:
。保话l(fā)送檢測幀。
。玻溌钒l(fā)生故障后,發(fā)生故障的鏈路兩端的節(jié)點開始定期反復發(fā)送link-down消息,以避免消息丟失。發(fā)送link-down消息的時間間隔不是均勻的,它有個特點:開始的三個link-down消息時間間隔很短,短至毫秒級,后面的link-down消息則以秒級的間隔較慢地發(fā)送。顯然,這很好地解決了快速切換和減輕網(wǎng)絡負擔之間的矛盾。
。常溌坊謴驼:,該鏈路相鄰的兩個節(jié)點也開始定期反復發(fā)送鏈路恢復的link-down消息給主控節(jié)點。但是,主控節(jié)點在收到該消息后并不能立即斷定整個環(huán)路恢復正常,而必須等待一段時間,看是否有消息到來。如果沒有link-down消息到來,則可斷定環(huán)路恢復正常。這是考慮到環(huán)上可能出現(xiàn)兩處鏈路故障的情形。我們假設s3和s4之間鏈路發(fā)生故障,s3和s4將反復發(fā)送link-down消息給主控節(jié)點,如果s4和s5之間的鏈路也發(fā)生故障,則s5也將反復發(fā)送link-down消息。若s3和s4之間的鏈路忽然恢復了,主控節(jié)點將收到s3發(fā)來的鏈路恢復的消息,但它不能立即斷定環(huán)路恢復,而必須等待
上一篇:用于基礎通信設備的“Active ORing”解決方案
上一篇:編碼與解碼