視頻圖像中的車輛檢測跟蹤和分類
發(fā)布時間:2007/8/15 0:00:00 訪問次數(shù):909
杭州市浙江大學信息與電子工程系(310027) 曹治錦 唐慧明
摘 要:介紹了一種在固定的單攝像頭拍攝的交通圖像序列中檢測、跟蹤、分類車輛的方法。該方法大致可分為三部分:抽取背景圖像和圖像分割;基于針孔模型的攝像機定標,計算透視投影矩陣;利用區(qū)域特征進行匹配跟蹤,建立目標鏈,恢復目標三維信息,采用模型匹配法對車型分類。實驗證明該方法簡單可行。
關鍵詞:圖像分割 車型識別 目標跟蹤 模型匹配
在現(xiàn)代交通管理和道路規(guī)劃中,交通流量和通行車輛的類型、速度是重要的參數(shù)。自動獲取這些數(shù)據(jù)的方法大致可以分為兩類:一類是利用壓電、紅外、環(huán)形磁感應線圈等傳感器獲得車輛本身的參數(shù),這類方法跟蹤識別率較高,但是容易損壞,安裝也不方便;還有一類就是基于圖像處理和模式識別的方法,克服了前面一類方法的局限,由于圖像處理識別技術的進步和硬件性價比的大幅提高,有一定實用價值的系統(tǒng)已經(jīng)出現(xiàn)。這些系統(tǒng)的使用證明:圖像處理識別車型的方法日趨成熟,環(huán)境適應能力較強,能長期穩(wěn)定工作,但是計算量大,識別正確率不如感應線圈、激光讀卡等方法高。本文的研究屬于后者,利用安裝在高處的單個靜止攝像頭監(jiān)視路面,利用運動分割與模型匹配的方法,檢測并統(tǒng)計多車道的車流信息。
整個識別過程分三步:分割、跟蹤和車型判定。運動目標的分割常采用幀差法。在監(jiān)控場合,攝像頭大多是固定的,背景基本沒有變化或者變化緩慢,可以從圖像序列中逐漸取出背景圖像,然后利用幀差法檢測出目標區(qū)域,同時還可以檢測靜止目標。由于識別過程中利用二值邊緣圖像,所以本文在圖像分割中對輸入圖像進行了梯度二值化處理。三維空間和二維圖像平面之間映射關系的確定,采用基于針孔模型的攝像機定標來計算。對目標區(qū)域的跟蹤,采用了區(qū)域特征向量的匹配跟蹤方法,減小了運算量。由于圖像處理的方法很難提取輪數(shù)、軸距等車輛本身參數(shù),所以在圖像車型識別中一般都采用三維模型在圖像上投影和車輛邊緣相匹配的方法。
1 背景重建和圖像分割
由于攝像頭固定,背景變化緩慢,因此,可以利用圖像序列逐漸恢復出背景圖像。其基本原理是:對每一個像素進行監(jiān)控,如果在較長時間內(nèi)灰度不發(fā)生明顯變化,則認為該像素屬于背景區(qū)域,將該像素灰度值復制到背景緩沖區(qū),否則屬于前景區(qū)域[1]。由于光照以及車輛陰影等影響,采用這種方法恢復出來的背景圖像存在較大噪聲。因此在實驗中對原始輸入圖像進行了梯度二值化處理,然后進行背景重建。這樣可以減小陰影的干擾,加快背景重建速度。由于識別是利用邊緣信息,所以梯度化對后面的識別過程沒有影響。
在得到背景邊界圖像后,利用幀差法可以分割出感興趣的目標。但是,如果目標區(qū)域和背景邊界重合(值都為"1"),相減之后該目標區(qū)域被錯誤判定為背景區(qū)域 (值為"0")。為了減小錯誤判決區(qū)域,本文在分割時參考了相鄰兩幀的二值化幀差fdmask,判決準則如下:如果fdmask中某像素為"0",則輸入圖像和背景圖像相應像素相減;否則直接復制輸入圖像中相應的像素值。分割結(jié)果經(jīng)過噪聲消除、形態(tài)學平滑邊界、種子填充、區(qū)域標記等后續(xù)處理,就分離出了目標。
2 攝像機定標
在模型匹配中,需要從二維圖像恢復目標三維信息,同時將三維模型投影到圖像平面上,因此必須計算三維空間到圖像平面的投影關系矩陣。這個過程就是攝像機定標。本文采用基于針孔模型的攝像機定標方法,其基本原理是利用給定的一組三維世界的點坐標和這些點在圖像中的坐標,求解線性方程組,計算透視投影矩陣中的各個元素[2]。透視投影矩陣如下:
其中:(u,v)是圖像坐標,(Xw,Yw,Zw)是三維坐標,M為投影矩陣,Zc為三維空間中點到攝像機鏡頭的矢量在主光軸上的投影距離。要求解M的各個元素,根據(jù)文獻[2]介紹需要6個點的投影關系組成12階的方程組,通常方程組不獨立,沒有唯一解,采用近似計算的誤差較大。在(1)式基礎上經(jīng)過變形,將12階方程分拆成三個4階方程組,只需要利用4個點的投影關系,方程組的階次也只有4階,可以有效避免出現(xiàn)奇異矩陣,求出唯一解。由式(1)可以得出:
關鍵詞:圖像分割 車型識別 目標跟蹤 模型匹配 在現(xiàn)代交通管理和道路規(guī)劃中,交通流量和通行車輛的類型、速度是重要的參數(shù)。自動獲取這些數(shù)據(jù)的方法大致可以分為兩類:一類是利用壓電、紅外、環(huán)形磁感應線圈等傳感器獲得車輛本身的參數(shù),這類方法跟蹤識別率較高,但是容易損壞,安裝也不方便;還有一類就是基于圖像處理和模式識別的方法,克服了前面一類方法的局限,由于圖像處理識別技術的進步和硬件性價比的大幅提高,有一定實用價值的系統(tǒng)已經(jīng)出現(xiàn)。這些系統(tǒng)的使用證明:圖像處理識別車型的方法日趨成熟,環(huán)境適應能力較強,能長期穩(wěn)定工作,但是計算量大,識別正確率不如感應線圈、激光讀卡等方法高。本文的研究屬于后者,利用安裝在高處的單個靜止攝像頭監(jiān)視路面,利用運動分割與模型匹配的方法,檢測并統(tǒng)計多車道的車流信息。 1 背景重建和圖像分割 由于攝像頭固定,背景變化緩慢,因此,可以利用圖像序列逐漸恢復出背景圖像。其基本原理是:對每一個像素進行監(jiān)控,如果在較長時間內(nèi)灰度不發(fā)生明顯變化,則認為該像素屬于背景區(qū)域,將該像素灰度值復制到背景緩沖區(qū),否則屬于前景區(qū)域[1]。由于光照以及車輛陰影等影響,采用這種方法恢復出來的背景圖像存在較大噪聲。因此在實驗中對原始輸入圖像進行了梯度二值化處理,然后進行背景重建。這樣可以減小陰影的干擾,加快背景重建速度。由于識別是利用邊緣信息,所以梯度化對后面的識別過程沒有影響。 在得到背景邊界圖像后,利用幀差法可以分割出感興趣的目標。但是,如果目標區(qū)域和背景邊界重合(值都為"1"),相減之后該目標區(qū)域被錯誤判定為背景區(qū)域 (值為"0")。為了減小錯誤判決區(qū)域,本文在分割時參考了相鄰兩幀的二值化幀差fdmask,判決準則如下:如果fdmask中某像素為"0",則輸入圖像和背景圖像相應像素相減;否則直接復制輸入圖像中相應的像素值。分割結(jié)果經(jīng)過噪聲消除、形態(tài)學平滑邊界、種子填充、區(qū)域標記等后續(xù)處理,就分離出了目標。 2 攝像機定標 在模型匹配中,需要從二維圖像恢復目標三維信息,同時將三維模型投影到圖像平面上,因此必須計算三維空間到圖像平面的投影關系矩陣。這個過程就是攝像機定標。本文采用基于針孔模型的攝像機定標方法,其基本原理是利用給定的一組三維世界的點坐標和這些點在圖像中的坐標,求解線性方程組,計算透視投影矩陣中的各個元素[2]。透視投影矩陣如下: 其中:(u,v)是圖像坐標,(Xw,Yw,Zw)是三維坐標,M為投影矩陣,Zc為三維空間中點到攝像機鏡頭的矢量在主光軸上的投影距離。要求解M的各個元素,根據(jù)文獻[2]介紹需要6個點的投影關系組成12階的方程組,通常方程組不獨立,沒有唯一解,采用近似計算的誤差較大。在(1)式基礎上經(jīng)過變形,將12階方程分拆成三個4階方程組,只需要利用4個點的投影關系,方程組的階次也只有4階,可以有效避免出現(xiàn)奇異矩陣,求出唯一解。由式(1)可以得出:
杭州市浙江大學信息與電子工程系(310027) 曹治錦 唐慧明
摘 要:介紹了一種在固定的單攝像頭拍攝的交通圖像序列中檢測、跟蹤、分類車輛的方法。該方法大致可分為三部分:抽取背景圖像和圖像分割;基于針孔模型的攝像機定標,計算透視投影矩陣;利用區(qū)域特征進行匹配跟蹤,建立目標鏈,恢復目標三維信息,采用模型匹配法對車型分類。實驗證明該方法簡單可行。
整個識別過程分三步:分割、跟蹤和車型判定。運動目標的分割常采用幀差法。在監(jiān)控場合,攝像頭大多是固定的,背景基本沒有變化或者變化緩慢,可以從圖像序列中逐漸取出背景圖像,然后利用幀差法檢測出目標區(qū)域,同時還可以檢測靜止目標。由于識別過程中利用二值邊緣圖像,所以本文在圖像分割中對輸入圖像進行了梯度二值化處理。三維空間和二維圖像平面之間映射關系的確定,采用基于針孔模型的攝像機定標來計算。對目標區(qū)域的跟蹤,采用了區(qū)域特征向量的匹配跟蹤方法,減小了運算量。由于圖像處理的方法很難提取輪數(shù)、軸距等車輛本身參數(shù),所以在圖像車型識別中一般都采用三維模型在圖像上投影和車輛邊緣相匹配的方法。
深圳服務熱線:13751165337 13692101218
粵ICP備09112631號-6(miitbeian.gov.cn)

深圳市碧威特網(wǎng)絡技術有限公司
付款方式