歷史數(shù)據(jù)挖掘
發(fā)布時間:2015/2/24 19:56:15 訪問次數(shù):697
傳感器網(wǎng)絡(luò)是一個以數(shù)據(jù)為中心的網(wǎng)絡(luò),傳感器M27C1024-12F1從監(jiān)測環(huán)境收集到的大量數(shù)據(jù)可能存在某種內(nèi)在聯(lián)系。數(shù)據(jù)挖掘技術(shù)可用于從大量的數(shù)據(jù)中挖掘出人們感興趣的數(shù)據(jù)關(guān)聯(lián)規(guī)則或傳感器節(jié)點間的關(guān)系。
文獻[29]提出了一種用于挖掘傳感器節(jié)點行為模式的算法,其主要目的是確定傳感器節(jié)點行為模式的關(guān)聯(lián)規(guī)則。這些規(guī)則可以用于資源管理或用于彌補網(wǎng)絡(luò)通信的不利因素,以便改進網(wǎng)絡(luò)服務(wù)質(zhì)量。文中給出了傳感器節(jié)點行為模式關(guān)聯(lián)規(guī)則的形式化定義;提出了一種針對數(shù)據(jù)挖掘處理而收集數(shù)據(jù)的壓縮表示結(jié)構(gòu)——位置詞典樹( Positional Lexico-graphic Tree),該結(jié)構(gòu)有助于快速而有效地挖掘節(jié)點的行為模式;謾計了一個挖掘行為模式的分布式數(shù)據(jù)挖掘算法。
傳感器網(wǎng)絡(luò)的數(shù)據(jù)大多表現(xiàn)為一種數(shù)據(jù)流的形式,頻度序列挖掘( Frequentsequential mining)可用于挖掘數(shù)據(jù)流的頻度序列模式(frequent sequential patterns)。文獻[30]中提出了一種在線挖掘算法-SSM(Sequential Stream Mining)來挖掘以將這樣的時間序列進行壓縮[33]。
Eamonn Keogh等提出了分段常量近似(Piecewise Constant Approximation,PCA)的壓縮時間序列技術(shù)[34]。PCA技術(shù)的主要思想是將時間序列表示為多個分段,每個分段由兩個元組組成:數(shù)值常量和結(jié)束時間。其值分別為該分段對應(yīng)的子序列中所有數(shù)據(jù)的均值和最后一個數(shù)據(jù)的采樣時間。
給定一個時間序列So,”’=S[1:Ⅳ]={研1],S[2],…,SM},PCA產(chǎn)生的分段壓縮序列可以表示為
PCA(S)={<vi,ri>,…,<V/,r/>,…,<vM,rM》 V1 =0
式中,Vi表示第f個分段中所有數(shù)值的均值,可以表示為
vf_AVG(s [rf-1+l],J[r/- 1+2],…,s[n])
式中,ri為第f個分段結(jié)束的時間。此處,不需要記錄每個分段的長度,只需要記錄每個分段的結(jié)束時間,即可得到該分段的長度為,i—n 1。
基于PCA技術(shù),Losif Lazaridis等[35]提出了Poor Man mean壓縮方法(PMCmean)。PMC—mean是一種壓縮時間序列的在線方法,該方法的思想是將時間序列中每個分段肉所有數(shù)據(jù)均值作為該分段的常量。每采集到一個周期數(shù)據(jù),計算當前壓縮的時間序列內(nèi)所有數(shù)據(jù)的均值,若該均值與當前時間序列的最大值或最小值的差值超過閾值s時,即停止采樣,將滿足條件的時間序列壓縮為一個分段。
傳感器網(wǎng)絡(luò)是一個以數(shù)據(jù)為中心的網(wǎng)絡(luò),傳感器M27C1024-12F1從監(jiān)測環(huán)境收集到的大量數(shù)據(jù)可能存在某種內(nèi)在聯(lián)系。數(shù)據(jù)挖掘技術(shù)可用于從大量的數(shù)據(jù)中挖掘出人們感興趣的數(shù)據(jù)關(guān)聯(lián)規(guī)則或傳感器節(jié)點間的關(guān)系。
文獻[29]提出了一種用于挖掘傳感器節(jié)點行為模式的算法,其主要目的是確定傳感器節(jié)點行為模式的關(guān)聯(lián)規(guī)則。這些規(guī)則可以用于資源管理或用于彌補網(wǎng)絡(luò)通信的不利因素,以便改進網(wǎng)絡(luò)服務(wù)質(zhì)量。文中給出了傳感器節(jié)點行為模式關(guān)聯(lián)規(guī)則的形式化定義;提出了一種針對數(shù)據(jù)挖掘處理而收集數(shù)據(jù)的壓縮表示結(jié)構(gòu)——位置詞典樹( Positional Lexico-graphic Tree),該結(jié)構(gòu)有助于快速而有效地挖掘節(jié)點的行為模式;謾計了一個挖掘行為模式的分布式數(shù)據(jù)挖掘算法。
傳感器網(wǎng)絡(luò)的數(shù)據(jù)大多表現(xiàn)為一種數(shù)據(jù)流的形式,頻度序列挖掘( Frequentsequential mining)可用于挖掘數(shù)據(jù)流的頻度序列模式(frequent sequential patterns)。文獻[30]中提出了一種在線挖掘算法-SSM(Sequential Stream Mining)來挖掘以將這樣的時間序列進行壓縮[33]。
Eamonn Keogh等提出了分段常量近似(Piecewise Constant Approximation,PCA)的壓縮時間序列技術(shù)[34]。PCA技術(shù)的主要思想是將時間序列表示為多個分段,每個分段由兩個元組組成:數(shù)值常量和結(jié)束時間。其值分別為該分段對應(yīng)的子序列中所有數(shù)據(jù)的均值和最后一個數(shù)據(jù)的采樣時間。
給定一個時間序列So,”’=S[1:Ⅳ]={研1],S[2],…,SM},PCA產(chǎn)生的分段壓縮序列可以表示為
PCA(S)={<vi,ri>,…,<V/,r/>,…,<vM,rM》 V1 =0
式中,Vi表示第f個分段中所有數(shù)值的均值,可以表示為
vf_AVG(s [rf-1+l],J[r/- 1+2],…,s[n])
式中,ri為第f個分段結(jié)束的時間。此處,不需要記錄每個分段的長度,只需要記錄每個分段的結(jié)束時間,即可得到該分段的長度為,i—n 1。
基于PCA技術(shù),Losif Lazaridis等[35]提出了Poor Man mean壓縮方法(PMCmean)。PMC—mean是一種壓縮時間序列的在線方法,該方法的思想是將時間序列中每個分段肉所有數(shù)據(jù)均值作為該分段的常量。每采集到一個周期數(shù)據(jù),計算當前壓縮的時間序列內(nèi)所有數(shù)據(jù)的均值,若該均值與當前時間序列的最大值或最小值的差值超過閾值s時,即停止采樣,將滿足條件的時間序列壓縮為一個分段。
熱門點擊
- threshServingLow:服務(wù)小區(qū)重
- LTE小區(qū)吞吐量影響因素
- 電容器的種類及應(yīng)用范圍
- 無線傳感器網(wǎng)絡(luò)的基本思想起源于20世紀70年
- TimeToTrigger:事件觸發(fā)持續(xù)時間
- 反相器組成的不同振蕩頻率的三個振蕩器
- TDD幀結(jié)構(gòu)定義了不同的上下行配置類型
- 輸入失調(diào)電壓
- DMRS在控制信道PUCCH上傳輸時
- 信息內(nèi)爆(Implosion)
推薦技術(shù)資料
- 最新一代600V超級接面MOSFET KP3
- 業(yè)界新品1700V碳化硅MOS
- 新一代光纖通信200Gbps
- 業(yè)界首款2000W高瓦數(shù)電源方
- IMC302A搭配IPM模塊應(yīng)用探究
- 低功耗入墻式 AP 系列射頻前
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究