麻省理工學(xué)院-IBM沃森人工智能實(shí)驗(yàn)室的研究人員正在使用AI解決電網(wǎng)故障。他們開發(fā)了一種機(jī)器學(xué)習(xí)模型,可以分析從美國電網(wǎng)中數(shù)十萬個傳感器收集到的數(shù)據(jù)。
這些傳感器,即所謂的同步相量技術(shù)的組成部分,可以匯聚大量與電流和電壓相關(guān)的實(shí)時數(shù)據(jù),以監(jiān)測電網(wǎng)的健康狀況,并定位可能導(dǎo)致停電的異常情況。
由于傳感器產(chǎn)生的數(shù)據(jù)流的大小和實(shí)時性,同步相量分析需要密集的計(jì)算資源。如研究人員的論文中所定義的那樣,快速提取數(shù)據(jù)以進(jìn)行異常檢測,或者“識別明顯偏離大多數(shù)數(shù)據(jù)實(shí)例的異常樣本的任務(wù)”可能存在困難。
由于傳感器收集的數(shù)據(jù)大多是非結(jié)構(gòu)化的,因此ML模型可以在沒有標(biāo)注數(shù)據(jù)的情況下進(jìn)行訓(xùn)練。
“在電網(wǎng)的例子中,人們試圖使用統(tǒng)計(jì)數(shù)據(jù)來捕獲數(shù)據(jù),然后用領(lǐng)域知識定義檢測規(guī)則。比如,如果電壓激增一定百分比,那么電網(wǎng)運(yùn)營商應(yīng)該收到警報。這種基于規(guī)則的系統(tǒng),即使有統(tǒng)計(jì)數(shù)據(jù)分析的授權(quán),也需要大量的勞動力和專業(yè)知識。而今證明,可以實(shí)現(xiàn)這一過程的自動化,也可以使用先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)從數(shù)據(jù)中學(xué)習(xí)模式。”
為了開發(fā)這種ML模型,研究人員首先將異常定義為低概率事件,并通過將電網(wǎng)數(shù)據(jù)集定義為概率分布來估計(jì)概率密度。這允許檢測與異常相關(guān)的低密度值或低概率事件。
對于這樣復(fù)雜的數(shù)據(jù),概率分布是很棘手的,研究人員使用了一種稱為歸一化流的深度學(xué)習(xí)模型來評估概率密度。歸一化流模型使用貝葉斯網(wǎng)絡(luò)進(jìn)行縮放,貝葉斯網(wǎng)絡(luò)是一個能夠?qū)W習(xí)傳感器怎樣工作和它們怎樣交互的圖形。圖結(jié)構(gòu)允許在數(shù)據(jù)中進(jìn)行模式識別,從而更準(zhǔn)確地檢測異常。
據(jù)《麻省理工新聞》報道,“貝葉斯網(wǎng)絡(luò)將多個時間序列數(shù)據(jù)的聯(lián)合概率分解成更簡單的條件概率,更容易參數(shù)化、學(xué)習(xí)和評估。”結(jié)果表明,由于圖的概率化簡,ML模型能夠獨(dú)立地學(xué)習(xí)圖。
研究人員感興趣的是,在實(shí)現(xiàn)異常檢測之外的其他方法時,怎樣將這些模型擴(kuò)展到愈來愈大的圖形中使用。由于其可適應(yīng)的方法,該技術(shù)可以應(yīng)用于其他具有復(fù)雜數(shù)據(jù)收集和分析的領(lǐng)域,包括與交通模式和監(jiān)測相關(guān)的領(lǐng)域。
“一旦該模型投入使用,它將繼續(xù)從穩(wěn)定的傳感器數(shù)據(jù)流中學(xué)習(xí),適應(yīng)可能的數(shù)據(jù)分布漂移,并隨著時間的推移保持準(zhǔn)確性。”在《麻省理工學(xué)院新聞》的文章中描述到。