快速增長的互聯(lián)網(wǎng)連接需求給企業(yè)改善網(wǎng)絡(luò)基礎(chǔ)設(shè)施、性能和其他關(guān)鍵參數(shù)帶來了壓力。網(wǎng)絡(luò)管理員總是會遇到運行多個網(wǎng)絡(luò)應(yīng)用程序的不同類型的網(wǎng)絡(luò)。每個網(wǎng)絡(luò)應(yīng)用程序都有自己的一組特性和性能參數(shù),這些特性和參數(shù)可能會動態(tài)變化。由于網(wǎng)絡(luò)的多樣性和復(fù)雜性,使用為這種網(wǎng)絡(luò)場景構(gòu)建的傳統(tǒng)算法或硬編碼技術(shù)是一項具有挑戰(zhàn)性的任務(wù)。
事實證明,機器學(xué)習(xí)在幾乎所有行業(yè)都是有益的,網(wǎng)絡(luò)行業(yè)也不例外。機器學(xué)習(xí)可以幫助解決棘手的網(wǎng)絡(luò)障礙,促進新的網(wǎng)絡(luò)應(yīng)用程序的應(yīng)用,使網(wǎng)絡(luò)變得非常方便。以下詳細討論基本工作流程以及一些用例,以便更好地理解網(wǎng)絡(luò)領(lǐng)域中的應(yīng)用機器學(xué)習(xí)技術(shù)。
智能網(wǎng)絡(luò)流量管理
伴隨對物聯(lián)網(wǎng)(IoT)解決方案的需求日益增長,現(xiàn)代網(wǎng)絡(luò)產(chǎn)生大量的異構(gòu)流量數(shù)據(jù)。對于這樣一個動態(tài)網(wǎng)絡(luò),傳統(tǒng)的網(wǎng)絡(luò)流量監(jiān)控和數(shù)據(jù)分析網(wǎng)絡(luò)管理技術(shù)(如ping監(jiān)控、日志文件監(jiān)控,甚至SNMP)是不夠的。它們通常缺乏對實時數(shù)據(jù)的準(zhǔn)確性和有效處理。另一方面,由于設(shè)備移動性和網(wǎng)絡(luò)異構(gòu)性,網(wǎng)絡(luò)中來自其他來源(如蜂窩設(shè)備或移動設(shè)備)的流量相對顯示出更復(fù)雜的行為。
機器學(xué)習(xí)有助于在大數(shù)據(jù)系統(tǒng)和大區(qū)域網(wǎng)絡(luò)中進行分析,以便在管理此類網(wǎng)絡(luò)時識別復(fù)雜模式。鑒于這些機會,網(wǎng)絡(luò)領(lǐng)域的研究人員將深度學(xué)習(xí)模型用于網(wǎng)絡(luò)流量監(jiān)控和分析應(yīng)用,如流量分類和預(yù)測、擁塞控制等。
帶內(nèi)網(wǎng)絡(luò)遙測技術(shù)
網(wǎng)絡(luò)遙測數(shù)據(jù)提供了有關(guān)網(wǎng)絡(luò)性能的基本指標(biāo)。這些信息通常很難解釋。考慮到網(wǎng)絡(luò)的規(guī)模和通過網(wǎng)絡(luò)的總數(shù)據(jù),分析數(shù)據(jù)具有巨大的價值。如果使用得當(dāng),它可以顯著提高性能。
比如帶內(nèi)網(wǎng)絡(luò)遙測等新興技術(shù)可以幫助實時收集詳細的網(wǎng)絡(luò)遙測數(shù)據(jù)。最重要的是,在這些數(shù)據(jù)集上運行機器學(xué)習(xí)可以幫助關(guān)聯(lián)延遲、路徑、交換機、路由器、事件等之間的現(xiàn)象。使用傳統(tǒng)方法很難從大量實時數(shù)據(jù)中指出這些現(xiàn)象。
機器學(xué)習(xí)模型經(jīng)過訓(xùn)練以理解遙測數(shù)據(jù)中的相關(guān)性和模式。這些算法最終獲得了基于歷史數(shù)據(jù)學(xué)習(xí)的預(yù)測將來的能力。這有助于管理將來的網(wǎng)絡(luò)中斷。
資源分配和擁塞控制
每個網(wǎng)絡(luò)基礎(chǔ)設(shè)施都有預(yù)定義的可用總吞吐量。它被進一步分割成不同預(yù)定義帶寬的多個通道。在這樣的場景中,如果每個最終用戶的總帶寬使用量是靜態(tài)預(yù)定義的,在網(wǎng)絡(luò)被大量使用的某些部分可能會出現(xiàn)瓶頸。
為了避免這種擁塞,可以訓(xùn)練監(jiān)督機器學(xué)習(xí)模型來實時分析網(wǎng)絡(luò)流量,并以使網(wǎng)絡(luò)遇到的瓶頸最少的方式推斷出每個用戶的合適帶寬量。
這些模型可以從網(wǎng)絡(luò)統(tǒng)計數(shù)據(jù)中學(xué)習(xí),比如每個網(wǎng)絡(luò)節(jié)點的總活動用戶、每個用戶的歷史網(wǎng)絡(luò)使用數(shù)據(jù)、基于時間的數(shù)據(jù)使用模式、用戶在多個接入點之間的移動等。
流量分類
在每個網(wǎng)絡(luò)中,都存在各種各樣的流量,如Web托管(HTTP)、文件傳輸(FTP)、安全瀏覽(HTTPS)、HTTP實時視頻流(HLS)、終端服務(wù)(SSH)等。當(dāng)涉及到網(wǎng)絡(luò)帶寬使用時,每一種行為都不同;比如,通過FTP傳輸文件會在傳輸期間連續(xù)使用大量數(shù)據(jù)。
另一個例子是,如果一個視頻是流媒體的,它使用數(shù)據(jù)塊和緩沖方法。當(dāng)允許這些不同類型的流量以無監(jiān)督的方式使用網(wǎng)絡(luò)時,將會造成一些臨時阻塞。
為了避免這種情況,可以使用機器學(xué)習(xí)分類器來分析和分類通過網(wǎng)絡(luò)的流量類型。然后,可以使用這些模型來推斷網(wǎng)絡(luò)參數(shù),如分配的帶寬、數(shù)據(jù)上限等,這反過來可以通過改進所服務(wù)請求的調(diào)度以及動態(tài)更改分配的帶寬來幫助提高網(wǎng)絡(luò)性能。
網(wǎng)絡(luò)安全
網(wǎng)絡(luò)攻擊數(shù)量的增加迫使企業(yè)持續(xù)監(jiān)控和關(guān)聯(lián)整個網(wǎng)絡(luò)基礎(chǔ)設(shè)施及其用戶的數(shù)百萬外部和內(nèi)部數(shù)據(jù)點。人工管理大量實時數(shù)據(jù)變得很困難。這就是機器學(xué)習(xí)發(fā)揮重要的地方。
機器學(xué)習(xí)可以識別網(wǎng)絡(luò)中的某些模式和異常,并預(yù)測大量數(shù)據(jù)集中的威脅,所有這些都是實時的。通過對此類分析進行自動化,網(wǎng)絡(luò)管理人員可以輕松地檢測威脅并快速隔離情況,而無需耗費大量人力。
網(wǎng)絡(luò)攻擊識別與預(yù)防
網(wǎng)絡(luò)行為是機器學(xué)習(xí)系統(tǒng)中用于異常檢測的一個重要參數(shù)。機器學(xué)習(xí)引擎實時處理大量數(shù)據(jù),以識別威脅、未知惡意軟件和違反安全策略的行為。
如果發(fā)現(xiàn)網(wǎng)絡(luò)行為在預(yù)定義行為范圍內(nèi),則接受網(wǎng)絡(luò)事務(wù);否則,將在系統(tǒng)中觸發(fā)警報。這可用于防止DoS、DDoS和探測等多種攻擊。
防止網(wǎng)絡(luò)釣魚
誘騙某人點擊看似合法的惡意鏈接,然后利用收集到的信息試圖突破計算機的防御系統(tǒng)是很容易的。機器學(xué)習(xí)有助于標(biāo)記可疑網(wǎng)站,以幫助防止人們不小心連接到惡意網(wǎng)站。
比如,文本分類器機器學(xué)習(xí)模型可以讀取和理解URL,并識別那些偽造的釣魚URL。這將為最終用戶創(chuàng)造更安全的瀏覽體驗。
機器學(xué)習(xí)在網(wǎng)絡(luò)中的集成并不局限于上述的用例。通過從網(wǎng)絡(luò)和機器學(xué)習(xí)的角度闡明機會和研究,可以在使用機器學(xué)習(xí)用于網(wǎng)絡(luò)和網(wǎng)絡(luò)安全領(lǐng)域開發(fā)解決方案,以解決尚未解決的問題。