本實(shí)踐數(shù)據(jù)是基于電商網(wǎng)站——“蘇寧易購”的業(yè)務(wù)訪問流量,進(jìn)行的深入數(shù)據(jù)挖掘。在此基礎(chǔ)上,建立機(jī)器學(xué)習(xí)或統(tǒng)計(jì)算法模型,進(jìn)行離線分析,選取最優(yōu)模型,對流量波動(dòng)趨勢進(jìn)行實(shí)時(shí)預(yù)測,實(shí)現(xiàn)智能化的異常流量預(yù)警。
1.1. 流量預(yù)測的價(jià)值
流量預(yù)測,是流控的重要環(huán)節(jié),也是流控邁向智能化的關(guān)鍵一步。對蘇寧易購而言,業(yè)務(wù)系統(tǒng)流量趨勢的預(yù)測、異常流量的及時(shí)預(yù)警極為重要,它能夠及時(shí)提醒用戶驗(yàn)證是否有CC攻擊、黃牛刷單、爬蟲等危害企業(yè)網(wǎng)絡(luò)正常經(jīng)營活動(dòng)的行為。
1.2. 流量預(yù)測的幾大難點(diǎn)
對于流量波動(dòng)趨勢預(yù)測、異常流量檢測,存在以下難點(diǎn):
l 需要檢測的流量系統(tǒng)種類繁多流量特征各不相同。蘇寧易購業(yè)務(wù)系統(tǒng)眾多,每一個(gè)系統(tǒng)每分鐘產(chǎn)生的流量大小、流量趨勢不同,每一分鐘的訪問業(yè)務(wù)系統(tǒng)個(gè)數(shù)不同。
l 流量受業(yè)務(wù)系統(tǒng)經(jīng)營活動(dòng)影響較大。活動(dòng)力度大、活動(dòng)頻繁,則流量大且穩(wěn)定;活動(dòng)力度大、活動(dòng)稀疏,則流量波動(dòng)大。面向易購的銷售系統(tǒng),則流量大且穩(wěn)定;面向內(nèi)部用戶系統(tǒng),則流量小且波動(dòng)大。
l 不同用戶對流量異常的關(guān)注點(diǎn)不同,流量預(yù)測難以滿足所有場景需求。促銷、CC攻擊、黃牛刷單、爬蟲等,都有可能帶來流量的暴增異常。不同人員的關(guān)注點(diǎn)不同:運(yùn)維人員關(guān)注流量的暴增是否帶來了系統(tǒng)壓力;用戶則關(guān)注流量的異常是否存在某種刷單,是否會(huì)帶來經(jīng)濟(jì)損失;安全人員則關(guān)心是否存在某種攻擊及信息泄露。要做到一種檢測,多方滿足,實(shí)則難度很大。
l 流量預(yù)測需要較高的實(shí)時(shí)性、有效性。及時(shí)感知異常流量,方能及時(shí)的進(jìn)行有效的流控。易購業(yè)務(wù)總流量TPS大,大促期間流量暴增。需要一種實(shí)時(shí)高效的計(jì)算框架,進(jìn)行流量的實(shí)時(shí)計(jì)算、在線訓(xùn)練,及時(shí)發(fā)出異常預(yù)警,流量的預(yù)測檢測才有實(shí)際意義。
2. 應(yīng)用系統(tǒng)流量趨勢特征分析
2.1. 橫向流量的按天規(guī)律性波動(dòng)
流量受到不同時(shí)間段的用戶行為影響較大。不同時(shí)間段的流量閾值、峰值不同。白天08-18點(diǎn)用戶多、流量大,夜間00-08流量下降。
2.2. 橫向階段性流量規(guī)律分析
a. 夜間流量小,波動(dòng)大,如下圖所示夜間00-06點(diǎn)流量圖(按分鐘統(tǒng)計(jì)):
b. 白天流量大,波動(dòng)小。如下圖所示白天11-18點(diǎn)流量圖(按分鐘統(tǒng)計(jì)):
(正文已結(jié)束)
推薦閱讀:葉紫網(wǎng)
免責(zé)聲明及提醒:此文內(nèi)容為本網(wǎng)所轉(zhuǎn)載企業(yè)宣傳資訊,該相關(guān)信息僅為宣傳及傳遞更多信息之目的,不代表本網(wǎng)站觀點(diǎn),文章真實(shí)性請瀏覽者慎重核實(shí)!任何投資加盟均有風(fēng)險(xiǎn),提醒廣大民眾投資需謹(jǐn)慎!