0.引言
目前,WLAN(無線局域網)在全球發展勢頭迅猛。珠海移動原有的WLAN 系統共有300 多臺熱點AP (接入點) 設備, 2009 年迅猛增加到1000 多臺。
在現有運營管理中, 主要存在以下問題:a)AP 設備數量龐大,維護人員數量有限。b)AP 設備多數是一些小網絡設備, 網管功能不健全,現有的網絡管理軟件無法有效監控。c)現有AP 設備類型較多,不支持標準網管,且管理手段各不相同,給統一監控帶來很大困難。d)信息化業務服務質量缺乏標準,無法衡量。
為了解決以上問題,提高工作效率和維護水平,迅速、有效、合理地調配資源,提高全網設備的利用率。廣東移動珠海分公司通過開發WLAN網絡智能管理系統, 從WLAN 網絡末端設備AP出發, 基于用戶側提供自動的業務監控功能,實時發現WLAN 網絡連通性和性能問題,實時進行異常變動告警上傳,變被動維護。
1.WLAN 網絡智能管理系統功能
珠海WLAN 全網現有1000 多個AP,分布于珠海香洲、吉大、金灣、斗門、平沙、三灶等多個區域。共110 個熱點覆蓋于酒店、娛樂、高檔小區、政府企業、服務廳等。目前網絡采用常用的AC(接入控制器)串聯接入,下接匯聚交換機,采用傳輸到各熱點區域或傳輸匯聚機房方式。
通過網管服務器的架設部署,通過核心交換機連通各個網絡設備,讀取各個AP、AC、交換機路由器等各種網絡設備信息。
系統中直接面向用戶業務的有4 個子功能模塊,按照主要功能作用可分為WLAN 設備管理模塊、用戶行為功能模塊、日志功能模塊和集成功能模塊四大類。
WLAN 設備管理模塊包括性能監控(CPU、內存監控)、無線參數監控、接口監控、用戶認證模塊、事件綜合管理、排名等。用戶行為分析模塊包括用戶接入時長、用戶接入AP、用戶漫游情況、用戶接入時段、用戶使用流量、流量應用分布、用戶訪問目的、用戶行為指紋、用戶特征識別。流量分析包括接口分析、應用分布、會話分析、網間流量分析、流量報表、流量告警、流量事件管理、流量過濾。日志管理包括SYSLOG 日志、Trap 日志、日志匹配、日志告警。
WLAN 網絡智能監控系統著力解決以下關鍵技術問題: a)全面支持對小型網絡設備運行狀況的數據抓取。b)全面支持各種網絡和主機設備。
c)統一支持多種采集手段。d)一個可定制性極強的監控框架,大幅降低定制費用。e)充分挖掘已有管理系統的潛力,減少用戶方管理系統軟件投入,提高管理效果。f)設備管理、用戶戶管理雙核心。g)高效率、高可靠性,對硬件環境要求不高。
2 WLAN 網絡智能管理系統原理
2.1 統一采集平臺(UNICOL)和多采集(MUTICOL)
WLAN 的監控對象大多是接入層的AP 設備,這些設備價格較便宜、網管功能不健全、監控方式不標準, 且型號眾多, 通用網管系統不做改動很難支持。另一方面,AP 設備雖然類型復雜,但功能卻相對統一。功能的相對統一決定了其監控指標的展現也相對統一。
結合WLAN 系統的這兩大特點,構造了統一采集平臺。該平臺將監控指標的采集與展現徹底分離,擺脫了傳統的采集模塊與展現模塊結合在一起的方式,以略微犧牲一點展現的豐富性為代價,換取了采集模塊的極端靈活和高效。
1)統一采集平臺(UNICOL)
所有的網絡監控類軟件都建立在系統數據采集的基礎上, 新型的網絡監控系統都已經使用了系統化的采集平臺(COL-PLATFOME),有利于將各種不同類型的采集同一化,從而降低定制成本,增加支持設備類型數量。COL-PLATFOME 雖然在采集同一化方面做了很多工作,但仍然擺脫不開“對象”的概念,采集指標(KPI)總是從屬于某一個設備類型,如CISCO 類型下, 有CPU 使用率、接口流量等KPI;HP-UX(一種主機操作系統)類型下,也有CPU 使用率、接口流量等相似的KPI。
傳統采集框架如圖1 所示。
傳統采集框架中,KPI 都掛在特定的對象上。如果要擴展支持的對象類型,有兩個必不可少的步驟:
a)編寫對象層邏輯。b)修改KPI 邏輯,把它們掛到新編寫的對象邏輯上。
存在的問題:a)KPI 邏輯是大致相似的。例如CPU 使用率,CISCO 設備和HUAWEI 設備的差別可能僅僅在于OID 不同,HP-UX 和AIX 的差別僅僅在于命令有一點不同。有的KPI 邏輯(如取設備延時、丟包率等)甚至是完全一樣的。b)對象邏輯是大不相同的。相對而言,對象邏輯與每種對象管理,其性質大不一樣。例如CISCO 設備,對象層上必須取得設備OID、接口列表等關鍵屬性, 而HP-UX 則必須取得總內存、總虛擬內存、卷列表等關鍵屬性。
導致的后果:a)對象層差別性很大,每增添一個新設備類型,都必須增添代碼描述新的對象,形成新的對象層。b)盡管KPI 差別性不大,但它必須掛在對象層下,對象層的增加必然導致KPI 要做相應的修改,才能掛到新的對象下面。
通過以上分析可看出, 傳統的采集框架的架構不盡科學, 其根本問題在于差別性大的對象層被放到框架中層, 而差別性不大的KPI 被放到框架底層。這種架構與人類的思維很接近(先大后小的自然過程),但其擴展性受到約束,為支持新設備必須付出昂貴的開發、定制和實施成本。特別是在WLAN系統中,這個缺點更為突出。
統一采集平臺(UNICOL)改變了采集平臺的架構,其結構如圖2 所示。
新的框架具有以下特點:a)取消了對象層。不同對象差異性很大,這里直接把它取消掉。其差異性通過其他方式(標簽層)體現出來。b)將KPI 直接提到中層。不同KPI 差異性不大,把它提高到架構中層。
保證架構上兩層很少變動。c)在底層新加一個標簽層。KPI 的差異性通過給它貼上不同的標簽得以體現。例如“大類”里面,供貼的標簽有“網絡| 主機| 數據庫| 無線設備” 等。小類里面, 供貼的標簽有“CISCO|HUAWEI|HP-UX|AIX|AP|AC”等。另外,還有一些預定義的標簽(如“解析方式”、“數據類型”、“數據處理”等)按不同的KPI 分別貼上。
這個標簽層的意義在于:a)它標示了KPI 的個性,彌補了對象層取消帶來的信息缺失。b)它包含的都是配置性的數據,基本上以配置文件的形式存在。
新架構的優勢是:架構上兩層很少變動,變動主要體現在“標簽層”,而“標簽層”主要以配置文件的形式存在。
通過改進系統架構,新系統對新對象、新KPI只要增加配置項就可以支持, 也就是說, 不需要改代碼。
2)多采集(MUTICOL)
將傳統的網管延伸到以AP、無線路由器為代表的小設備領域,還有另一個重大問題需要解決:采集手段問題。
因為成本關系, 這些小設備大多都不提供完整的網管功能:不提供SNMP(簡單網絡管理協議),或對SNMP 的支持很弱,很多信息都沒有提供;不提供遠程登錄,或遠程登錄命令很弱,無法用標準方式得到有價值的信息等。
這些小設備都提供形式不一的管理界面, 特別近年來尤其流行Web 管理界面。這些管理界面在提供管理功能的同時,其設備運行信息、性能信息、流量信息、告警、日志等信息通常都在這些管理界面中提供,但是提供方式非常分散和不統一。如某型號的AP,其Web 管理界面提供了總內存,其他地方沒提供;其telnet 管理界面提供了當前空閑內存,其他地方沒提供,那么要得到“內存使用率”這個KPI 就需要使用不同采集方式,最后加以計算。
通用網管系統使用標準的SNMP 協議或定制化的腳本遠程登錄取得設備信息, 從監控手段上很難滿足小設備的監控需要。
WLAN 網絡監控系統使用獨特的多采集框架(MUTICOL),同時支持豐富的采集手段:a)SNMP。
b)TELNET / SSH 等遠程登錄方法。c)Web 界面截取。d)設備命令行管理工具。
2.2 設備監控和用戶行為跟蹤雙核心
WLAN 網絡監控從通用網管分支出來,但又有其獨特的需求。WLAN 的管理不僅關心網絡的運行情況,也關心用戶的接入情況,包括接入地點、漫游情況、應用分布,甚至接入習慣和接入指紋。要做到這些,雖然可以通過定制添加功能的方法,但底層視角仍不可改變地根植于設備監控, 無法充分站在網絡分析者的角度進行用戶行為分析。
新一代WLAN 網絡監控和用戶行為分析系統從內部框架實現設備監控和用戶行為跟蹤“雙核心”,站在用戶行為分析的角度,為網絡運維、網絡優化和網絡安全提供更有價值的信息。
3 WLAN 智能監控系統功能結構及系統應用
該系統可應用于網絡優化測試、網絡資產管理、設備巡檢、維護資源管理、設備告警、故障排查等工作中,全方位地提升現場維護、網絡資源優化、網絡管理的效率和質量。
系統功能如下:
1)實現全網的網絡實時監控:
該系統的接入應用, 通過對全市1000 多個AP的實時監控,綜合呈現了全網的接入樹形結構、設備的告警情況, 統計AP 接入數量種類、用戶登陸情況、用戶熱點分布情況,顯示每天、每周、每月的登陸用戶數的用戶曲線。
2)維護測試:
網絡維護人員可直接通過手提電腦進行維護測試, 系統將記錄主要的網絡參數并以圖形化方式呈現在手提電腦屏幕中。呈現模式為動態圖形呈現。撥測結果可以保存單獨測試文件, 上傳到服務器后可生成測試報告。
3)全網的綜合呈現:
系統呈現全網資源的分布情況, 可將珠海全網的覆蓋熱點信息、AP 數量統一展現在系統上, 一目了然。
4)巡檢管理:
極大緩解維護管理人員的日常巡檢作業壓力,通過系統的實時監控,不需到現場巡檢,就能及時發現某個區域的某個AP 出現網絡告警, 有針對性的到達故障現場處理故障。節省了大量的維護資源,維護人員由過去的4 個精簡到現在的1 個。通過系統就能了解全市任一熱點的AP 設備的健康情況。
5)故障處理:
方便維護人員進行故障處理,通過系統監控,將被動的故障維護變成主動的故障維護。降低用戶的投訴率,在該系統投入應用后,用戶的投訴量大大下降,由以前平均每月的20 宗,降低到現在的5宗以內。故障處理及時率也由以前的80%提高到現在的95%以上。有效壓縮了人力資源,減輕了運維壓力。
6)資產統計:
維護人員通過該系統可以詳細統計出網絡接入AP 的數量、種類以及全網的AP 分布。
7)基礎報表管理:
詳細的報表信息可以智能地區分外部用戶和內部用戶,得到外部用戶的登陸使用情況、內部用戶的登陸使用情況、登錄用戶接入號碼、接入時長等詳細信息。
8)排名分析:
一些重要的業務熱點往往需要分析用戶的登陸次數和使用動向, 為此, 該系統將對全市所覆蓋的WLAN 無線業務使用情況進行排名分析, 對每天、每月的TOP10 熱點進行排名。
4 結束語
珠海移動在無線城市的建設中,WLAN 用戶迅猛增長。WLAN 網絡智能管理系統將珠海全市的AP 都納入了系統監控范圍,由點到面地集中管理整個珠海移動網絡,同時平臺具備很強的可擴展能力,能方便地進行功能擴展和規模擴展, 能兼顧各種層次的運維管理需求。
該系統接入應用,通過對全市1000 多個AP 的實時監控,極大方便了維護管理人員的日常巡檢,節省了大量的維護資源,有效壓縮人力資源,減輕運維壓力。此外,該系統的投入使用大大提高了網絡規劃能力及應急處理決策的正確性, 通過對用戶行為及網絡歷史數據進行分析,對WLAN 網絡的應急預案市場的精確營銷都具有重要的指導意義, 同時每月可以節約人力和車輛成本2 萬多元。
本系統創新的維護管理模式將原本單一而又復雜的網絡數據用美觀大方的圖形信息進行展現,使維護人員能簡單易懂了解到網絡整體狀況, 凸顯了移動通信網絡維護的專家形象, 造成了較好的社會影響。