【摘要】物聯(lián)網(wǎng)與大數(shù)據(jù)作為信息爆炸時代的技術產(chǎn)物,受到社會各界的廣泛關注,如何利用物聯(lián)網(wǎng)技術與大數(shù)據(jù)分析算法提升辦案效率,已成為各國警方分析研究的課題。本文構想了一套基于物聯(lián)網(wǎng)技術的警務大數(shù)據(jù)分析模型,意在探討該套模型在實際應用中的可行性,以及可能遇到的困難。
關鍵詞:物聯(lián)網(wǎng)、大數(shù)據(jù)、警務信息化
背景介紹
警察作為一個國家的重要機構,肩負著維護社會穩(wěn)定,打擊違法犯罪的重要職責,面對著越來越狡猾的犯罪分子,警方需要有效提升預防和打擊犯罪的能力,單靠警員人工破案已無法滿足社會需求,因此國家提出“科技強警”的發(fā)展戰(zhàn)略,借助高科技裝備、信息化手段幫助警方打擊違法犯罪,“金盾工程”更是將公安信息化建設推向了高潮。然而,隨著信息時代的到來,犯罪分子作案手段越發(fā)多變、隱蔽,傳統(tǒng)的信息化手段已很難幫助警方快速分析研判。
近年來,“物聯(lián)網(wǎng)”、“大數(shù)據(jù)”越來越被人們所熟知,著名的“谷歌汽車”、“大數(shù)據(jù)流感預測”更是成為物聯(lián)網(wǎng)技術與大數(shù)據(jù)預測應用的經(jīng)典案例。這兩個在幾年前還不為人知的技術名詞,仿佛是在一夜之間闖入了我們的生活,將人們拉入了科幻電影中的場景。那什么是“物聯(lián)網(wǎng)”、“大數(shù)據(jù)”呢?
物聯(lián)網(wǎng)技術是利用互聯(lián)網(wǎng)等通信技術手段把傳感器、控制器、機器、人與物通過新的方式聯(lián)系在一起,形成人與物、物與物互聯(lián),實現(xiàn)信息化,遠程管理控制和智能化的網(wǎng)絡。
作為物聯(lián)網(wǎng)之后IT行業(yè)又一大顛覆性的技術革命,大數(shù)據(jù)是信息爆炸時代的產(chǎn)物,人們每天上網(wǎng)、交流、購物、訂票…… 產(chǎn)生了數(shù)以億級的數(shù)據(jù),而這項技術的意義并不在于掌握了龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化的預測處理。
警方分析研判的關鍵是挖掘人員、組織、案(事)件、陣地以及物品五要素之間的關聯(lián)關系,如果能夠借助物聯(lián)網(wǎng)技術獲取五要素信息,那么將大大提升警方獲取線索信息的效率,同時也能避免人為錯誤。而面對龐雜的線索信息,則可以借助大數(shù)據(jù)分析技術實現(xiàn)深入,高效的挖掘分析,進而快速找出五要素之間的關聯(lián)關系。
本文試圖探討構建一套基于物聯(lián)網(wǎng)技術的警務大數(shù)據(jù)分析模型,借以提高警方線索采集和分析研判過程的準確性和效率。
技術架構
基于物聯(lián)網(wǎng)技術的警務大數(shù)據(jù)分析模型是一種利用大數(shù)據(jù)分析算法對海量警務物聯(lián)網(wǎng)線索信息進行深度挖掘分析的系統(tǒng)模型。它包括了物聯(lián)感知層、數(shù)據(jù)傳輸層、數(shù)據(jù)分析層以及數(shù)據(jù)展示層,同時,它還要與現(xiàn)有的公安信息網(wǎng)有效融合,實現(xiàn)信息共享碰撞。
物聯(lián)感知層
警務物聯(lián)網(wǎng),是指利用感知技術與智能裝置對警務工作關注對象進行自動感知識別,通過網(wǎng)絡,技術處理和智能分析,實現(xiàn)對關注對象狀態(tài)和態(tài)勢信息的實時掌握,達到對關注對象動態(tài)監(jiān)測、精確管理和科學指揮的目的。目前警方所應用的場景有旅客身份證查驗、警車警員GPS定位、城區(qū)視頻監(jiān)控、道路卡口車輛監(jiān)控、重點部位報警防范、重點人員手機定位、槍支RFID標簽定位等,可以采集到人員、車輛以及物品的城市時空數(shù)據(jù),為警方建立基本要素排查提供大量真實可靠的原始數(shù)據(jù)。
數(shù)據(jù)傳輸層
經(jīng)過移動互聯(lián)網(wǎng)、有線網(wǎng)絡等媒介傳輸?shù)较到y(tǒng)模型的物聯(lián)網(wǎng)數(shù)據(jù),具有數(shù)據(jù)量大,且分布在不同時域,空域的特點,是無法直接使用的,為此需要按照一定的標準規(guī)則對它們進行初步的篩選和歸類整合,將其轉(zhuǎn)化為兼容系統(tǒng)模型的,具有統(tǒng)一規(guī)范標準的“元數(shù)據(jù)”。
數(shù)據(jù)分析層
經(jīng)過初步歸類整合的數(shù)據(jù)依舊是海量且缺乏直觀聯(lián)系關系,無法為警方提供研判依據(jù),為此需要借助專業(yè)的數(shù)據(jù)挖掘算法對這些數(shù)據(jù)進一步分析、整合。同時還要與公安信息網(wǎng)中的線索與情報進行碰撞,以降低單一數(shù)據(jù)源造成的信息可靠性低等問題。常用的分析算法有分類分析、回歸分析、聚類分析以及關聯(lián)分析。
分類分析
根據(jù)一定的分類準則將具有不同特征的數(shù)據(jù)劃分到不同類別的過程。以某地區(qū)團伙作案為例,該區(qū)域近一段時期是團伙犯罪高發(fā)期,警方對該區(qū)域以及鄰近區(qū)域娛樂場所以及出租屋的人員進行集中排查,采集到大量的身份證信息和手機串號信息。
通過對午夜時段的身份證號以及手機串號進行碰撞,可以篩選出一批經(jīng)常出入于犯罪高發(fā)區(qū)的可疑人員名單,進而幫助警方縮小排查范圍。
回歸分析
通過對自變量和因變量做一定的相關性分析,由此建立回歸方程,用以預測變量的依賴關系。加利福尼亞警方曾利用火災預警系統(tǒng)來預測建筑物火情以及分析縱火案。
加利福尼亞警方通過將一年內(nèi)火災案件與當天天氣,建筑物自身因素等資料數(shù)據(jù)化,形成了一套火災級別與火災因素的擬合函數(shù),當火災因素點越豐富時,擬合出來的火災隱情擬合函數(shù)曲線就越細膩平滑,精準度也就越高,進而形成經(jīng)驗數(shù)據(jù),有效提升火災預警能力。同時,警方也不放過那些異常點,因為往往異常點代表著具有“人為縱火”嫌疑,警方再通過對這些異常點的分析,找出隱藏在火災背后的案情。
聚類分析
不同于分類分析,聚類分析沒有先驗知識,一般是將一堆看似毫無規(guī)則的數(shù)據(jù)根據(jù)某種特征進行劃分,不同屬性的數(shù)據(jù)分到不同的組。警方可以根據(jù)時間或者空間為基準屬性,對采集到的身份證號,報警信息,手機串號等進行分組,進而發(fā)現(xiàn)可疑線索。
例如,某文物保護單位午夜時分發(fā)生文物盜竊案件,通過對該單位近一周內(nèi)的監(jiān)控錄像、手機串號等數(shù)據(jù)的采樣,警方首先將可疑目標鎖定在午夜時段出現(xiàn)的四個手機串號上,因為該時段不可能是正常游客參觀時段,具有可疑性,但由于作案人帶了頭套和手套,未能取得有價值的作案監(jiān)控錄像。警方再對其余時間進行排查碰撞發(fā)現(xiàn),在案發(fā)前三天,可疑目標手機串號出現(xiàn)在文物展覽時段,通過對該時段的監(jiān)控錄像與手機串號進行排查定位,就可以有效縮小排查范圍。
關聯(lián)分析
用于在大量雜亂無章的數(shù)據(jù)中尋找有價值數(shù)據(jù)間的相關關系。
通過分析犯罪嫌疑人的基本信息、親朋好友、交通工具、銀行賬戶以及出行記錄等,就能繪制出一張犯罪嫌疑人的關系網(wǎng),進而為警方快速掌握犯罪嫌疑人動向提供有力線索。
數(shù)據(jù)展示層
伴隨著大數(shù)據(jù)應用而出現(xiàn)的技術還有可視化展示技術,它能夠很直觀的將大數(shù)據(jù)分析產(chǎn)生的晦澀難懂的數(shù)據(jù)以圖表的形式展示出來,幫助警方根據(jù)圖表特征快速研判。本模型針對警務案件研判特點,選取了幾種常見的圖表模型做展示。
關聯(lián)關系圖
關聯(lián)關系圖與關聯(lián)分析算法配套使用,用于展示研判分析結果各元素之間的關系,該圖將各元素分為中心元素和關聯(lián)元素,關聯(lián)元素圍繞著中心元素展開。通常用于犯罪嫌疑主體與客體之間的關聯(lián)關系!咀ⅲ褐行脑睾完P聯(lián)元素的要素類型可以相同,也可以不同】
時空時序圖
通常與分類分析算法、聚類分析算法配合使用,按照時空屬性,展示行為主體在一定時空范圍內(nèi)的行為軌跡,通常用于展示犯罪嫌疑人或嫌疑車輛的行為軌跡。
熱點分布圖
通常與聚類分析算法配合使用,用于碰撞挖掘人員行為習慣,關聯(lián)關系以及異常行為之間的“共性”。
應用架構
基于物聯(lián)網(wǎng)技術的警務大數(shù)據(jù)分析模型本身不能直接破案,但它可以幫助警方縮小排查范圍,縮短排查用時。由于它需要整合多方信息資源,因此是一套跨部門,跨警種的分析應用模型。
水平維度
刑偵 |
治安 |
反恐 |
緝毒 |
戶籍 |
結論數(shù)據(jù) | |
元素1 |
A |
A |
|
|
A |
A |
…… |
|
B |
C |
|
B |
B |
元素N |
D |
|
D |
D |
|
D |
警方在辦案過程中經(jīng)常會遇到多警種配合工作的情況,而各警種獲取線索信息的渠道可能有所不同,導致對同一個目標元素得到不同的數(shù)據(jù),這時就需要對大家獲取的信息進行核實,并以某一個或多數(shù)人的信息為最終結論數(shù)據(jù)。(注:依靠物聯(lián)網(wǎng)技術獲取的數(shù)據(jù)會降低數(shù)據(jù)的差異性概率,但案件線索并非只有物聯(lián)網(wǎng)采樣數(shù)據(jù),還有很多數(shù)據(jù)要通過其他渠道獲得)
垂直維度
基層派出所 |
分局 |
市局 |
省廳 | |
應用面 |
采集 |
采集 |
分析 |
統(tǒng)計評估 |
分析 |
采集 |
在應用這套模型時,應該按照不同級別,職能分工使用;鶎訂挝恢饕撠熅索的采集,實際辦案單位則肩負線索采集和分析研判過程,而省廳則作直接利用分析研判結果,對各區(qū)域的治安情況,警員的工作情況進行分析考核。
建設難點
雖然物聯(lián)網(wǎng)、大數(shù)據(jù)已經(jīng)不再是個陌生的技術,它也已經(jīng)被廣泛應用到各行各業(yè),小到“物品標簽”,大到“百度大數(shù)據(jù)分析計劃”,似乎這兩類技術無所不能,但事實上,要想充分發(fā)揮技術的優(yōu)勢,還需要一定的條件。
物聯(lián)網(wǎng),它被憧憬的應用形式之一便是連接城市,各種各樣的傳感器,視頻監(jiān)控無處不在,追中人們的行動并生成大量的數(shù)據(jù),從而更高效的管理城市,但物聯(lián)網(wǎng)技術的軟硬件缺乏一個統(tǒng)一或者相對統(tǒng)一的標準,很難靠一家技術公司就能對接,整合各家的設備或系統(tǒng)。
大數(shù)據(jù),一項偉大的發(fā)明,它將“星占卜”變成了“現(xiàn)實”,但從它的詞意就可以知道,它的樣本即全部,需要大量且非單一的數(shù)據(jù)做支撐,“共享”必不可少,但首先要解決各部門間的信息壁壘,以及跨公安網(wǎng)信息交互引起的信息安全問題。
文章總結
雖然筆者通過理論依據(jù)以及工作實踐總結出了這套系統(tǒng)模型,但模型應用到實際,并構建出完整的可實用的軟件系統(tǒng)仍然有很長一段路需要走,這需要公安干警以及相關行業(yè)技術從業(yè)者的共同努力。
技術手段不可能直接用于破案,但如果能夠科學合理的應用,充分發(fā)揮它的作用,就能大大提升警方辦案效率。而這些都是建立在完備的管理機制和人員認識之上的,需要警方、科學工作者以及社會共同的努力。
|