除了應(yīng)用模式,技術(shù)也是目前橫亙在視頻大數(shù)據(jù)發(fā)展道路上的另一座大山。有很多方面,涉及采集、存儲、管理等多方面的領(lǐng)域,但是在作者看來,最大的技術(shù)障礙還是在于視頻的結(jié)構(gòu)化。商業(yè)應(yīng)用上的數(shù)據(jù)多為結(jié)構(gòu)化數(shù)據(jù),每個數(shù)據(jù)都由一系列明確的描述屬性組成,大數(shù)據(jù)處理系統(tǒng)則可以根據(jù)使用者的要求將不同的屬性進行歸類,從而發(fā)現(xiàn)和掌握事物發(fā)展的客觀規(guī)律。而視頻則不然,除了時間和空間的屬性外,并沒有其他的標簽。除了按照時間和地點查找相應(yīng)的視頻外,大多的視頻只能靠人慢慢甄別,這離大數(shù)據(jù)應(yīng)用還相去甚遠。
要做到大數(shù)據(jù)應(yīng)用,就必須為每個視頻貼上更多的屬性標簽,也就是業(yè)內(nèi)所說的結(jié)構(gòu)化過程。作者認為這是未來視頻應(yīng)用技術(shù)的制高點,其核心是模式識別算法,要做到自動把視頻中的特征識別出來貼上標簽后入庫。這樣在日后需要的時候,才能實現(xiàn)海量視頻的快速查詢和碰撞研判,甚至能像商業(yè)大數(shù)據(jù)那樣做到歸類統(tǒng)計。
結(jié)構(gòu)化的意義不難理解,只是真正實現(xiàn)起來很難,作者總結(jié)了有幾個原因:
1.識別什么特征?一副圖像或者一段視頻可以有無數(shù)角度的標簽屬性去描述,什么才是我們需要的屬性?這與我們需要得到的目的密切相關(guān),這就需要公安圖偵的人才來歸納終結(jié)。
2.識別算法開發(fā)難,由于是平面圖像,因此特征的識別主要原理就是看圖像區(qū)域中的輪廓、顏色、紋理與特征庫進行比較。但是在同一個物體在不同監(jiān)控角度的攝像頭中顯示出的輪廓都不相同,因此無法做到識別。
3.大規(guī)模數(shù)據(jù)處理難,即使做到了識別算法,但是如果要通過數(shù)據(jù)處理服務(wù)器的形式對大規(guī)模的視頻進行結(jié)構(gòu)化處理,這個建造成本巨大,其能源的耗費在中國這個夏季需要限電的情況里也不切實際。
如此看來,視頻結(jié)構(gòu)化的路似乎走不通,但是,目前在業(yè)內(nèi)也出現(xiàn)了許多“曲線救國”的方法。比如:
1.大力發(fā)展電警卡口建設(shè):目前電警卡口在圖偵上的應(yīng)用需求和頻率早就超越了交警,因為案件基本都要與車輛發(fā)生聯(lián)系,這能找出很多的線索。而卡口電警對于車輛的抓拍角度是相對固定的,能夠開發(fā)出相應(yīng)的車輛特征識別技術(shù),電警卡口屬于業(yè)務(wù)需求和技術(shù)實現(xiàn)的一個很好的匹配點。
2.結(jié)構(gòu)化識別前移:在攝像機采集到圖像的同時就要做好結(jié)構(gòu)化的工作,例如卡口攝像機,就應(yīng)該把智能識別的算法集成進去。目前不少廠商都推出了相應(yīng)的智能卡口攝像機,建議政府應(yīng)該大力推廣,在老卡口攝像機更新?lián)Q代的時候使用這類智能卡口攝像機進行替代,為未來大規(guī)模進行視頻結(jié)構(gòu)化做好準備。
3.雙目等特種攝像機的開發(fā),突破平面圖像特征的局限,得到更精準的三維系信息,如人體數(shù)量,高度,物體長度等。類似的產(chǎn)品適合應(yīng)用在重點區(qū)域,符合國內(nèi)目前嚴峻的反恐形勢。
4.物聯(lián)網(wǎng)等更多感知技術(shù)的應(yīng)用,本文雖然主題是視頻大數(shù)據(jù),但在業(yè)務(wù)的發(fā)展中,也積極倡議除了視頻外,融入更多的物聯(lián)網(wǎng)感知技術(shù),如RFID技術(shù)等,作為視頻結(jié)構(gòu)化信息的一個有效補充。
總而言之,對于視頻大數(shù)據(jù)的產(chǎn)業(yè)發(fā)展,一句話來總結(jié):前途一片光明,同志仍需努力。