眾所周知,一篇完整的論文都要求寫隨文摘要,摘要是提供論文內(nèi)容梗概為目的,它可以讓讀者盡快了解論文的主要內(nèi)容。視頻摘要的概念源自文本摘要,指從原始視頻中提取精華信息,把若干小時視頻濃縮為十幾分鐘甚至更少,大幅度縮短視頻查看的時間。通過采用視頻目標(biāo)特征檢索技術(shù),克服視頻底層特征與人類思維所能理解的高層語義的鴻溝,迅速尋找到感興趣的目標(biāo)。視頻摘要與檢索充分挖掘海量視頻監(jiān)控錄像中的寶藏,大大提高海量監(jiān)控視頻錄像分析的效率。
海量視頻調(diào)閱檢索
面臨著巨大的挑戰(zhàn),人工查找線索猶如大海撈針一般來說,視頻錄像中的很多重要的線索或活動對象,在監(jiān)控畫面中僅僅出現(xiàn)十幾秒甚至數(shù)秒,而這樣的信息散落在數(shù)十小時的視頻中,人工查看極易遺漏這些轉(zhuǎn)瞬即逝的重要信息。據(jù)IMF研究實驗表明,連續(xù)觀察12分鐘的視頻圖像,觀察者會錯過45%的場景,而在連續(xù)觀察22分鐘后會錯過95%的場景,從而忽略了許多重要的信息。這使得視頻錄像的真正有效使用率大為降低,即使有足夠的人力和時間,通過人工查看原始視頻的方式來捕捉轉(zhuǎn)瞬即逝的線索,也存在遺漏的可能。傳統(tǒng)視頻線索的查找,猶如大海撈針,面臨巨大的挑戰(zhàn)。面對海量視頻錄像調(diào)閱慢、分析難等問題,急需采用智能化的手段,快速處理和檢索海量視頻,提高視頻監(jiān)控錄像分析水平和工作效率。
佳都新太視頻摘要技術(shù)
大顯身手,若干小時視頻濃縮為視頻摘要精華視頻摘要(Video Abstraction),即對視頻的結(jié)構(gòu)和內(nèi)容進行分析,從視頻文件中提取出有意義的部分,并將它們以某種方式進行組合,形成簡潔的、能夠充分表現(xiàn)視頻語義內(nèi)容的概要。從時間軸上看,視頻是由一系列連續(xù)的圖像幀和相應(yīng)音頻構(gòu)成的集合,集合中的基本元素是圖像幀。視頻數(shù)據(jù)的結(jié)構(gòu)化就是對視頻在時間上的層次分割,完成原始的非結(jié)構(gòu)化的視頻流到結(jié)構(gòu)化的視頻實體的轉(zhuǎn)換。將原始的視頻流劃分為合理的結(jié)構(gòu)單位后,形成視頻內(nèi)容的層次模型,并得到視頻內(nèi)容對象的相關(guān)描述。視頻內(nèi)容的提取采用模式識別或視頻結(jié)構(gòu)探測的方法,獲取能夠被計算機直接處理,或能夠被人的感觀直接感覺到的信息。此時,視頻被分成背景(全靜止,不活動的物體)以及前景(活動的物體),活動的物體會被提取出來,系統(tǒng)加以描述并插入到數(shù)據(jù)庫中。通過一定的選擇準則,選擇前景和背景內(nèi)容對象作為視頻摘要的組成元素,視頻內(nèi)容對象以一定的方式組合起來,經(jīng)過渲染后形成某種形式的視頻摘要,并以可視化的形式將摘要展現(xiàn)出來。
視頻摘要技術(shù)具有非常實用的價值,將若干小時視頻濃縮為短小精悍、信息全面的視頻摘要精華,大大提高海量監(jiān)控視頻錄像分析的效率。
強大的視頻特征搜索,對類似視頻輕松獲取
視頻數(shù)據(jù)本質(zhì)上是有文本、視頻、聲音、圖像等多種多媒體融合而成,這些媒體之間并非孤立的而是相互之間存在語義上的關(guān)聯(lián)。因此,對視頻檢索綜合分析各種媒介在視頻數(shù)據(jù)中所蘊含的豐富的語義信息,才能檢索到符合人們要求的視頻片段。利用視頻本身的底層特征,如類型、顏色、大小等進行標(biāo)引,采用獲取圖像幀底層特征來“逼近”語義概念。
為了快速的從海量視頻數(shù)據(jù)中提取目標(biāo)信息,利用基于內(nèi)容的視頻檢索技術(shù),跨越視頻底層特征和高層語義之間的語義鴻溝,實現(xiàn)對安防場景中海量視頻數(shù)據(jù)的主動模糊查找功能;趦(nèi)容分析的視頻目標(biāo)分類檢索使用一種有效的運動分割方法提取運動目標(biāo),這些運動目標(biāo)的基本特征(人車類別、顏色、大小等)作為元數(shù)據(jù)被提取出來并保存。利用對提取出的目標(biāo)進行目標(biāo)特征分析,通過監(jiān)控人員的描述特征對特征庫進行匹配,快速找出類似視頻搜索目標(biāo),實現(xiàn)利用人類思維中高層語義概念來進行視頻內(nèi)容的處理。
采用視頻摘要技術(shù)可大幅度縮短視頻監(jiān)控錄像倒查的時間,采用視頻目標(biāo)特征搜索可有效縮小視頻錄像的搜索范圍,視頻摘要與檢索充分挖掘海量視頻監(jiān)控錄像中的寶藏,大大提高海量監(jiān)控視頻錄像分析的效率。下圖為一個街道的夜景,通過視頻摘要與檢索,準確地輸出人流和車流的摘要文件。
佳都新太自主研發(fā),擁有核心知識產(chǎn)權(quán)
在智能視頻監(jiān)控錄像分析領(lǐng)域,國外公司無論在算法研究還是在產(chǎn)品化應(yīng)用方面都起步較早,但是直接運用于國內(nèi)市場顯然有些水土不服。相對來說,國內(nèi)公司進入該領(lǐng)域比較晚,在分析算法的成熟度、上層應(yīng)用的開發(fā)、與傳統(tǒng)安防系統(tǒng)的無縫集成等方面有待進一步優(yōu)化。
佳都新太通過分析市場需求,在國內(nèi)率先研究視頻摘要檢索技術(shù),目前已成功研發(fā)PCI-VSRS 1008/1016以及公安偵查案件專用的PCI-VIAI 1008/1016,核心分析算法均擁有自主知識產(chǎn)權(quán),且分析算法的準確性、系統(tǒng)的穩(wěn)定性均具有較為明顯的優(yōu)勢。PCI-VSRS兼容多種主流視頻格式,適用于公安、交通、金融、監(jiān)獄、大型企業(yè)等多種行業(yè);PCI-VIAI適應(yīng)于公安刑偵部門的視頻調(diào)查,為公安辦案人員快速尋找線索、高效的追嫌追逃提供了強而有力的技術(shù)支撐。視頻摘要檢索技術(shù)的成功應(yīng)用,開創(chuàng)了海量視頻錄像分析的新時代——海量視頻回放太久,視頻摘要檢索只爭分秒!