視頻流快速處理技術之二——基於數據量波動特性的視頻靜止畫面檢測

靜止畫面是指相對靜止的視頻畫面。主要有以下幾種,測試信號準備時間內播放的彩條、黑屏;現場報道等待過程中對某個場景的拍攝;電視臺開播前播放的固定內容的信號等類似的內容。
爲發現這類視頻的規律,選取圖像組頭和圖像頭起始碼作爲標誌,分別統計兩種標誌在視頻序列中出現的位置,相鄰兩個圖像頭起始碼之間的距離可以用於度量一幀圖像的數據量的多少,相鄰兩個圖像組頭起始碼之間的距離可以用於度量一個圖像組的數據量的多少。一幀圖像編碼後數據量的多少,受到圖像內容、編碼方法等多種影響,需要通過大量的實驗去發現其中的規律。
壓縮域幀數據量特性請參看視頻流快速處理技術之一——基於幀數據量波動特性的壓縮域視頻快速檢索方法
簡單而言,視頻數據就數據量來說一般有如下特點:

  1. I、P、B三種圖像幀數據量差異懸殊,平均而言,I幀最大,B幀最小。
  2. 靜止畫面圖像幀數據量曲線規律性較強,隨着活動的加劇,曲線規律性變差。這是因爲靜止畫面而言,由於壓縮算法按照圖像組的長度週期性地使用,圖像內容又近乎不變,結果表現出圖像幀數據量曲線呈現週期性變化。不同編碼器算法的不同及視頻內容的不同表現爲一個週期內的曲線細節差異,總體上的規律性不變。
  3. 從各圖像幀的絕對數據量難以直接描述圖像的運動屬性。
    靜止畫面的圖像組數據量波動範圍較小,大部分曲線近乎直線,個別呈週期性小幅波動,而動態視頻的圖像組數據量波動無規律,各曲線圍繞各自的均值上下波動。各曲線均值差異由編碼器決定,而曲線波動由視頻內容和編碼器共同決定。
    由於幀間預測編碼的使用,MPEG視頻數據流不能在任意幀獨立進行解碼、編輯,一幀圖像的時間性編碼和解碼可能需要用到前面或後面圖像的內容。因此,需要相鄰兩個圖像組中對應各幀數據量的統計特點。由於圖像組編排方式的多樣性,統計應針對同樣的圖像組編排方式進行,排除序列中個別圖像組特殊排列的影響。
    由於不同編碼器、不同碼率限制等因素,各幀數據量的絕對數值本身存在較大差異,可採用歸一化方法計算圖像組對應各幀數據量波動佔圖像組數據量的百分比。
    通過計算圖像組中對應各幀數據量波動率均值可完成對靜止畫面的判斷。在門限使用前可先對該值進行學習。超過該門限就判爲動態視頻,低於該門限要繼續判斷,如果低於門限超過一定時間,就可判斷爲靜止畫面並通知存儲模塊不對該段數據存盤,等再次高於該門限時再進行錄製。具體流程如下圖 所示。
    視頻流快速處理技術之二——基於數據量波動特性的視頻靜止畫面檢測
    通過長時間、不同載波視頻內容的觀察,對於靜止時限一般設置爲5~10秒,不會造成人們對視頻內容理解的妨礙,也減少了運動視頻中短時間相對靜止可能造成的檢測錯誤。檢測的對應數據波動率門限一般設置爲5~8,可以做出準確檢測。兩者配合,可以較好滿足對數字新聞採集、新聞發佈以及節目交流業務信號的自動監測和記錄控制。
    具體內容請下載基於哈希技術的圖像檢索研究並查看8.2節。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章