流媒體內容提取
- 內容檢索
- 可用於內容過濾
- 音頻流內容提取
- 語音識別
- 利用大詞彙語音識別技術進行檢索
- 基於識別關鍵詞進行檢索-關鍵詞的發現
- 基於說話人的辨認進行分割-聲紋識別
- Sphinx-4 隱馬爾科夫模型
- 語音識別
- 視頻流內容提取
- 幀、鏡頭、情節、節目
- 建模
- 底層內容建模
- 顏色、紋理、形狀、空間關係、運動信息
- 中層內容建模
- 視頻對象
- MPEG-4
- 視頻對象
- 高層內容建模
- 視頻片段
- 底層內容建模
- 提取關鍵幀
- 每個鏡頭的非邊界過渡區的第一幀標記爲關鍵幀
- 鏡頭邊界檢測
- 固定閾值法 - 設定固定的值
- 自適應閾值法 - 結合相鄰幀差的鏡頭邊界,自動調整閾值
- 鏡頭邊界檢測
- 非極大值抑制法-確定鏡頭邊界極大值,並排序。實現鏡頭邊界的關鍵幀提取。
- 每個鏡頭的非邊界過渡區的第一幀標記爲關鍵幀
- java中處理流媒體框架-jmf