基於內容的音頻場景分割

原創

2020-02-23 20:21

如需轉載，請註明出處！

從音頻場景分割的複雜度上來講，最有難度的爲 speech+song VS song 之間的分割。

speech+song：前景爲人說話，背景爲singing song

speech+song VS song 而且的基本構成都可視爲 speech+instrument，場景很爲相似，所以在分割上增加很大難度。

下表爲實驗結果：

1:music 0:speech

21.952000, 0 -> 1
25.632000, 1 -> 0
54.400000, 0 -> 1
59.488000, 1 -> 0
114.848000, 0 -> 1
121.984000, 1 -> 0
167.456000, 0 -> 1
173.216000, 1 -> 0
197.568000, 0 -> 1
202.912000, 1 -> 0
229.728000, 0 -> 1
233.024000, 1 -> 0
256.384000, 0 -> 1
263.200000, 1 -> 0
308.000000, 0 -> 1
315.712000, 1 -> 0
332.480000, 0 -> 1
336.160000, 1 -> 0
360.512000, 0 -> 1
368.640000, 1 -> 0
397.184000, 0 -> 1
399.584000, 1 -> 0
404.928000, 0 -> 1
408.000000, 1 -> 0
441.984000, 0 -> 1
450.688000, 1 -> 0
468.608000, 0 -> 1
475.232000, 1 -> 0
506.112000, 0 -> 1
511.008000, 1 -> 0
544.608000, 0 -> 1
546.496000, 1 -> 0
548.480000, 0 -> 1
552.000000, 1 -> 0
592.288000, 0 -> 1
601.504000, 1 -> 0
653.472000, 0 -> 1
660.032000, 1 -> 0

文件地址：

http://pan.baidu.com/s/1sjzfVE9

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【算法面試筆記】

特徵工程七種常用的特徵工程特徵提取+數據預處理四部走特徵歸一化爲啥要歸一化百面機器學習上那個例子我覺得全就一個角度：讓不同量綱的特徵對最終模型有着近似、相似的影響力，可能不完全相同，保證特徵之間的公平性以計算距離

2020-07-08 02:17:26

Latent Semantic Analysis(LSA)

對於一個term-document加權詞頻矩陣(如TF-IDF),如果他的規模m*n非常大，那麼這些文本的存儲還有計算聚類都會有不小的麻煩，LSA採用SVD分解將高維文本映射到低維的隱含語義空間，較好的解決了這個問題。分解後的三部分都

2020-06-30 22:42:58

Least Angel Regression

最小角迴歸和上一篇說的forward stepwise有一些相似的地方是都是將一些variable選到variable集合中來，不一樣的是，forward stepwise 每次選的都是與當前殘差相關度最大的variable，選進來以後，

2020-06-30 22:42:58

subset selection

這幾天看the elements of statistical learning,覺得非常喫力，可能自己水平還不夠，覺得這書不適合初學者看，就從Subset Selection 這一章節來說，本文說了主要說了三個點，best-subset

2020-06-30 22:42:58

SVD and PCA

MIT 線性代數課程中講過的矩陣分解有很多種，但是據我所知最重要的應該是SVD分解了，假如現在想把矩陣A行空間的正交基通過A左乘的方法變換到A列空間的正交基，有：將上式左右兩邊都乘以V的轉置，就可以得到矩陣奇異值分解的公式，SVD的分解

2020-06-30 22:42:58

理解xgboost

大牛博客推薦： wepon 原始論文： XGBoost: A Scalable Tree Boosting System xgboost的slide 中文原理說明 xgboost的原理篇看了很多，總結大牛博客和自己筆記基

2020-06-30 22:10:48

xgboost的原生接口與sklearn接口輸出feature_importance

1、sklearn的原生接口和sklearn接口調用feature_importance有差別： bst = xgb.train(param, d1_train, num_boost_round=100, evals=watch_

2020-06-30 22:10:36

Python連續變量分箱--woe值單調分箱

最近上傳了一個變量分箱的方法到pypi，這個包主要有以下說明：缺失值單獨一箱，不論缺失的數量多少；生成的分箱woe值是單調的，後續有時間會迭代U型分箱的版本；會有分箱最小樣本數佔比，類似決策樹的最小葉節點佔比；分箱成功的

2020-06-30 22:10:36

Python ： satasmodels & sklearn LogisticRegression

python 邏輯迴歸 satasmodels 和 sklearn LogisticRegression結果係數總是不一致除了LogisticRegression要設置fit_intercept = False以外，會發現skl

2020-06-30 22:10:36

機器學習系列(15)_SVM碎碎念part3：如何找到最優分離超平面

作者：寒小陽時間：2016年9月。出處：http://blog.csdn.net/han_xiaoyang/article/details/52683653 聲明：版權所有，轉載請聯繫作者並註明出處 1.引言是的，咱們

2020-06-25 11:30:21

機器學習系列(13)_SVM碎碎念part1：間隔

作者：寒小陽時間：2016年9月。出處：http://blog.csdn.net/han_xiaoyang/article/details/52678373 聲明：版權所有，轉載請聯繫作者並註明出處 1.引言欠的總歸是

2020-06-25 11:30:19

數據挖掘中的分類算法比較

隨着計算能力、存儲、網絡的高速發展，人類積累的數據量正以指數速度增長。對於這些數據，人們迫切希望從中提取出隱藏其中的有用信息，更需要發現更深層次的規律，對決策，商務應用提供更有效的支持。爲了滿足這種需求，數據挖掘技術的得到了長足的發

2020-06-24 09:39:03

分類算法之一——數據預處理

現實世界中數據大體上都是不完整，不一致的髒數據，無法直接進行數據挖掘，或挖掘結果差強人意。爲了提前數據挖掘的質量產生了數據預處理技術。　　數據預處理有多種方法：數據清理，數據集成，數據變換，數據歸約等。這些數據處理技術在數據挖掘之前使

2020-06-24 08:40:29

GPU上大規模稀疏矩陣特徵值計算高效算法之一——GPU介紹

GPU主要特點 1. 高吞吐量。 2. 擁有數百個硬件處理單元，性能達到1Tflops。 3. 每個處理單元深度多線程，即使有的線程被stall了，GPU還能夠繼續正常執行。 4. 高memory帶寬。 GPU結構特性 1）硬件模型

2020-06-24 08:40:24

機器學習之統計分析(1)

前言最近在阿里雲數加平臺上學習一下機器學習，把學習中整理的資料記錄於此，已備查看，以下資料主要是概念解釋及應用。數據視圖大數據通用可視化控件，提供所選擇字段的直方圖，如下圖所示：協方差相關係數算法用於計算一個矩陣中每一

傲慢的上校

2020-06-23 14:09:17

24小時熱門文章

最新文章

最新評論文章