原创 Linux nccn step-by-step教程

目錄 1. 編譯OpenCV 2. 編譯ncnn 3.官方例子測試 1. 編譯OpenCV 先去https://opencv.org/releases/選擇一個你喜歡的opencv版本,然後下載到你電腦中,這裏以3.4版本爲例。git c

原创 解析自適應濾波回聲消除

回聲消除是語音信號處理領域比較常見的處理方法,基於自適應預測的回聲消除是其中比較基礎的一種。但在很多博客中卻沒有將其中的一些細節講清楚,導致讀者一頭霧水,這裏做一個詳細的總結。回聲分爲線路回聲和聲學回聲,本文重點關注聲學回聲。 1. 回聲

原创 我們是如何聽見聲音的

目錄 1. 言語鏈 2. 聽覺器官 3. 聽覺的機理 4. 聽覺掩蔽 4.1 頻域掩蔽 4.2 時域掩蔽 5. 聽學模型 5.1 感知線性預測模型 5.2 Seneff聽覺模型 瞭解人類是如何聽見語音和感知語音有助於我們研究如何去表徵語音

原创 機器學習常用概念辨析

目錄 Bagging & Boosting 方差 & 偏差 近似誤差 & 估計誤差 判別模型 & 生成模型 期望風險 & 經驗風險 & 結構風險 上採樣 & 下采樣 先驗概率 & 後驗概率 信息增益 & 基尼係數 正確率、精確率、召回率、

原创 【論文解析】Single Path One-Shot Neural Architecture Search with Uniform Sampling

目錄 Resource Introduction Method 1. 方法概述 2. 超網絡架構 3. Trick Channel Number Search Mixed-Precision Quantization Search Dis

原创 聲音產生的機理詳解

目錄 1. 語音交流的基本過程 2. 發聲的器官 3. 語音產生的機理 4. 數學模型 語音是人與人之間最自然、最有效的交流溝通方式,它不僅包含語音本身的內容信息還攜帶了說話者的喜怒哀樂。現代生活中,語音交流十分便捷,但是語音本身產生的原

原创 pytorch exp_(), add_()等運算

pytroch小白,今天看到別人代碼有exp_(), add_()等函數,一開始以爲是python的,搜了半天沒搜到。回來意識到是torch的,再搜發現搜的都是 VAE的定義。後來去中文手冊搜了以下,發現這些是函數inplace的簡寫。舉

原创 語音信號分析之短時相關分析

目錄 1. 短時相關 2. 短時相關提取流程 3. 短時平均幅差 4. 代碼實現與效果 1. 短時相關 短時相關分爲短時自相關和短時負相關。相關函數用於測定兩個信號的時域相似性,語音中主要研究自相關,可以分析語音波形的同步性,週期性等。短

原创 Numpy根據某一列進行排序

import numpy as np data = np.array([[1,2],[5,3],[4,6],[7,5],[9,0]]) data = data[np.argsort(data[:,0])] print(data) 按照數

原创 從零實現機器學習算法(十四)FP-growth

目錄 1. FP-growth簡介 2. FP-growth模型 2.1 FP-growth數據結構 2.2 頻繁項集 2.3 關聯規則 3. 總結與分析 1. FP-growth簡介 FP-growth也是一種經典的頻繁項集和關聯規則的

原创 從零實現機器學習算法(十)樹迴歸(Tree Regression)

目錄 1. 樹迴歸簡介 2. 樹迴歸模型 2.1 特徵選擇 2.2 迴歸樹生成 2.3 迴歸規則 3. 總結與分析 1. 樹迴歸簡介 上一節介紹了線性迴歸模型,但是在實際生活中許多問題都是非線性的,或者分段線性的因此很難建立一個全局的線性

原创 從零實現機器學習算法(十一)KMeans

目錄 1. KMeans簡介 2. KMeans模型 2.1 KMeans 2.2 2分KMeans 2.3 KMeans++ 3. 總結與分析 1. KMeans簡介 KMeans是一種簡單的聚類方法,它使用每個樣本到聚類中心的距離作爲

原创 tkinter選擇文件後在窗口顯示文件路徑

目錄 1. Application的建立 2. 窗口布局 3. 打開文件並顯示文件 4. 完整代碼 最近在學習tkinter,遇到了一個問題,如何在選擇文件後讓文件路徑在窗口顯示,折騰了一番之後終於解決了。 1. Application的

原创 說話人性別識別

讓人類來分辨說話人的性別是件十分簡單的事情,對於機器來說也不是什麼難事,下面介紹使用BiRNN進行說話人性別識別。 1. 性別判定特徵 說道男女聲音的差異很多人第一反應就是音高,這裏的音高指的是基音的頻率,我們採用基音週期作爲判決男聲女聲

原创 使用LSTM進行端點檢測

本文代碼請見:https://github.com/Ryuk17/SpeechAlgorithms 目錄 1. 端點檢測的特徵 2. 模型訓練 3. 樣本測試 語音信號中一般有50%的時間是靜音,給語音信號處理帶來了額外的運算開銷。在對語