原创 語音信號處理流程總結

一、語音合成、識別中不可避免 在做語音合成、語音識別過程中,難以避免的會涉及到語音信號知識,通過對多篇博客的閱讀和理解,作以下總結: 二、大致流程 根據 zouxy09博客 ,知道大致預處理流程如下: 接下來再進一步對各個環節進

原创 深度學習論文專欄

深度學習論文專欄 以下,建立論文閱讀專欄,一是爲提高論文閱讀能力,二是爲保證知識更新,三是爲了記錄和傳播好的論文思想 以下僅做粗淺分類,方便查閱,持續更新… 一、NLP 1、Transformers are RNNs: Fast

原创 深度學習論文常見單詞積累

持續更新… 常見單詞: incorporate 包括 scale 規模 scale up 放大,增加 adversarial 對抗的 overlap 交叉,交疊 disjoint. 不連貫 disentangle 解開,分解

原创 數據集加速下載

有時候在下載大的數據集時,瀏覽器下載速度可能比較慢,直接終端下載值得一試,往往能加快速度: wget -c https://網址 加上-c的意思是斷點續傳。

原创 各種矩陣(向量)求導

一個準則:按照單變量求導來做,然後調整下維數就可以了。 比如 對矩陣的求導,結果一定是和矩陣維數一致纔對 今天早上遇到@tornadomeet在deep learning高質量羣裏問:一個列向量對一個列向量求導的結果,也就是下

原创 python對音頻文件進行重採樣

一、ffmpeg pip install python-ffmpeg 簡單代碼: import ffmpeg ffmpeg.input('input.mp3').output('output.mp3', ar=16000).r

原创 訪問遠程服務器的tensorboard

場景與問題 tensorflow程序運行在遠程服務器,tensorboard啓動後訪問地址爲:0.0.0.0:6006。這樣沒法用自己機器上的瀏覽器訪問tensorboard。 解決辦法 1 . 連接ssh時,將服務器的6006端

原创 pytorch報錯 ConvTranspose1d object has no attribute padding_mode

‘ConvTranspose1d’ object has no attribute 'padding_mode’錯誤:https://github.com/NVIDIA/tacotron2/issues/182 解決方法: Usi

原创 windows中vscode 配置 C/C++ 編譯環境 教程

參考博客: https://blog.csdn.net/qq_43041976/article/details/100542557, –(2020年05月26日親測可行)– MinGW-W64 GCC 離線下載地址:https:/

原创 VAE全面理解

VAE全面理解(上) VAE全面理解(下)

原创 Linux下,c++獲取當前程序路徑

Linux下,c++獲取當前程序路徑 #include <stdio.h> #include <unistd.h> char *buffer; buffer = getcwd(NULL, 0); cout << "文件路徑" <

原创 c++耗時測試

c++耗時測試 #include<time.h> using namespace std; int TestTimeCost() { clock_t startTime,endTime; startTime = clo

原创 TensorBoard實現訓練可視化

推薦:TensorBoard實現訓練可視化 https://zhuanlan.zhihu.com/p/84215973 https://www.jianshu.com/p/321eb9d195cc

原创 引用做函數的返回值

#include<iostream> #include<string> using namespace std; //引用做函數的返回值 //引用的注意事項 //1、不要返回局部變量的引用 //2、函數的調用可以作爲 左值