原创 多說話人Tacotron2

Hparams設置: 爲了選擇最佳的fft參數,我製作了一個griffin_lim_synthesis_tool筆記本, 您可以使用它來反轉實際提取的梅爾/線性光譜圖,並選擇預處理的好壞程度。所有其他選項都在hparams.py中得到了很

原创 Tacotron-2-voiceEncodeRnn-transferLearning(CorentinJ/Real-Time-Voice-Cloning)初始化

在Lab10上. 先跑通pre-train 1.pip install -r requirements.txt 需要去掉tensorflow那塊, 我們lab10上的不叫gpu 2.下載googleDrive中的文件. https

原创 VAE-Tacotron-2/1 以及 VQ-VAE的原理探討與實現.

Tacotron (yanggeng1995) An implementation of VAE Tacotron speech synthesis in TensorFlow. (https://arxiv.org/abs/1812.0

原创 在Archlinux上使用docker

1.按照官網說的安裝:archlinux+conda 2.唉, 算了.

原创 復現兩篇論文, 結構實現細節進行說明.代碼備份, 報告完成並備份.

Google: Voice clone and code-switching cross multi-language   1.再仔細讀一遍google論文中的language id和speaker id送入Decoder大結構的細節.

原创 研二-知識工程第一節課-概念

作業 What is data? What is information? What is knowledge? What is knowledge engineering? 1.包含4部分: Knowledge Modeling

原创 Fast Speech,同時關注可控制語速.

在Monster上. 先跑通GitHub 1.數據下載. unzip ali…zip 先跳過pre data LJ, 明天和標貝的一起準備. 直接都是用pre-model: 前兩個gdown ckpt用 百度網盤: wget -c

原创 Tactron-1-car20-LDE初始化

先跑通LJSpeech 1.v100-monsterLJdata在外面, 更改datasets/LJ/prepare中的basedir. 2.路徑和模塊問題 import sys import os #print(sys.path

原创 準備開題

最近忙着趕論文和開題, 很多東西放在了印象筆記和git上, 沒有往csdn搬. 回頭再說吧. 下面的文字也是臨時當個網盤用, 等等就刪了 code-switched TTS 語言片段切換的語音合成 mixed-lingual

原创 Tacotron-1嚴格復現CUHK-Mix-Language論文

We clip gradients when their global norm ex-ceeds 1 and use parallel-mode monotonic attention with initial en-ergy

原创 DevilFruit: Vocoder之LJSpeech訓練的WaveGlow

目錄LJS_WaveGlow用法bash腳本文檔: 模型來源 LJS_WaveGlow用法 bash腳本 文檔: 模型來源

原创 NLP第一課: 深度學習簡介和常識

FP和BP和消失爆炸 梯度消失和爆炸簡化解釋- -link 梯度消失及其解決方法- -link 解決零: relu, clip, loss正則化. BN. 數值 relu、leakrelu、elu等激活函數 clip 正則化 B

原创 《動手學深度學習》戴口罩的胡蘿蔔組 - 戶建坤 第一次打卡 (線性, Softmax, 多層感知機, 文本預處理, 語言模型, RNN)

線性迴歸 1. 數據集名詞 training set sample label feature 2. 均方差損失函數 均值差的平方損失 (a-b)**2 / 2 在 batch 中求平均, 即 sum / len(batch) 爲

原创 tensorboard的使用(以Tacotron-1-car20爲例)

目錄調用數據PROJECTORscalar代碼 調用 在有envent的地方: tensorboard --logdir=./ --host=0.0.0.0 --port=8880 數據 PROJECTOR PROJECTOR用

原创 從SPE-phoneme版本更改爲Graphyme版本

目錄複製改Train改Text測試 複製 SPE-phoneme版本,刪除logs 改Train 更換訓練的文本. 複製LDE-Graphyme的, 使用Graphyme_mix_train.txt 改Text 更換爲Graphy