原创 kaggle比賽一之ieee-fraud-detection

https://www.kaggle.com/nroman/lgb-single-model-lb-0-9419 https://www.kaggle.com/nroman/eda-for-cis-fraud-detection

原创 嘗試nvidia的Tacotron-2和waveglow的結合, 並且着重考慮多GPU以及inference時的性能.

https://ngc.nvidia.com/catalog/model-scripts/nvidia:tacotron_2_and_waveglow_for_pytorch https://ngc.nvidia.com/catalog/

原创 簡單的基於Tacotron2的中英文混語言合成, 包括code-switch和voice clone. 以及深入結構設計的探討.

之前的討論 33. 韻律評測, 很重要. https://zhuanlan.zhihu.com/p/43240701 34. 復現了Tacotron2 中文和英文 單語言合成, 音質滿足期望(忽略inference時間), 下一步方向在哪

原创 Tensorflow1.x查看ckpt變量情況, 以及爲之後部分恢復權重做鋪墊.

查看變量的方法: https://blog.csdn.net/noirblack/article/details/71430790

原创 Pycharm爲核心在構建服務器端深度學習語音合成程序時的配置和技巧

目錄服務器端程序交互項目映射相關1. 簡介2. Pycharm遠程映射配置編輯器相關1. 代碼提示版本控制1. 基於PyCharm2. 網頁端簡單實例舊項目建庫 服務器端程序交互 項目映射相關 1. 簡介 把遠程的項目映射到本地,

原创 復現END-TO-END CODE-SWITCHED TTS WITH MIX OF MONOLINGUAL RECORDINGS論文, 理解以及代碼, 以及實驗結果.

Show us the samples please? By the way, you had better change the mel loss function into MAE and watch the alignment ag

原创 Tacotron-2-google-full-structure 以及 過程中產生的靈感

1. speaker id 和 language id 放的位置: The synthesizer network uses the Tacotron 2 architecture [20], with additional inputs

原创 搭建基於django的網頁/APT用來迭代和展示TTS

https://cloud.tencent.com/developer/article/1483982 https://www.cnblogs.com/LuckyZLi/p/9832590.html https://www.runoob.

原创 10月份語音合成任務安排: 商業化的普通話合成 (質量, 速度, 準確度, 韻律)

-1.0 首先趁着國慶節把9月份的任務完成, 快速整理, 難的或者繁瑣的作爲10月份任務之一, 但不再拓展, 即使拓展, 也只是先記下來, 後來發現還是太多了, 記下來的在下午去完成, 上午8到12點學習新的.  復現兩篇論文, 結構實現

原创 《動手學深度學習》戴口罩的胡蘿蔔組 - 戶建坤 第二次打卡 (過欠擬合; 梯度消失爆炸;RNN進階; 機器翻譯;注意力機制與Seq2seq; Transformer; CNN基礎)

過欠擬合以及解決方案 知識重點 1.K交叉驗證沒明白有什麼用? 2.單層神經元個數, 相當於多項式擬合的次數, 但是好像神經網絡都是1次方, 那到底是相當於層數加深? 還是單層參數變大? 還是目前的網絡都不體現 x 的多次方???

原创 Maybe數據集ObscureMoon(閉月)

構建數據集思路 1.覆蓋儘量多的"東西". "東西"可能是字, 拼音, 音節, 需要請教. 2.詳細瞭解錄音環境, 老師的傾向. 進行傳統語音信號統計. 3.使用教育下慢音時, 如何設計語料. 4.額外思考如何使用學習強國中標準的

原创 接口: Phoneme的放出no-ref-no-vae/mix-phoneme版本的, 只要中文聲音

1. c++編譯並使用.so g++ demo.cpp CrystalDll.so -o main export LD_LIBRARY_PATH="./" ./main 2. 對接CrystalTTS的邊界情況和標貝數據的邊界情況以及聲韻

原创 使用新的v100服務器配置和注意事項

1. public key: https://blog.ipsfan.com/1492.html https://blog.csdn.net/weixin_41714277/article/details/79399270 C:\User