CENet-GCN (2019年)

原創

2020-04-19 01:15

原創: [email protected]
時間: 2020/04/16

文章目錄

0x04 實驗結果

0x00 Paper

paper: Small-footprint Keyword Spotting with Graph Convolutional Network

科普：Fbank 和 MFCC 的區別

本文看點：

用了兩個方法來減少參數，保證性能的前提下
- 使用了bottleneck structure，參數較少，叫做CENet
Model Param FLOPs Acc

TC-ResNet-8 66k 3M 96.1%

CENet-6 16.2k 1.95M 93.9%
- 引入了GCN，可以獲取了更長範圍的上下文信息，叫做CENet-GCN
Model Param FLOPs Acc

CENet-40 60.9k 16.18M 96.4%

CENet-GCN-24 55.6k 9.11M 96.5%
數據集是Google Speech Command Dataset
評估model 指標的源頭paper

Deep residual learning for small-footprint keyword spotting (2018年)
代碼未開源

Model	Param	FLOPs	Acc
TC-ResNet-8	66k	3M	96.1%
CENet-6	16.2k	1.95M	93.9%

Model	Param	FLOPs	Acc
CENet-40	60.9k	16.18M	96.4%
CENet-GCN-24	55.6k	9.11M	96.5%

0x01 爲了解決什麼問題

之前的基於神經網絡的KWS方法雖然保證了計算效率，但是對於獲取局部感受野和短範圍的上下文信息不太行

These methods have demonstrated computational efficiency but failed in capturing local receptive fields and short range context.
針對於獲取長範圍的上下文信息的RNN models存在計算成本和延時增加的問題

0x02 提出了哪些創新點

結合GCN和CENet，提出了CENet-GCN

什麼是CENet？

Inspired by the ResNet [21], we propose a compact and efficient convolutional network (denoted as CENet) by utilizing the bottleneck architecture with narrow structure.

基於bottleneck architecture，提出了緊湊高效的卷積神經網絡，CENet
第一個使用GCN，來獲取長範圍的上下文信息並增強特徵信息。

0x03 網絡結構

3.1 先獲取 MFCC 特徵

3.2 CENet

目的
- 緊湊的網絡結構
- 低計算成本
參考ResNet
作者還對通道數做了一個消融實驗，來驗證model的性能和計算效率
結構
1. Initial block
  - 生成特徵圖
  - 增加2 × 2的平均池化層，爲了減少特徵圖的空間size
2. Bottleneck block
  - 更低的模型複雜性，分爲1 × 1; 3 × 3; 1×1
3. Connection block
  - 升維和降維，通過使用stride = 2

3.3 GCN

原理：在特徵表示中建模非局部的關係，應用在KWS中，可以獲取長範圍的上下文信息

Modeling non-local relations in feature representations
非局部的關係定義如下：

僅用了一層，來保證模型較小的複雜度
增強了特徵信息（怎麼增強的？還沒搞清楚）

0x04 實驗結果

數據集：Google Command Dataset
量化後的model 比較：（比res15小，比DS-CNN-S小，後面的是從TC-ResNet截圖過來的）
CENet without GCN

CENet-GCN; MFCC or fbank as input

下面括號中的acc是以fbank 特徵作爲輸入的，標準的是用MFCC作爲輸入

GCN add different stages

可視化的特徵圖（add GCN）

ROC
可視化的特徵圖（add GCN）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

CENet-GCN (2019年)

文章目錄

0x00 Paper

0x01 爲了解決什麼問題

0x02 提出了哪些創新點

0x03 網絡結構

3.1 先獲取 MFCC 特徵

3.2 CENet

3.3 GCN

0x04 實驗結果

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

STM32CubeMx wiht AI 初體驗

數據結構與算法_渡劫3

Beyond Tracking

數據結構與算法_渡劫2

數據結構與算法_渡劫4

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結