INTERSPEECH 2019 论文解读-1

Sept. 19, 2019, 3:36 p.m.

read: 21

论文的题目是:

A Time Delay Neural Network with Shared Weight Self-Attention forSmall-Footprint Keyword Spotting

来自中科院一篇文章
https://www.isca-speech.org/archive/Interspeech_2019/pdfs/1676.pdf

作者为白烨,分享一篇他的综述
https://mp.weixin.qq.com/s/c-lQETCPQTztZjV4TYTsZA

这个文章中提出了一个新的网络,整个网络的参数量仅12K,适合在移动端进行相关部署。

这个网络中未使用RNN相关的模块,RNN形如LSTM,GRU参数量和计算量都很大,特别是隐层大的时候。

未完待续。。。

FFmpeg 命令行

导出wav ffmpeg -i huoying.mp4 -f wav -ar 16000 huoying.wav

ASSERT FAILED at /pytorch/aten/src/ATen/native/cudnn/RNN.cpp:528

文章标题:ASSERT FAILED at /pytorch/aten/src/ATen/native/cudnn/RNN.cpp:528文章内容:ASSERT FAILED at /pytor...

推荐使用 Firefox 访问此站点 | 友情链接: 张鹏的博客  Web布拉格  杨洋的博客   李号的博客   魏文成博客 | Developed by zhangpeng | Copyright © 2018-2019 hupeng.me