音频编码简介

May 24, 2021, 3:52 p.m.

read: 1131

编解码器 名称 无损 使用说明
MP3 MPEG 第三层音频 省略
FLAC 免费无损音频编解码器 信息流要求使用 16 位或 24 位的位深
LINEAR16 线性 PCM 16 位线性脉冲编码调制 (PCM) 编码
MULAW μ 律 8 位 PCM 编码
AMR 自适应多速率窄带 采样率必须为 8000 Hz
AMR_WB 自适应多速率宽带 采样率必须为 16000 Hz
OGG_OPUS Ogg 容器中的 Opus 编码音频帧 采样率必须为 8000 Hz、12000 Hz、16000 Hz、24000 Hz 或 48000 Hz 之一
SPEEX_WITH_HEADER_BYTE Speex 宽带 采样率必须为 16000 Hz

Ref

音频编码简介 Cloud Speech-to-Text 文档




R_DROP

本篇博客主要是更新基于PyTorch的等价实现,以方便日后调用主要的核心是交叉熵和KL散度,网络中需要有dropout结构 0x00 CE LOSScode import numpy as np…

VSCode的配置 PyCharm的享受

文章标题:VSCode的配置 PyCharm的享受文章内容:0x01.vscode/settings.json { "python.pythonPath": "Python解释器的路径",…

此站点由 ASP.NETIIS 驱动 | © 2018-2023 hupeng.me. All Rights Reserved.