额拖延症....only 73 篇

使用ffmpeg对wav文件进行降采样

Feb. 26, 2020, 5:14 p.m.

read: 10

依赖pysoundfile,ffmpeg把采样率大于16k的wav文件降采样为16k速度比使用librosa快很多,适合批量处理的情况不适合在Windows环境下运行 import os, soundfile as sf, shutil root_dir = '/home/zhangpeng/mydisk' data_names = ['ffsvc2020/dev', 'ffsvc2020/train', 'nihaomiya_all/train', 'nihaomiya_all/dev'] def get_paths(work_dir, ext='.wav'): l = [] …

python 读写 pickle文件

Jan. 15, 2020, 5:25 p.m.

read: 96

以python3为例注意:python3 与 python2 默认生成的pickle文件不通用,你得加上参数, 即协议版本, 以下样例不加协议: # 写入文件 with open('1.pickle', 'wb') as f: pickle.dump(self.key_dict, f) # 读取文件 with open('1.pickle', 'rb') as f: key_dict = pickle.load(f)

Bye2019,Hello2020

Jan. 1, 2020, 3:42 p.m.

read: 93

今天是2020年元旦,阳历新年的第一天。又到了该更新一篇博客的时间了,链接一下去年今日的博客Hello 2019。毕竟是阳历新年的第一天,这个博客的主题应该是温故而知新?不不不应该是回顾过去的一年,展望新的一年才对。 回顾过去的一年过去的一年,过去的太快了, 来不及仔细的品就过去了。过去的一年最大的收获是迎来了某一个不愿透露姓名的猪。帮助我在SV任务上获取了较大的进展。昨天本来想和猪一起去深圳湾跨个年。。。然而溜得不够快,加班至11点。有人说付出总是有回报的,我觉得吧,付出不总是有回报的,但是可能会带来一些惊喜吧。昨天某猪在某个论文中找到了一个反直觉的方案,仔细一想会有另一番滋味。一切都进行…

Python EER等错误率计算

Dec. 1, 2019, 3:50 p.m.

read: 165

import numpy as np class PerformanceEvalHelper(): def eer_clac(self, output, label): if type(output) == list: output = np.array(output) label = np.array(label) for i in range(-1000, 1000): label_copy = label.copy() output…

pytoch dataloader can only join a child process

Nov. 24, 2019, 10:22 p.m.

read: 187

环境python版本3.7.0pytorch版本1.3.1pycharm远程调试 import torch from torch import multiprocessing # DEPENDANCY: This is required for ``DistributedDataParallel`` # https://pytorch.org/docs/stable/nn.html?highlight=distributeddataparallel#torch.nn.parallel.DistributedDataParallel try: multiprocessing.set_…

SoX 音频加速减速

Nov. 24, 2019, 5:19 p.m.

read: 180

SoX - 音频处理的瑞士军刀Welcome to the home of SoX, the Swiss Army knife of sound processing programs.摘自SoX官网 播放加/减速以待处理文件1.wav为例,下同 加速为原来的两倍 并播放 play 1.wav stretch 0.5 减速为原来的1/2 并播放 play 1.wav stretch 2 加/减速后存入文件加速为原来的两倍 并存为 out.wav sox 1.wav out.wav stretch 0.5 减速为原来的1/2 并存为 out.wav …

WAV降采样方式横向评测

Nov. 17, 2019, 5:36 p.m.

read: 115

# scipy.signal 进行降采样 def wav_file_resample(sig, source_sample=44100, dest_sample=16000): try: signal.resample except: from scipy import signal ''' 对WAV文件进行resample的操作 !!!注意:sig必须是np.int16格式 :param file_path: 需要进行resample操作的wav文件的路径 :param source_sample…

Kaldi线下交流会后有感

Oct. 29, 2019, 1:42 p.m.

read: 540

今夕何夕,明月依旧,爱恨几时休;沧海桑田,阴晴圆缺,缘分最难寻。——《微微一笑很倾城》 前言这篇主要写写感悟吧。非常开心能够在非常繁忙的工作去参加第四届kaldi线下交流会。感觉这一届的商业化的气息更加浓厚了。大抵是这些交流会发展壮大之后都很难避免商业化吧。这次交流会在小米新建的科技园,位于帝都清河。会场很大,但还是坐满了,说明学习语音方向的同学还是很多吧。交流会上听小米的副总裁说 Daniel Povey在正式加入小米之前已经定下了第四届交流会在小米科技园举办了。说明小米在语音方向的决心很大。再加上Daniel加入小米,应该会吸引一批在Kaldi上面有情怀的同学吧。 正文本次交流会上有…

QQ·Linux版

Oct. 25, 2019, 10:02 a.m.

read: 91

乍见之欢不如久处不厌久处之厌莫若只如初见 我记得上一次我用QQforLinux还是在我小学的时候那时候我就感觉发消息 收消息很慢 但是吧不是不能用后来LinuxQQ的用户量也不多 版本也不更新了,也无法登录了。今天LinuxQQ在此发布新版本https://im.qq.com/linuxqq/download.html而现在的我也真正从事算法开发这个方向了。时间一晃眼它就过去了。。。

加/降混响

Oct. 21, 2019, 8:22 p.m.

read: 412

1.降混响WPE包加权预测误差(WPE)是语音混响方法,由NTT Corporation NTT通信科学实验室开发。该页面提供了WPE的Matlab p代码可执行文件。设计和分发此软件包中包括的工具和程序,其唯一目的是评估基于加权预测误差(WPE)的去混响算法。 http://www.kecl.ntt.co.jp/icl/signal/wpe/ 2.加混响来自这篇论文 https://arxiv.org/abs/1710.04196 使用 pyroomacoustics 这个库 import numpy as np import matplotlib.pyplot as plt im…

MacOS 安装 Kaldi 的 PortAudio

Oct. 17, 2019, 10:07 a.m.

read: 390

如果是基于kaldi的工程编译,则进入 kaldi/tools/运行 ./install_portaudio.sh 发生错误 ld: library not found for -lgcc_s.10.4 vim install_portaudio.sh 行数 96-106 加入一行 -e ‘s/-mmacosx-version-min=10.3//g’ \ if [ “$MACOS” != “” ]; then echo “detected MacOS operating system … trying to fix Makefile” mv Makefile Makefil…

Kaldi-aishell

Oct. 12, 2019, 3:33 p.m.

read: 436

准备linux 以UBUNTU16.01为例 下载git clone https://github.com/kaldi-asr/kaldi.git or wget https://github.com/kaldi-asr/kaldi/archive/master.zip unzip master.zip mv kaldi-master kaldi 检查依赖cd kaldi/tools ./extras/check_dependencies.sh 直到输出 ./extras/check_dependencies.sh: all OK. 编译tools目录确认 当前工作目录还在 …

PyTorch统计网络的参数数量

Oct. 3, 2019, 3:51 p.m.

read: 141

传入参数为已经实例化完成的网络,输出为所有需要求梯度的参数的数量 def count_parameters(model): return sum(p.numel() for p in model.parameters() if p.requires_grad)

FFmpeg 命令行

Sept. 23, 2019, 5:51 p.m.

read: 121

导出wavffmpeg -i huoying.mp4 -f wav -ar 16000 huoying.wav mp4压缩:原始音频1920x1080 大小208M $ du -h VID_20191126_105507.mp4 209M VID_20191126_105507.mp4 降低码率,分辨率长宽都设置为原来的1/2 ffmpeg -i VID_20191126_105507.mp4 -b:v 400k -s 960x540 out.mp4 du -h out.mp4 8.0M out.mp4 压缩完之后只有8M

ASSERT FAILED at /pytorch/aten/src/ATen/native/cudnn/RNN.cpp:528

Sept. 2, 2019, 6:16 p.m.

read: 187

ASSERT FAILED at /pytorch/aten/src/ATen/native/cudnn/RNN.cpp:528 RuntimeError: params_from.size(0) == params_to.size(0) ASSERT FAILED at /pytorch/aten/src/ATen/native/cudnn/RNN.cpp:528, please report a bug to PyTorch. number of layers mismatch 这个bug仅在1.0.0上出现,在它的上一个版本 0.4.1与下一个版本1.1.0中都未复现,所以解决方案是…

python3 判断一个list里面的元素是否相等

Aug. 29, 2019, 3:30 p.m.

read: 152

这里有两个重要的前提:1.当list长度为1,仅仅是一个元素的时候,认为是相等2.list长度不为0 def check_same(l): if len(set(l)) == 1: return True else: return False a = [1, 1, 1, 1] b = [1, 2, 3, 4] print(check_same(a)) print(check_same(b)) 输出结果为: TrueFalse

SPPAS 2.4 安装启动

Aug. 21, 2019, 5:47 p.m.

read: 159

发生 错误 UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xc0 in position 3: invalid start byte 原因:sppas目录不能含有中文

SSH 蜜罐数据收集计划

Aug. 18, 2019, 12:25 p.m.

read: 226

数据来自ssh蜜罐收集:共23639条,下面是部分数据 root/qyeee1234 root/cnnic root/utterly root/broke root/963256478715 root/whereon root/quick root/cdy123 root/iammecn@weiphone root/19800730 root/19740712 root/prince root/abdcefghi root/roping root/19790519 root/19730622 root/passroot root/wxmsyy424104 …

Softmax Loss

Aug. 9, 2019, 10:27 p.m.

read: 180

0x00 交叉熵Loss(Softmax Loss) import torch import torch.nn as nn import torch.nn.functional as F # 自己实现一个LossSoftmaxLoss #可以看到 class LogSoftmaxLoss: def _onehot_encoding_(self, label, num_classes): shape_0 = label.shape[0] label = label.reshape(-1, 1) result = torch.zeros(…

推荐使用 Firefox 访问此站点 | 服务器由huxia赞助 | 友情链接: 张鹏的博客  杨洋的博客   李号的博客 | Developed by zhangpeng && hupeng | Powered by Golang | Copyright © 2018-2020 hupeng.me