北京seo运营推广张家界seo推广
2026/1/8 8:05:00 网站建设 项目流程
北京seo运营推广,张家界seo推广,做网站的详细步骤,建设银行科技中心网站首页1、编译及文件说明编译步骤如下#xff1a;./autogen.sh./configuremake其中#xff0c;执行 ./autogen.sh 时#xff0c;会下载models文件#xff08;RNNoise 项目预训练的模型数据文件#xff0c;如果下载过慢#xff0c;可从文末提供的渠道获取#xff09;#xff1…1、编译及文件说明编译步骤如下./autogen.sh./configuremake其中执行 ./autogen.sh 时会下载models文件RNNoise 项目预训练的模型数据文件如果下载过慢可从文末提供的渠道获取imagernnoise_data主要包含了项目预训练好的模型权重使得用户在编译 RNNoise 后无需自己从头训练模型就能直接使用其降噪功能。rnnoise_data文件里面是c代码及pth文件image这里面有.c文件和.pth文件其中.c 文件由.pth文件生成存储预训练模型权重将神经网络权重以C数组形式嵌入供降噪算法直接调用降噪时由 rnnoise_process_frame 等函数直接使用。.pth 文件存储训练模型用于模型研究、微调或重新训练并非RNNoise运行时必需。使用说明1若只需使用RNNoise的降噪功能关注编译好的库及API即可。2若需要优化模型或适配特殊场景才需研究 .pth 文件及项目的训练脚本。2、降噪效果验证在examples目录里面有可直接运行的demo程序需要准备s16le 48khz格式的音频文件。输出为pcm格式的文件。导入效果如下image降噪效果如下image这里用的是Audacity软件查看降噪效果的关于Audacity软件的使用可参考这篇文章https://www.cnblogs.com/MikeZhang/p/audacity2022022.html关于pcm音频的播放可参考这篇文章https://www.cnblogs.com/MikeZhang/p/pcm20232330.html配套的音频文件可从如下渠道获取关注微信公众号聊聊博文文末可扫码后回复 20251031 获取。3、使用静态库二次开发实际使用过程中会涉及基于rnnoise库进行二次开发的情况这里提供下简单示例。基于rnnoise_demo.c修改的示例代码如下test1.c复制代码#include stdio.h#include rnnoise.h#define FRAME_SIZE 480int main(int argc, char **argv) {int i;int first 1;float x[FRAME_SIZE];FILE *f1, *fout;DenoiseState *st;st rnnoise_create(NULL);if (argc!3) {fprintf(stderr, usage: %s noisy speech output denoised\n, argv[0]);return 1;}f1 fopen(argv[1], rb);fout fopen(argv[2], wb);while (1) {short tmp[FRAME_SIZE];fread(tmp, sizeof(short), FRAME_SIZE, f1);if (feof(f1)) break;for (i0;iFRAME_SIZE;i) x[i] tmp[i];rnnoise_process_frame(st, x, x);for (i0;iFRAME_SIZE;i) tmp[i] x[i];if (!first) fwrite(tmp, sizeof(short), FRAME_SIZE, fout);first 0;}rnnoise_destroy(st);fclose(f1);fclose(fout);return 0;}复制代码编译命令如下g test1.c -o test1 -Iinclude -static libs/librnnoise.a也可写使用Makefile文件复制代码CC gCFLAGS -g -O2 -WallHDRS -IincludeLIBS -static libs/librnnoise.a# g test1.c -o test1 -Iinclude -static libs/librnnoise.aall:make test1test1:test1.o$(CC) -o test1 test1.o $(LIBS)clean:rm -f test1rm -f *.o.c.o:$(CC) $(CFLAGS) $(HDRS) -c -o $*.o $复制代码编译及运行效果如下image降噪效果如下image配套代码及文件可从如下渠道获取关注微信公众号聊聊博文文末可扫码后回复 20251031 获取。二、在python中使用rnnoise库rnnoise的python库内置的有降噪模型不用额外下载模型。pypi地址https://pypi.org/project/pyrnnoise/image安装rnnoise库pip install pyrnnoise主流平台都支持的image安装时会下载很多依赖库image安装后dll路径image示例代码rnnoiseTest1.py复制代码from pyrnnoise import RNNoise# Create denoiser instancedenoiser RNNoise(sample_rate16000)# Process audio filefor speech_prob in denoiser.denoise_wav(mix1.wav, output.wav):print(fProcessing frame with speech probability: {speech_prob})复制代码运行效果如下image降噪效果如下image配套代码及文件可从如下渠道获取关注微信公众号聊聊博文文末可扫码后回复 20251031 获取。三、模型训练这里做下简单说明具体可参考GitHub上的README文档https://github.com/xiph/rnnoiseimage1、数据集获取数据及模型下载地址https://media.xiph.org/rnnoise/image1rnnoise_contributions.tar.gz 是 RNNoise 项目提供的一个数据集压缩包主要用于训练 RNNoise 模型2data目录里面包含语音数据、噪音数据及其它辅助数据展开如下image3misc目录只有一个wav音频文件image4models文件夹存储的训练好的模型可直接使用image2、训练过程大致过程如下1使用dump_features提取特征文件。示例如下./dump_features -rir_list rir_list.txt speech.pcm background_noise.pcm foreground_noise.pcm features.f32 count其中 为处理的序列数量建议至少 10000 次越多越好推荐 200000 次以上。dump_features在rnnoise的根目录编译后image2可使用脚本 script/dump_features_parallel.sh 加速特征生成。使用方法如下script/dump_features_parallel.sh ./dump_features speech.pcm background_noise.pcm foreground_noise.pcm features.f32 count rir_list.txt该脚本会启动多个进程每个进程处理一定数量的序列并将结果合并为一个文件。3执行训练生成模型文件。训练脚本目录torch/rnnoiseimage训练命令如下python3 train_rnnoise.py features.f32 output_directory可选择适当的训练轮数通过 --epochs 参数指定比如 75000 次当使权重更新次数达到约 75000 次时会生成 .pth 文件比如 rnnoise_50.pth 。4将模型文件转换为 C 代码。脚本名称 dump_rnnoise_weights.py转换示例python3 dump_rnnoise_weights.py --quantize rnnoise_50.pth rnnoise_c会自动创建 rnnoise_c 文件夹然后在该文件夹里面生成 rnnoise_data.c 和 rnnoise_data.h 文件。5在C代码中使用模型。复制 rnnoise_data.c 和 rnnoise_data.h 文件到 src/ 目录然后按照之前描述的方法编译 RNNoise 工程会在examples目录里面找到可直接运行的demo程序rnnoise_demo。四、资源获取本文相关资源及运行环境可从如下渠道获取关注微信公众号聊聊博文文末可扫码后回复 20251031 获取。image

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询