返回顶部
f

fun-denoise智能降噪

智能音频降噪服务,基于阿里巴巴通义实验室 AI 算法,一键消除背景噪音,还原纯净人声。支持 wav、mp3、aac 等主流格式,适用于录音降噪、语音识别预处理、播客后期制作、会议录音优化等场景。当用户需要音频降噪、去除噪音、音频预处理、提升录音质量时使用。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
99
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

fun-denoise

FunAudioDenoise 智能音频降噪

服务简介

FunAudioDenoise 是阿里云百炼平台提供的专业级音频降噪服务,采用深度学习算法精准分离人声与背景噪音,让您的录音更清晰、更专业。

核心优势

特性说明
AI 智能降噪基于通义实验室深度学习模型,精准识别人声,有效消除环境噪音
实时流式处理
WebSocket 双向流式协议,支持边传边处理,响应迅速 | | 多格式兼容 | 支持 wav、mp3、aac、opus、amr、pcm 等主流音频格式 | | 大文件支持 | 单文件最大支持 2 小时或 1GB,满足长录音需求 | | 质量评估 | 自动输出音频质量评分,帮助您了解录音状况 |

适用场景

  • - 会议录音 - 消除会议室回声、空调声、键盘声等干扰
  • 播客制作 - 提升人声清晰度,打造专业音质
  • 语音识别预处理 - 提高 ASR 识别准确率
  • 在线教育 - 优化课程录音质量
  • 采访录音 - 还原清晰的对话内容
  • 有声书制作 - 打造沉浸式听书体验

快速开始

环境准备

bash
pip install dashscope websocket-client

设置密钥(只需一次)

bash
export DASHSCOPEAPIKEY=你的阿里云 API 密钥

一行命令降噪

bash
python denoise_cli.py input.mp3 output.wav

Python API 调用

python
from denoisecli import denoiseaudio

result = denoise_audio(
inputpath=noisyrecording.wav,
outputpath=cleanaudio.wav
)

if result[success]:
print(f降噪完成!音频质量评分: {result[outputinfo][voicequality]})

核心 API

DenoiseParam 参数配置

参数类型默认值说明
modelstrfun-audio-denoising模型名称(固定值)
apikey
str | None | DashScope API Key | | format | str | wav | 音频格式:wav、mp3、aac、opus、amr、pcm | | sampleratein | int | 16000 | 输入采样率(PCM 格式必填) | | samplerateout | int | None | 输出采样率(默认同输入) | | enable_denoise | bool | True | 是否启用降噪 |

处理结果元数据

python
{
samplerateout: 48000, # 输出采样率
voice_quality: 0.89, # 音频质量评分 (0-1)
validspeechms: 15000 # 有效语音时长(毫秒)
}

使用示例

示例 1:命令行快速降噪

bash

基础使用(自动推断格式)


python denoisecli.py meetingrecording.mp3

指定输出文件

python denoisecli.py interview.wav cleaninterview.wav

自定义参数

python denoise_cli.py podcast.mp3 --format mp3 --sample-rate 48000

示例 2:Python 脚本集成

python
import dashscope
from audio_process import Denoise, DenoiseParam, ResultCallback, DenoiseResult
import threading

设置 API Key

dashscope.api_key = your-api-key

class MyCallback(ResultCallback):
def init(self):
self.audio_data = b
self.complete_event = threading.Event()

def on_event(self, result: DenoiseResult):
if result.audio_frame:
self.audiodata += result.audioframe

def on_complete(self):
print(处理完成!)
self.complete_event.set()

配置参数

param = DenoiseParam( format=wav, sampleratein=16000, enable_denoise=True )

执行降噪

callback = MyCallback() denoise = Denoise(param=param, callback=callback) denoise.start_task()

发送音频数据

with open(input.wav, rb) as f: while chunk := f.read(3200): denoise.sendaudioframe(chunk)

denoise.syncstoptask()

保存结果

with open(output.wav, wb) as f: f.write(callback.audio_data)

示例 3:批量处理多个文件

python
from denoisecli import denoiseaudio
import os

inputdir = rawrecordings/
outputdir = cleanrecordings/
os.makedirs(outputdir, existok=True)

for filename in os.listdir(input_dir):
if filename.endswith(.wav):
inputpath = os.path.join(inputdir, filename)
outputpath = os.path.join(outputdir, fclean_{filename})

result = denoiseaudio(inputpath, output_path, verbose=False)

if result[success]:
quality = result[outputinfo].get(voicequality, N/A)
print(f✓ {filename} - 质量评分: {quality})
else:
print(f✗ {filename} - 失败: {result[error]})

最佳实践

1. 音频分帧策略

  • - 推荐帧大小:3200 字节(对应 16000Hz 采样率下 100ms 音频)
  • 发送间隔:配合音频时长,模拟实时流(100ms 数据间隔 100ms 发送)
  • 大文件处理:分块读取,避免内存溢出

2. 采样率选择

场景推荐采样率说明
语音识别16000Hz平衡质量与处理速度
电话录音
8000Hz | 兼容传统电话系统 | | 音乐/播客 | 44100Hz/48000Hz | 高保真音质 |

3. 质量评估解读

  • - voicequality > 0.8:音频质量优秀
  • voicequality 0.5-0.8:音频质量良好,轻度噪音
  • voice_quality < 0.5:音频质量较差,噪音较多

4. 异常处理建议

python
try:
denoise.start_task()
# ... 发送音频数据
denoise.syncstoptask(timeout=120000)
except TimeoutError:
print(处理超时,请检查网络连接)
except Exception as e:
print(f处理失败: {e})
finally:
denoise.close() # 确保资源释放

命令行工具详解

usage: denoisecli.py [-h] [--api-key APIKEY] [--format FORMAT]
[--sample-rate SAMPLE_RATE] [--no-denoise]
[--chunk-size CHUNKSIZE] [--chunk-delay CHUNKDELAY]
[-q]
input [output]

positional arguments:
input 输入音频文件路径
output 输出音频文件路径(可选)

optional arguments:
-h, --help 显示帮助信息
--api-key API_KEY DashScope API Key
--format FORMAT 音频格式 (wav, mp3, pcm, aac, opus, amr)
--sample-rate SAMPLE_RATE
采样率 (默认: 16000)
--no-denoise 禁用降噪(仅转换格式)
--chunk-size CHUNK_SIZE
分块大小(默认: 3200)
--chunk-delay CHUNK_DELAY
分块发送间隔(默认: 0.1秒)
-q, --quiet 静默模式

技术规格

项目规格
支持格式wav、mp3、aac、opus、amr、pcm
最大时长
2 小时 | | 最大文件 | 1 GB | | 输出采样率 | 自动优化(默认 48kHz) | | 协议 | WebSocket 双向流式 | | 延迟 | < 200ms(首包响应) |

相关资源


FunAudioDenoise - 让每一句声音都清晰可闻

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 fun-denoise-1776113770 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 fun-denoise-1776113770 技能

通过命令行安装

skillhub install fun-denoise-1776113770

下载

⬇ 下载 fun-denoise v1.0.0(免费)

文件大小: 11.33 KB | 发布时间: 2026-4-14 14:39

v1.0.0 最新 2026-4-14 14:39
FunAudioDenoise 1.0.0 发布:

- 提供基于阿里巴巴通义实验室 AI 算法的音频降噪服务,支持主流音频格式(wav、mp3、aac 等)。
- 支持实时 WebSocket 流式处理,适用于录音降噪、语音识别预处理、播客后期制作等多种场景。
- 命令行及 Python API 双接口,支持单文件和批量音频降噪处理。
- 输出自动音频质量评分与有效语音时长等核心元数据。
- 支持自定义采样率、分帧策略、异常处理等最佳实践。

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部