FunAudioDenoise 智能音频降噪

服务简介

FunAudioDenoise 是阿里云百炼平台提供的专业级音频降噪服务，采用深度学习算法精准分离人声与背景噪音，让您的录音更清晰、更专业。

核心优势

特性	说明
AI 智能降噪	基于通义实验室深度学习模型，精准识别人声，有效消除环境噪音
实时流式处理

适用场景

- 会议录音 - 消除会议室回声、空调声、键盘声等干扰
播客制作 - 提升人声清晰度，打造专业音质
语音识别预处理 - 提高 ASR 识别准确率
在线教育 - 优化课程录音质量
采访录音 - 还原清晰的对话内容
有声书制作 - 打造沉浸式听书体验

快速开始

环境准备

CODEBLOCK0

设置密钥（只需一次）

CODEBLOCK1

一行命令降噪

CODEBLOCK2

Python API 调用

CODEBLOCK3

核心 API

DenoiseParam 参数配置

参数	类型	默认值	说明
INLINECODE0	str	"fun-audio-denoising"	模型名称（固定值）
INLINECODE1

处理结果元数据

CODEBLOCK4

使用示例

示例 1：命令行快速降噪

CODEBLOCK5

示例 2：Python 脚本集成

CODEBLOCK6

示例 3：批量处理多个文件

CODEBLOCK7

最佳实践

1. 音频分帧策略

- 推荐帧大小：3200 字节（对应 16000Hz 采样率下 100ms 音频）
发送间隔：配合音频时长，模拟实时流（100ms 数据间隔 100ms 发送）
大文件处理：分块读取，避免内存溢出

2. 采样率选择

场景	推荐采样率	说明
语音识别	16000Hz	平衡质量与处理速度
电话录音

3. 质量评估解读

- voice_quality > 0.8：音频质量优秀
INLINECODE7 0.5-0.8：音频质量良好，轻度噪音
INLINECODE8 < 0.5：音频质量较差，噪音较多

4. 异常处理建议

CODEBLOCK8

命令行工具详解

CODEBLOCK9

技术规格

项目	规格
支持格式	wav、mp3、aac、opus、amr、pcm
最大时长

2 小时 | | 最大文件 | 1 GB | | 输出采样率 | 自动优化（默认 48kHz） | | 协议 | WebSocket 双向流式 | | 延迟 | < 200ms（首包响应） |

FunAudioDenoise 智能音频降噪

服务简介

FunAudioDenoise 是阿里云百炼平台提供的专业级音频降噪服务，采用深度学习算法精准分离人声与背景噪音，让您的录音更清晰、更专业。

核心优势

特性	说明
AI 智能降噪	基于通义实验室深度学习模型，精准识别人声，有效消除环境噪音
实时流式处理

适用场景

- 会议录音 - 消除会议室回声、空调声、键盘声等干扰
播客制作 - 提升人声清晰度，打造专业音质
语音识别预处理 - 提高 ASR 识别准确率
在线教育 - 优化课程录音质量
采访录音 - 还原清晰的对话内容
有声书制作 - 打造沉浸式听书体验

快速开始

环境准备

bash
pip install dashscope websocket-client

设置密钥（只需一次）

bash
export DASHSCOPEAPIKEY=你的阿里云 API 密钥

一行命令降噪

bash
python denoise_cli.py input.mp3 output.wav

Python API 调用

python
from denoisecli import denoiseaudio

result = denoise_audio(
inputpath=noisyrecording.wav,
outputpath=cleanaudio.wav
)

if result[success]:
print(f降噪完成！音频质量评分: {result[outputinfo][voicequality]})

核心 API

DenoiseParam 参数配置

参数	类型	默认值	说明
model	str	fun-audio-denoising	模型名称（固定值）
apikey

处理结果元数据

python
{
samplerateout: 48000, # 输出采样率
voice_quality: 0.89, # 音频质量评分 (0-1)
validspeechms: 15000 # 有效语音时长（毫秒）
}

使用示例

示例 1：命令行快速降噪

bash

基础使用（自动推断格式）

python denoisecli.py meetingrecording.mp3

指定输出文件

python denoisecli.py interview.wav cleaninterview.wav

自定义参数

python denoise_cli.py podcast.mp3 --format mp3 --sample-rate 48000

示例 2：Python 脚本集成

python
import dashscope
from audio_process import Denoise, DenoiseParam, ResultCallback, DenoiseResult
import threading

设置 API Key

dashscope.api_key = your-api-key

class MyCallback(ResultCallback):
def init(self):
self.audio_data = b
self.complete_event = threading.Event()

def on_event(self, result: DenoiseResult):
if result.audio_frame:
self.audiodata += result.audioframe

def on_complete(self):
print(处理完成！)
self.complete_event.set()

配置参数

param = DenoiseParam( format=wav, sampleratein=16000, enable_denoise=True )

执行降噪

callback = MyCallback() denoise = Denoise(param=param, callback=callback) denoise.start_task()

发送音频数据

with open(input.wav, rb) as f: while chunk := f.read(3200): denoise.sendaudioframe(chunk)

denoise.syncstoptask()

保存结果

with open(output.wav, wb) as f: f.write(callback.audio_data)

示例 3：批量处理多个文件

python
from denoisecli import denoiseaudio
import os

inputdir = rawrecordings/
outputdir = cleanrecordings/
os.makedirs(outputdir, existok=True)

for filename in os.listdir(input_dir):
if filename.endswith(.wav):
inputpath = os.path.join(inputdir, filename)
outputpath = os.path.join(outputdir, fclean_{filename})

result = denoiseaudio(inputpath, output_path, verbose=False)

if result[success]:
quality = result[outputinfo].get(voicequality, N/A)
print(f✓ {filename} - 质量评分: {quality})
else:
print(f✗ {filename} - 失败: {result[error]})

最佳实践

1. 音频分帧策略

- 推荐帧大小：3200 字节（对应 16000Hz 采样率下 100ms 音频）
发送间隔：配合音频时长，模拟实时流（100ms 数据间隔 100ms 发送）
大文件处理：分块读取，避免内存溢出

2. 采样率选择

场景	推荐采样率	说明
语音识别	16000Hz	平衡质量与处理速度
电话录音

3. 质量评估解读

- voicequality > 0.8：音频质量优秀
voicequality 0.5-0.8：音频质量良好，轻度噪音
voice_quality < 0.5：音频质量较差，噪音较多

4. 异常处理建议

python
try:
denoise.start_task()
# ... 发送音频数据
denoise.syncstoptask(timeout=120000)
except TimeoutError:
print(处理超时，请检查网络连接)
except Exception as e:
print(f处理失败: {e})
finally:
denoise.close() # 确保资源释放

命令行工具详解

usage: denoisecli.py [-h] [--api-key APIKEY] [--format FORMAT]
[--sample-rate SAMPLE_RATE] [--no-denoise]
[--chunk-size CHUNKSIZE] [--chunk-delay CHUNKDELAY]
[-q]
input [output]

positional arguments:
input 输入音频文件路径
output 输出音频文件路径（可选）

optional arguments:
-h, --help 显示帮助信息
--api-key API_KEY DashScope API Key
--format FORMAT 音频格式 (wav, mp3, pcm, aac, opus, amr)
--sample-rate SAMPLE_RATE
采样率 (默认: 16000)
--no-denoise 禁用降噪（仅转换格式）
--chunk-size CHUNK_SIZE
分块大小（默认: 3200）
--chunk-delay CHUNK_DELAY
分块发送间隔（默认: 0.1秒）
-q, --quiet 静默模式

技术规格

项目	规格
支持格式	wav、mp3、aac、opus、amr、pcm
最大时长

2 小时 | | 最大文件 | 1 GB | | 输出采样率 | 自动优化（默认 48kHz） | | 协议 | WebSocket 双向流式 | | 延迟 | < 200ms（首包响应） |

fun-denoise智能降噪

fun-denoise

FunAudioDenoise 智能音频降噪

服务简介

核心优势

适用场景

快速开始

环境准备

设置密钥（只需一次）

一行命令降噪

Python API 调用

核心 API

DenoiseParam 参数配置

处理结果元数据

使用示例

示例 1：命令行快速降噪

示例 2：Python 脚本集成

示例 3：批量处理多个文件

最佳实践

1. 音频分帧策略

2. 采样率选择

3. 质量评估解读

4. 异常处理建议

命令行工具详解

技术规格

相关资源

FunAudioDenoise 智能音频降噪

服务简介

核心优势

适用场景

快速开始

环境准备

设置密钥（只需一次）

一行命令降噪

Python API 调用

核心 API

DenoiseParam 参数配置

处理结果元数据

使用示例

示例 1：命令行快速降噪

基础使用（自动推断格式）

指定输出文件

自定义参数

示例 2：Python 脚本集成

设置 API Key

配置参数

执行降噪

发送音频数据

保存结果

示例 3：批量处理多个文件

最佳实践

1. 音频分帧策略

2. 采样率选择

3. 质量评估解读

4. 异常处理建议

命令行工具详解

技术规格

相关资源

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement