audio-note-taker - 语音笔记助手

智能语音笔记助手——自动将录音转成结构化文字笔记。

适用场景

- 🎙️ 会议记录：自动转录会议内容，提炼行动项
🎓 讲座笔记：课堂/讲座录音转文字，自动整理要点
📰 采访整理：语音采访转文字稿，快速生成报道素材
💼 工作复盘：项目复盘录音 → 结构化记录
📝 日常笔记：快速语音记录 → 文字存档

核心功能

- ✅ 高精度转写：基于 OpenAI Whisper API，支持多种语言
✅ 结构化输出：自动划分段落，识别关键信息
✅ 智能摘要：提取核心观点、决策、待办事项
✅ 说话人区分：可选说话人识别和标记
✅ Markdown 格式：输出易读、易编辑的笔记
✅ 多种输入：支持音频文件或直接录音

快速开始

基础转写

CODEBLOCK0

指定主题和格式

CODEBLOCK1

启用说话人识别

CODEBLOCK2

生成深度摘要（需配置 LLM）

CODEBLOCK3

参数说明

参数	类型	默认	说明
INLINECODE0	路径	必填	音频文件路径（支持 mp3, m4a, wav, ogg 等）
INLINECODE1

字符串 | 自动生成 | 笔记标题 | | --language | 代码 | auto | 音频语言（en, zh, ja, auto 等） | | --output | 路径 | {input}_notes.md | 输出文件路径 | | --detect-speakers | 布尔 | false | 是否识别不同说话人 | | --summarize | 布尔 | false | 生成摘要（需 OPENAIAPIKEY） | | --extract-action-items | 布尔 | false | 提取行动项 | | --model | 字符串 | whisper-1 | Whisper 模型（whisper-1） | | --format | 字符串 | markdown | 输出格式（markdown, txt, json） |

环境变量

变量名	说明	必填
INLINECODE10	OpenAI API 密钥	✅
INLINECODE11

输出内容示例

CODEBLOCK4

与其他技能集成

- social-publisher：将会议纪要直接整理成公众号/小红书文章
summarize：对长录音先提取关键信息，再生成摘要
wechat-formatter：将会议纪要快速格式化为公众号可发内容

技术细节

- 使用 OpenAI Whisper API 进行语音转文字
可选集成 GPT 模型进行摘要和行动项提取
支持中英文混合识别
音频预处理：自动降噪、格式转换（通过 ffmpeg）
输出 UTF-8 编码，支持中文排版

安装依赖

CODEBLOCK5

许可证

MIT

audio-note-taker - 语音笔记助手

智能语音笔记助手——自动将录音转成结构化文字笔记。

适用场景

- 🎙️ 会议记录：自动转录会议内容，提炼行动项
🎓 讲座笔记：课堂/讲座录音转文字，自动整理要点
📰 采访整理：语音采访转文字稿，快速生成报道素材
💼 工作复盘：项目复盘录音 → 结构化记录
📝 日常笔记：快速语音记录 → 文字存档

核心功能

- ✅ 高精度转写：基于 OpenAI Whisper API，支持多种语言
✅ 结构化输出：自动划分段落，识别关键信息
✅ 智能摘要：提取核心观点、决策、待办事项
✅ 说话人区分：可选说话人识别和标记
✅ Markdown 格式：输出易读、易编辑的笔记
✅ 多种输入：支持音频文件或直接录音

快速开始

基础转写

bash
audio-note-taker /path/to/recording.m4a

输出：recording_notes.md

指定主题和格式

bash
audio-note-taker /path/to/meeting.mp3 \
--title 2026-Q1 产品规划会 \
--language zh \
--output meeting_notes.md

启用说话人识别

bash
audio-note-taker /path/to/interview.wav \
--detect-speakers true \
--output interview_transcript.md

生成深度摘要（需配置 LLM）

bash
audio-note-taker /path/to/lecture.mp3 \
--summarize true \
--extract-action-items true \
--output lecture_summary.md

参数说明

参数	类型	默认	说明
input	路径	必填	音频文件路径（支持 mp3, m4a, wav, ogg 等）
--title

字符串 | 自动生成 | 笔记标题 | | --language | 代码 | auto | 音频语言（en, zh, ja, auto 等） | | --output | 路径 | {input}_notes.md | 输出文件路径 | | --detect-speakers | 布尔 | false | 是否识别不同说话人 | | --summarize | 布尔 | false | 生成摘要（需 OPENAIAPIKEY） | | --extract-action-items | 布尔 | false | 提取行动项 | | --model | 字符串 | whisper-1 | Whisper 模型（whisper-1） | | --format | 字符串 | markdown | 输出格式（markdown, txt, json） |

环境变量

变量名	说明	必填
OPENAIAPIKEY	OpenAI API 密钥	✅
OPENAIBASEURL

输出内容示例

markdown

会议记录：2026-Q1 产品规划会

时间：2026-03-15 14:00-15:30
地点：线上
参会人：张三、李四、王五

📝 会议纪要

讨论要点

1. Q1 产品上线延期原因分析
Q2 核心功能优先级排序
资源分配调整

✅ 决议事项

- [x] 确定 Q2 三大核心功能
[x] 批准额外 2 名开发人力
[x] 下周三前发布详细排期

📋 待办事项

负责人	任务	截止时间
张三	完成 PRD 文档	2026-03-18
李四

技术方案评审 | 2026-03-20 | | 王五 | 资源配置协调 | 2026-03-17 |

📄 完整转录（可折叠）

展开查看完整对话

[14:00] 张三：大家好，我们今天...
[14:05] 李四：关于延期，我觉得...
...

与其他技能集成

- social-publisher：将会议纪要直接整理成公众号/小红书文章
summarize：对长录音先提取关键信息，再生成摘要
wechat-formatter：将会议纪要快速格式化为公众号可发内容

技术细节

- 使用 OpenAI Whisper API 进行语音转文字
可选集成 GPT 模型进行摘要和行动项提取
支持中英文混合识别
音频预处理：自动降噪、格式转换（通过 ffmpeg）
输出 UTF-8 编码，支持中文排版

安装依赖

bash

系统依赖

apt install -y ffmpeg

Python 依赖（自动安装）

pip install openai>=1.0.0

许可证

MIT

audio-note-taker语音笔记助手

audio-note-taker

audio-note-taker - 语音笔记助手

适用场景

核心功能

快速开始

基础转写

指定主题和格式

启用说话人识别

生成深度摘要（需配置 LLM）

参数说明

环境变量

输出内容示例

与其他技能集成

技术细节

安装依赖

许可证

audio-note-taker - 语音笔记助手

适用场景

核心功能

快速开始

基础转写

输出：recording_notes.md

指定主题和格式

启用说话人识别

生成深度摘要（需配置 LLM）

参数说明

环境变量

输出内容示例

会议记录：2026-Q1 产品规划会

📝 会议纪要

讨论要点

✅ 决议事项

📋 待办事项

📄 完整转录（可折叠）

与其他技能集成

技术细节

安装依赖

系统依赖

Python 依赖（自动安装）

许可证

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement