返回顶部
a

audio-note-taker语音笔记助手

语音笔记助手:录音自动转文字并整理成结构化笔记,支持说话人识别,自动总结要点和行动项

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
241
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

audio-note-taker

audio-note-taker - 语音笔记助手

智能语音笔记助手——自动将录音转成结构化文字笔记。

适用场景

  • - 🎙️ 会议记录:自动转录会议内容,提炼行动项
  • 🎓 讲座笔记:课堂/讲座录音转文字,自动整理要点
  • 📰 采访整理:语音采访转文字稿,快速生成报道素材
  • 💼 工作复盘:项目复盘录音 → 结构化记录
  • 📝 日常笔记:快速语音记录 → 文字存档

核心功能

  • - ✅ 高精度转写:基于 OpenAI Whisper API,支持多种语言
  • 结构化输出:自动划分段落,识别关键信息
  • 智能摘要:提取核心观点、决策、待办事项
  • 说话人区分:可选说话人识别和标记
  • Markdown 格式:输出易读、易编辑的笔记
  • 多种输入:支持音频文件或直接录音

快速开始

基础转写

bash
audio-note-taker /path/to/recording.m4a

输出:recording_notes.md

指定主题和格式

bash
audio-note-taker /path/to/meeting.mp3 \
--title 2026-Q1 产品规划会 \
--language zh \
--output meeting_notes.md

启用说话人识别

bash
audio-note-taker /path/to/interview.wav \
--detect-speakers true \
--output interview_transcript.md

生成深度摘要(需配置 LLM)

bash
audio-note-taker /path/to/lecture.mp3 \
--summarize true \
--extract-action-items true \
--output lecture_summary.md

参数说明

参数类型默认说明
input路径必填音频文件路径(支持 mp3, m4a, wav, ogg 等)
--title
字符串 | 自动生成 | 笔记标题 | | --language | 代码 | auto | 音频语言(en, zh, ja, auto 等) | | --output | 路径 | {input}_notes.md | 输出文件路径 | | --detect-speakers | 布尔 | false | 是否识别不同说话人 | | --summarize | 布尔 | false | 生成摘要(需 OPENAIAPIKEY) | | --extract-action-items | 布尔 | false | 提取行动项 | | --model | 字符串 | whisper-1 | Whisper 模型(whisper-1) | | --format | 字符串 | markdown | 输出格式(markdown, txt, json) |

环境变量

变量名说明必填
OPENAIAPIKEYOpenAI API 密钥
OPENAIBASEURL
自定义 API 地址(可选) | ❌ | | NOTETAKERMODEL | 摘要模型(默认 gpt-4-turbo) | ❌ |

输出内容示例

markdown

会议记录:2026-Q1 产品规划会


时间:2026-03-15 14:00-15:30
地点:线上
参会人:张三、李四、王五


📝 会议纪要

讨论要点

  1. 1. Q1 产品上线延期原因分析
  2. Q2 核心功能优先级排序
  3. 资源分配调整

✅ 决议事项

  • - [x] 确定 Q2 三大核心功能
  • [x] 批准额外 2 名开发人力
  • [x] 下周三前发布详细排期

📋 待办事项

负责人任务截止时间
张三完成 PRD 文档2026-03-18
李四
技术方案评审 | 2026-03-20 | | 王五 | 资源配置协调 | 2026-03-17 |

📄 完整转录(可折叠)


展开查看完整对话

[14:00] 张三:大家好,我们今天...
[14:05] 李四:关于延期,我觉得...
...

与其他技能集成

  • - social-publisher:将会议纪要直接整理成公众号/小红书文章
  • summarize:对长录音先提取关键信息,再生成摘要
  • wechat-formatter:将会议纪要快速格式化为公众号可发内容

技术细节

  • - 使用 OpenAI Whisper API 进行语音转文字
  • 可选集成 GPT 模型进行摘要和行动项提取
  • 支持中英文混合识别
  • 音频预处理:自动降噪、格式转换(通过 ffmpeg)
  • 输出 UTF-8 编码,支持中文排版

安装依赖

bash

系统依赖


apt install -y ffmpeg

Python 依赖(自动安装)

pip install openai>=1.0.0

许可证

MIT

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 audio-note-taker-1776077953 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 audio-note-taker-1776077953 技能

通过命令行安装

skillhub install audio-note-taker-1776077953

下载

⬇ 下载 audio-note-taker v1.0.1(免费)

文件大小: 5.97 KB | 发布时间: 2026-4-15 11:45

v1.0.1 最新 2026-4-15 11:45
audio-note-taker 1.0.1

- 重新优化和精简了功能说明与文档结构,突出会议、讲座、采访等场景应用
- 增强了说话人识别、摘要提取和行动项整理等高级功能参数说明
- 明确依赖需要 ffmpeg 和 openai>=1.0.0,完善环境变量说明
- 优化输出 Markdown 格式示例,提升易用性和结果可读性
- 更新描述和元数据,更准确反映实际功能及适用场景

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部