返回顶部
s

speech-notes语音笔记

|

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
248
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

speech-notes

演讲纪要整理 Skill

将录音转写为高质量的结构化演讲纪要。整个流程分两步:转写整理

第一步:转写

音频预处理

  • - 用 ffprobe 获取时长、采样率等信息
  • 超过 5 分钟的录音:用 ffmpeg -f segment -segment_time 300 分段(每段 5 分钟)
  • 每段压缩:ffmpeg -ar 16000 -ac 1 -b:a 32k(降低体积,提高 API 成功率)

转写方式(优先级)

  1. 1. 飞书 STT:如有 filekey,调用 scripts/speech-to-text.sh --feishu-file-key
  2. 分段 Gemini:写 Python 脚本,逐段调用 generativelanguage.googleapis.com,用 inlinedata 传 base64 音频
  3. 分段 Qwen:DashScope qwen-omni-turbo,同上方式

转写 Prompt

请精确转写这段中文语音的全部内容,保留原始表述和口语化表达,不要遗漏任何内容。只输出转写文字。

注意事项

  • - Gemini 转写可能繁简混杂(同一段落出现繁体和简体),整理时需统一
  • 保存原始转写到本地文件备查

第二步:整理

文档结构(必须包含)

[标题:有观点、有张力,不要纯描述]

整理自 [谁] 于 [日期] 在 [场合] 的讲话要点 ← 引用容器,居中对齐

一、[主题板块]

[三级标题]

正文段落 / bullet 列表

--- ← 分隔线:仅在 H2 之间使用

二、[主题板块]

...

核心原则

1. 头部三要素

  • - 谁说的:讲话人姓名和职位
  • 什么场合:会议名称、日期
  • 标题:提炼核心观点,不要只写「XX会议纪要」
  • 头部归属行放在引用容器(飞书 quote_container)中,居中对齐

2. 第一人称视角

  • - 保留讲话人的第一人称(「我」「我们」),但精简多余的「我」
  • 不要改成第三人称(「讲话者认为」)

3. 保留原味,去除口语

  • - 保留:讲话人的力度表达(「打脸」「浪费生命」「给它打工」)、场景中的人物称呼(群里叫「铎神」就写「铎神」,不要改成全名)
  • 去除:「呃」「就是说」「怎么讲」等填充词、重复的句子、碎碎念式的过渡

4. 不加 AI 痕迹

  • - 不要在文档底部写「本文由 AI 转写整理」
  • 不要加「原始录音约 XX 分钟」
  • 交付的是一份正式纪要,不是 AI 产物

⭐ 排版格式规范(最重要的部分)

这些规则来自对高质量终稿的 block 级逆向分析。排版直接决定文档的可读性。

标题层级严格分工

层级飞书 block_type用途数量
H2 (##)heading2大板块(一、二、三…)3-5 个
H3 (###)
heading3 | 小节主题 | 每个 H2 下 2-4 个 | | 加粗文本段 | text (bold) | 子话题标签(不是标题!) | 按需 |

关键区分

  • - 「第一,「活人感」」「第二,跨会话记忆」→ 加粗文本段,不是 H3/H4
  • 「关于人才输出」→ 加粗文本段,不是 H3
  • 只有独立的小节主题才用 H3,如「三个让人印象深刻的瞬间」「时间线与调整计划」
  • 规则:如果一个子话题只有 2-3 个 bullet,用加粗文本段;如果有完整的段落+bullet 结构,才用 H3

段落文本 vs Bullet 的选择(核心)

这是 AI 整理纪要最容易犯的错。不是所有内容都该变成 bullet。

用段落文本(text block)的场景:

  • - 开场白 / 场景铺垫:「在座的各位主管,对大模型的理解,在全行业都处于前沿」
  • 过渡引导句:「原因主要有:」「这是一个尚未完全确认的类比,但逻辑上是成立的:」
  • 核心结论(加粗):「核心认知转变:过去认为有一个强模型就够了,今天看来,Scaffold 同样重要。」
  • 收束/感召句:「各位,我们有幸生于这个年代」「要把我们的生命投入到这一轮浪潮中」
  • 已经足够有力的单句话,不需要拆成 bullet

用 Bullet 的场景:

  • - 并列论据/原因(「模型能力跃升」「框架飞速迭代」)
  • 叙事序列(先发生A → 然后B → 最后C)
  • 对比/映射(「过去:…」「未来:…」)
  • 具体事例的细节展开

判断公式:这句话是「引出观点」还是「支撑观点」?引出 = 段落,支撑 = bullet。

Bullet 的嵌套与精炼

嵌套规则:

  • - 最多 3 层(一级 bullet → 二级 sub-bullet → 三级 sub-sub-bullet)
  • 一级 bullet = 论点/事件主干
  • 二级 sub-bullet = 证据/细节/对话
  • 三级仅在必要时使用(如飞轮链条:用户→问题→修复→PR→进化→更多用户)

精炼规则:

  • - Bullet 前半加粗 + 后半普通:「范式变了,当前的组织必然不高效——无论工作流还是人员配置…」
  • 加粗部分是核心论点(可以只扫加粗就读懂全文),后半是解释/证据
  • 每个 bullet 控制在 1-2 行,超过就该拆成子 bullet
  • 对比用「前缀:内容」格式:「过去:给业务部门交付模型」「未来:Model + API + Scaffold 的体系交付」

引用块(Quote Block)的使用

  • - 整篇文档只用 1-2 个 引用块,用于最有冲击力的原话
  • 如:「今天是在跟时间赛跑。慢一天,能输出的机会就少一点。」
  • 飞书引用块可加背景色(background_color: 4 = 绿色背景)增强视觉效果
  • 不要 把所有直接引语都做成引用块——太多就失去了强调效果

表格的使用

  • - 结构化数据(时间线、对照表)用飞书表格,不用 bullet 模拟
  • 表头用 H4 加粗,数据行用普通文本
  • 适合场景:里程碑/时间线、功能对比、角色分工

呼吸感(空行与分隔线)

  • - H3 后 空一行再开始内容(如果下面紧跟加粗标签)
  • 加粗标签后 直接跟 bullet(不空行)
  • bullet 组与下一个加粗标签之间 空一行
  • H2 之间 用分隔线 --- + 空行(文档仅在 H2 之间有分隔线,其他地方不用)
  • 结语段落之间 空一行(每句话独立成段,增强节奏感)

加粗的层次

加粗不是随便用的,它有明确的层次:

  1. 1. 整句加粗(最强调):核心结论、感召句
- 「核心认知转变:过去认为有一个强模型就够了,今天看来,Scaffold 同样重要。」 - 「要把我们的生命投入到这一轮浪潮中,做出真正能改变世界的事情!
  1. 2. Bullet 前半加粗(论点突出):论据 bullet 的核心部分
- 「快 = 保人——调整得快,才有可能把人才留在小米体系内」 - 「模型能力跃升——核心是指令遵循
  1. 3. 关键词加粗(重点标记):人名、数字、专有名词
- 「Model + API + Scaffold 的体系交付」 - 「提出了一个新概念:「体感」
  1. 4. 子话题标签(结构引导):不用标题,用加粗文本段落
- 「第一,「活人感」」 - 「关于人才输出」 - 「调整分两步:

常见错误(避免)

错误正确做法
标题写「XX会议纪要」提炼核心观点作为标题
不交代讲话人和场合
头部引用容器写明三要素 | | 把人物称呼改成正式全名 | 保留场景中的自然称呼 | | 所有内容都用 bullet | 开场、结论、感召用段落文本 | | 所有子话题都用 H3 | 轻量子话题用加粗文本

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 speech-notes-1776195138 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 speech-notes-1776195138 技能

通过命令行安装

skillhub install speech-notes-1776195138

下载

⬇ 下载 speech-notes v1.0.0(免费)

文件大小: 5.47 KB | 发布时间: 2026-4-15 12:09

v1.0.0 最新 2026-4-15 12:09
- Initial release of speech-notes skill.
- Converts audio recordings or existing transcripts into structured meeting minutes.
- Supports audio preprocessing, segmentation, and transcription using Feishu STT, Gemini, or Qwen.
- Delivers high-quality, well-formatted minutes following detailed structure and formatting guidelines.
- Ensures retention of original speaker's style and removes unnecessary filler for clarity.
- Outputs documents ready for use in Feishu, following best practices for readability and formal presentation.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部