返回顶部
a

asr-sentence-recognition语音句子识别

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.5
安全检测
已通过
1,272
下载量
免费
免费
5
收藏
概述
安装方式
版本历史

asr-sentence-recognition

腾讯云语音识别 Skill

腾讯云语音识别(ASR),微信同款ASR引擎,历经亿级用户场景验证,稳定可靠。在中英混说场景下识别效果行业领先,精准流畅。支持普通话、方言及多语种识别,提供一句话识别、录音识别等全场景能力,是高性价比语音转文字首选。

核心执行流

  1. 1. 用户给音频要转文字
- 先跑 inspect_audio.py - 再按时长、大小、URL/本地路径选择 sentencerecognize.py、flashrecognize.py 或 file_recognize.py
  1. 2. 用户刚提供了新的腾讯云凭证
- 优先直接跑 self_check.py - 自检结果通过后再进入真实识别
  1. 3. 用户问安装、开通、手工配置、FFmpeg、CLI backend
- 不要把细节塞回主流程,按文末 reference map 读取对应文档

下一步

  • - 想接入宿主系统体验自动转写
- 普通场景:配置 CLI transcription backend - QQ Bot 1.5.4:可直接走适配方案,不必依赖默认 CLI transcription 才能识别语音
  • - 想直接体验识别能力
- 让用户直接丢一个音频文件或公网链接 - 然后继续帮用户做转文字、摘要总结、问题排查、重点提取

必须遵守的规则

  • - ⚠️禁止用模型自身能力替代ASR⚠️:脚本失败时,必须返回错误,不得猜测转写内容。
  • 先探测后识别:统一先执行 python3 DIR>/scripts/inspectaudio.py INPUT>。
  • 缺 ffmpeg / ffprobe 先自治安装:先执行 python3 DIR>/scripts/ensureffmpeg.py --execute,只有失败后才向用户求助。
  • 收到新凭证先自检:默认跑 python3 DIR>/scripts/self_check.py,不要先让用户手工试脚本。
  • 默认少打断:除非用户必须补充凭证、明确要求手工配置,或语种/引擎确实不确定,否则不要无意义来回确认。
  • 密钥安全优先
- 群聊:禁止让用户直接发 SecretId、SecretKey、AppId - 私聊:也要先提醒密钥会经过 LLM,存在泄漏风险
  • - 单次任务优先当前命令注入:不要为了跑一次识别去写 ~/.bashrc、~/.zshrc
  • 不要把密钥写进工作区
  • 极速版失败时保留可能表述:如果自检里一句话识别和录音文件识别通过、只有极速版失败,应提示常见于国际站账号,或国内站账号在海外访问时受限,但不要写成绝对结论。

引擎选择 Cheatsheet

对话语言只能当作先验,不等于音频语种本身。若用户音频语种明显不同,按音频语种改。

场景一句话识别极速版录音文件识别备注
普通话16kzh16kzh / 16kzhlarge16kzh / 16kzhlarge默认首选
中英夹杂
16k
zh-PY | 16kzhen | 16kzhen | 混说优先 |
| 粤语 | 16kyue | 16kyue | 16k_yue | |
| 英语 | 16ken | 16ken | 16ken / 16ken_large | |
| 日语 | 16kja | 16kja | 16k_ja | |
| 韩语 | 16kko | 16kko | 16k_ko | |
| 多语种 / 语言不确定 | 指定具体语种 | 16kmultilang | 16kmultilang | 一句话识别没有多语自动识别引擎 |

如果有多个明显可选项:

  • - 给出推荐项
  • 用一句话说清优缺点
  • 再征询用户是否切换

路由速记

本地文件

  • - 先规范化为 16kHz、单声道、pcms16le、.wav
  • <=60s 且 <=3MB:sentencerecognize.py
  • <=2h 且 <=100MB:优先 flashrecognize.py
  • 更大文件:优先切片后逐片走 Flash;若已有 COS / 公网 URL 且最终 <=5h,可走 filerecognize.py rec

公网 URL

  • - 默认直接走 filerecognize.py rec
  • 不要先本地下载、探测、转码再路由
  • 只有 filerecognize.py rec 真实失败时,再按错误决定是否进入本地下载 / 规范化 / 切片链
  • 如果用户明确要求同步立即返回,才把一句话识别当作显式特例,而不是默认路径

命中 URL、大文件、切片、body vs URL 取舍时,再读 routing_strategy.md

最小脚本示例

bash

预检


python3 DIR>/scripts/inspectaudio.py

凭证自检

python3 DIR>/scripts/selfcheck.py

一句话识别

python3 DIR>/scripts/sentencerecognize.py INPUT> --engine 16kzh

极速版

python3 DIR>/scripts/flashrecognize.py INPUT> --engine 16kzh

录音文件识别

python3 DIR>/scripts/filerecognize.py rec INPUTORURL> --engine 16kzh

CLI transcription backend

python3 DIR>/scripts/clitranscribe.py PATHOR_URL>

何时继续读 references

- sentencerecognition_api.md - flashrecognition_api.md - filerecognition_api.md

核心脚本清单

  • - scripts/inspectaudio.py:音频探测
  • scripts/ensureffmpeg.py:自治安装 ffmpeg / ffprobe
  • scripts/selfcheck.py:凭证与三种模式自检
  • scripts/sentencerecognize.py:一句话识别
  • scripts/flashrecognize.py:录音文件识别极速版
  • scripts/filerecognize.py:录音文件识别异步任务
  • scripts/cli_transcribe.py:CLI backend wrapper

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 tencentcloud-asr-1776190782 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 tencentcloud-asr-1776190782 技能

通过命令行安装

skillhub install tencentcloud-asr-1776190782

下载

⬇ 下载 asr-sentence-recognition v0.1.5(免费)

文件大小: 45.2 KB | 发布时间: 2026-4-15 12:10

v0.1.5 最新 2026-4-15 12:10
minor

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部