飞书文档扩展工具,提供图片下载和 OCR 识别功能。需要配合内置 feishu 插件使用。
飞书文档扩展工具,提供图片下载和 OCR 识别功能。
| 功能 | 说明 |
|---|---|
| getimage | 获取飞书文档中图片的下载 URL |
| imageocr |
bash
本技能需要修改 OpenClaw 内置的 feishu 插件:
文件路径: /usr/local/lib/node_modules/openclaw/extensions/feishu/src/doc-schema.ts
在 FeishuDocSchema 的 Union 类型末尾添加:
typescript
// Image download
Type.Object({
action: Type.Literal(get_image),
image_token: Type.String({ description: Image token (from block image.token) }),
}),
文件路径: /usr/local/lib/node_modules/openclaw/extensions/feishu/src/docx.ts
typescript
async function getImage(client: Lark.Client, imageToken: string) {
const domain = client.domain ?? https://open.feishu.cn;
const token = await client.tokenManager.getTenantAccessToken();
const res = await client.httpInstance.get<{ code?: number; data?: { image_url?: string } }>(
${domain}/open-apis/image/v4/get,
{
params: { image_token: imageToken },
headers: { Authorization: Bearer ${token} },
},
);
if (res.data?.code !== 0 && res.data?.code !== undefined) {
throw new Error(Failed to get image: ${res.data});
}
return {
imageurl: res.data?.data?.imageurl,
image_token: imageToken,
};
}
typescript
case get_image:
return json(await getImage(client, p.image_token));
bash
openclaw gateway restart
使用 feishudoc 工具的 listblocks 获取文档中的图片 block:
json
{
action: list_blocks,
doc_token: 文档Token
}
从返回结果中获取图片的 token(在 block.image.token 中)。
json
{
action: get_image,
image_token: 图片Token
}
返回:
json
{
image_url: https://xxx...,
image_token: 图片Token
}
获取图片 URL 后,可以用浏览器打开并截图,然后用 tesseract 识别:
bash
tesseract /path/to/screenshot.jpg - -l chi_sim
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 feishu-doc-extended-1776116652 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 feishu-doc-extended-1776116652 技能
skillhub install feishu-doc-extended-1776116652
文件大小: 7.53 KB | 发布时间: 2026-4-15 12:42