返回顶部
w

windows-rpaWindows RPA

|

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
819
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

windows-rpa

Windows RPA 自动化

这个技能让 OpenClaw 能够直接操作 Windows 桌面,包括鼠标、键盘、窗口和应用程序。

核心能力

1. 鼠标操作

移动鼠标到坐标 (x, y)

desktopmousemove(x=500, y=300)

鼠标点击

desktopmouseclick(x=500, y=300, button=left, clicks=1)

鼠标拖拽

desktopmousedrag(startx=100, starty=100, endx=500, endy=500)

鼠标滚轮

desktopmousescroll(clicks=3) # 正数向上,负数向下

获取鼠标位置

desktopmouseposition()

2. 键盘操作

输入文本

desktopkeyboardtype(text=Hello World)

按键

desktopkeyboardpress(key=enter) desktopkeyboardpress(key=tab) desktopkeyboardpress(key=escape)

组合键

desktopkeyboardhotkey(keys=[ctrl, c]) # 复制 desktopkeyboardhotkey(keys=[ctrl, v]) # 粘贴 desktopkeyboardhotkey(keys=[ctrl, a]) # 全选 desktopkeyboardhotkey(keys=[alt, f4]) # 关闭窗口

3. 屏幕操作

截取全屏

desktop_screenshot()

截取指定区域

desktop_screenshot(region={x: 0, y: 0, width: 800, height: 600})

获取屏幕尺寸

desktopscreensize()

图像定位(在屏幕上找图)

desktoplocateonscreen(imagepath=button.png, confidence=0.9)

4. 窗口管理

列出所有窗口

desktopwindowlist()

激活窗口

desktopwindowactivate(title_pattern=记事本)

查找窗口

desktopfindwindow(title_contains=Chrome)

点击窗口控件

desktopclickwindow( title_contains=记事本, control_type=Edit, action=set_text, control_name=Hello )

5. 应用程序启动

启动常用应用(支持别名)

desktoplaunchapp(app_name=notepad) desktoplaunchapp(app_name=chrome) desktoplaunchapp(app_name=excel) desktoplaunchapp(app_name=word)

启动自定义程序

desktoplaunchapp(app_name=C:\\Program Files\\MyApp\\app.exe)

带参数启动

desktoplaunchapp(app_name=chrome, args=--incognito)

6. Shell 命令

PowerShell 命令

desktop_shell(command=Get-Process | Select-Object -First 5)

CMD 命令

desktopshell(command=dir C:\\, shelltype=cmd)

7. 剪贴板

获取剪贴板内容

desktopclipboardget()

设置剪贴板内容

desktopclipboardset(text=要复制的内容)

8. 桌面状态

获取完整桌面状态(鼠标位置、活动窗口、截图等)

desktopgetstate(capture_screenshot=True)

检查环境

desktop_check()

使用示例

示例 1: 自动填写表单

1. 启动应用程序

desktoplaunchapp(app_name=notepad)

2. 等待窗口出现

time.sleep(1)

3. 输入内容

desktopkeyboardtype(text=这是一段自动输入的文字)

4. 保存文件

desktopkeyboardhotkey(keys=[ctrl, s]) desktopkeyboardtype(text=auto_saved.txt) desktopkeyboardpress(key=enter)

示例 2: 图像识别点击

1. 先截图保存按钮图像

desktopscreenshot(savepath=screen.png)

2. 用户手动截取按钮区域保存为 button.png

3. 在屏幕上定位并点击

result = desktoplocateonscreen(imagepath=button.png, confidence=0.9)

如果找到,会返回中心坐标,然后点击

示例 3: 操作特定窗口

1. 查找目标窗口

windows = desktopfindwindow(title_contains=计算器)

2. 激活窗口

desktopwindowactivate(title_pattern=计算器)

3. 点击窗口中的按钮

desktopclickwindow( title_contains=计算器, control_type=Button, control_name=1 )

安全注意事项

权限要求

本技能需要以下系统权限:
  • - 屏幕捕获: 用于截图功能
  • 键盘输入: 用于文本输入和快捷键
  • 鼠标输入: 用于点击、移动等操作
  • 剪贴板访问: 用于读写剪贴板
  • Shell 执行: 用于运行命令(可选)

敏感操作

以下操作建议开启用户确认:
  • - desktopshell - 执行任意 Shell 命令
  • desktopclipboardget - 读取剪贴板(可能包含敏感信息)
  • desktopscreenshot - 屏幕截图(可能包含隐私内容)

用户批准机制

建议在 OpenClaw 配置中启用审批模式:
  1. 1. 敏感操作执行前会请求用户确认
  2. 用户可以选择批准、拒绝或修改参数
  3. 可设置白名单跳过审批

沙箱支持

  • - 建议在不包含敏感数据的测试环境中首次运行
  • Shell 命令可在受限环境中执行
  • 截图功能可限制截取区域

安全最佳实践

  1. 1. 审批模式: 建议开启命令审批,每次执行前确认
  2. 坐标依赖: 屏幕坐标可能因分辨率不同而变化,优先使用图像识别
  3. 窗口标题: 使用模糊匹配而非精确匹配,提高鲁棒性
  4. 超时处理: 复杂操作应设置合理的等待时间
  5. 最小权限: 仅请求必要的权限,避免过度授权

后端选择

系统支持两种后端:

  • - pyautogui (默认): 纯坐标操作,简单可靠
  • pywinauto (备用): Windows UI Automation,支持控件级操作

切换后端:

desktopsetbackend(backend=pywinauto)

错误处理

所有操作返回 JSON 格式结果:

json
{
status: ok, // 或 error
message: 操作描述,
// 其他字段...
}

建议检查 status 字段确认操作是否成功。

常见问题

问: 为什么鼠标移动不准确?
答: 可能是分辨率缩放问题,尝试使用 desktopscreensize() 检查实际分辨率。

问: 图像识别找不到目标?
答: 降低 confidence 参数值,或确保图像与屏幕显示一致。

问: 中文输入乱码?
答: 确保系统编码正确,或使用剪贴板方式输入。

问: pywinauto 无法找到控件?
答: 部分应用使用自定义 UI,无法被 UI Automation 识别,改用坐标或图像方式。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 windows-rpa-1776178631 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 windows-rpa-1776178631 技能

通过命令行安装

skillhub install windows-rpa-1776178631

下载

⬇ 下载 windows-rpa v1.0.1(免费)

文件大小: 11.56 KB | 发布时间: 2026-4-15 10:33

v1.0.1 最新 2026-4-15 10:33
添加 os, security, implementation 元数据;扩展安全注意事项版本升级到 1.1.0;添加 security, implementation 字段;标...添加 shell, get_state, window_activate, find_window, `run_ap...新增安全策略文档
主要改进解决安全扫描问题:

1. ✅ 操作系统限制 - 在 YAML frontmatter 和 skill.json 中明确声明 os: ["win32"]
2. ✅ 安装规范 - install 字段和 implementation 字段完整
3. ✅ 实现代码 - 明确指向 scripts/rpa.py
4. ✅ 敏感操作标记 - security.sensitive_operations 列出高风险操作
5. ✅ 用户批准机制 - security.user_approval: recommended
6. ✅ 沙箱支持 - security.sandbox: supported

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部