Browser Automation
Automate browser interactions using Stagehand CLI with Claude.
First: Environment Selection (Local vs Remote)
The skill automatically selects between local and remote browser environments:
- - If Browserbase API keys exist (BROWSERBASEAPIKEY and BROWSERBASEPROJECTID in .env file): Uses remote Browserbase environment
- If no Browserbase API keys: Falls back to local Chrome browser
- No user prompting: The selection happens automatically based on available configuration
Setup (First Time Only)
Check setup.json in this directory. If setupComplete: false:
CODEBLOCK0
Commands
All commands work identically in both modes:
CODEBLOCK1
Quick Example
CODEBLOCK2
Mode Comparison
| Feature | Local | Browserbase |
|---|
| Speed | Faster | Slightly slower |
| Setup |
Chrome required | API key required |
| Stealth mode | No | Yes |
| Proxy/CAPTCHA | No | Yes |
| Best for | Development | Production/scraping |
Best Practices
- 1. Always navigate first before interacting
- View screenshots after each command to verify
- Be specific in action descriptions
- Close browser when done
Troubleshooting
- - Chrome not found: Install Chrome or use Browserbase mode
- Action fails: Use
browser observe to discover available elements - Browserbase fails: Verify API key and project ID are set
For detailed examples, see EXAMPLES.md.
For API reference, see REFERENCE.md.
浏览器自动化
使用Stagehand CLI与Claude自动化浏览器交互。
第一步:环境选择(本地 vs 远程)
该技能会自动在本地和远程浏览器环境之间进行选择:
- - 如果存在Browserbase API密钥(.env文件中的BROWSERBASEAPIKEY和BROWSERBASEPROJECTID):使用远程Browserbase环境
- 如果没有Browserbase API密钥:回退到本地Chrome浏览器
- 无需用户提示:根据可用配置自动进行选择
设置(仅首次)
检查此目录中的setup.json。如果setupComplete: false:
bash
npm install # 安装依赖
npm link # 创建全局browser命令
命令
所有命令在两种模式下工作方式相同:
bash
browser navigate # 导航到URL
browser act # 自然语言操作
browser extract [{}] # 提取数据(可选模式)
browser observe # 发现元素
browser screenshot # 截图
browser close # 关闭浏览器
快速示例
bash
browser navigate https://example.com
browser act 点击登录按钮
browser extract 获取页面标题
browser close
模式对比
| 特性 | 本地模式 | Browserbase模式 |
|---|
| 速度 | 更快 | 稍慢 |
| 设置 |
需要Chrome | 需要API密钥 |
| 隐身模式 | 否 | 是 |
| 代理/CAPTCHA | 否 | 是 |
| 最佳用途 | 开发环境 | 生产环境/数据抓取 |
最佳实践
- 1. 始终先导航,再进行交互
- 查看截图,在每个命令后验证结果
- 描述要具体,在操作说明中
- 完成后关闭浏览器
故障排除
- - 未找到Chrome:安装Chrome或使用Browserbase模式
- 操作失败:使用browser observe发现可用元素
- Browserbase失败:验证API密钥和项目ID是否已设置
详细示例请参见EXAMPLES.md。
API参考请参见REFERENCE.md。