Corespeed Art — Multi-Model AI Media via fal.ai
Auth: Set FAL_KEY with your fal.ai API key (get one at https://fal.ai/dashboard/keys).
Workflow
- 1. Pick a model from the tables below
- Read its reference file to get the exact endpoint and parameters
- Run the command with the endpoint and JSON parameters
Usage
CODEBLOCK0
- -
ENDPOINT — the fal.ai model path from the reference file (e.g. fal-ai/nano-banana-2) - INLINECODE3 — model parameters as JSON object
- INLINECODE4 — output filename
- INLINECODE5 — input file(s) to upload (repeat for multiple), auto-injected as
image_url/image_urls/start_image_url/ INLINECODE9 - INLINECODE10 — audio input file (for lipsync)
Image Generation
| Model | Best For | Reference |
|---|
| Nano Banana 2 | Pro quality, web search, thinking | Read nanobanana.md |
| FLUX 2 Pro |
Photorealistic, zero-config | Read
flux.md |
| FLUX Schnell | ⚡ Fastest iteration | Read
flux.md |
| FLUX Pro v1.1 | Accelerated, commercial use | Read
flux.md |
| FLUX.1 Dev | 12B params, fine-tuning friendly | Read
flux.md |
| GPT Image 1.5 | Transparent bg, instruction following | Read
gpt.md |
| Qwen Image 2 Pro | Chinese+English, typography, native 2K | Read
qwen.md |
| Recraft V4 Pro | Design/marketing, color control | Read
recraft.md |
| Seedream 5 Lite | Multi-image editing, reasoning | Read
seedream.md |
Video Generation
| Model | Best For | Reference |
|---|
| Kling v3 Pro I2V | Best I2V, multi-shot, audio, 3–15s | Read kling.md |
| Sora 2 T2V |
Long video up to 20s, characters | Read
sora.md |
| Sora 2 I2V | Image→video with Sora | Read
sora.md |
| Veo 3.1 T2V | Cinematic + native audio/dialogue | Read
veo.md |
| Veo 3.1 I2V | Image→video with audio | Read
veo.md |
| LTX 2.3 T2V Fast | ⚡ Fast, up to 2160p/20s, open source | Read
ltx.md |
| LTX 2.3 I2V | Image→video, start+end frame | Read
ltx.md |
| Pixverse v5 I2V | Anime, 3D, clay, cyberpunk styles | Read
pixverse.md |
Audio / TTS
| Model | Best For | Reference |
|---|
| MiniMax Speech-02 HD | 30+ languages, loudness normalization | Read minimax-speech.md |
Music & Sound Effects
Utilities
| Tool | Best For | Reference |
|---|
| Topaz Upscale | AI image/video upscale 2x–4x | Read topaz.md |
| BRIA RMBG |
Professional background removal | Read
bria-rmbg.md |
| Sync Lipsync | Audio-driven lip sync on video | Read
sync-lipsync.md |
Notes
- - No manual Python setup required. The script uses PEP 723 inline metadata.
uv run automatically creates an isolated virtual environment and installs the fal-client dependency on first run. - fal.ai uses a queue system — the script polls until generation completes.
- Video generation can take 30s–3min.
- Use timestamps in filenames:
yyyy-mm-dd-hh-mm-ss-name.ext. - Script prints
MEDIA: line for OpenClaw to auto-attach. - Do not read generated media back; report the saved path only.
Support
Built by Corespeed. If you need help or run into issues:
Corespeed Art — 通过 fal.ai 实现的多模型 AI 媒体
认证:使用您的 fal.ai API 密钥设置 FAL_KEY(可在 https://fal.ai/dashboard/keys 获取)。
工作流程
- 1. 从下方表格中选择一个模型
- 阅读其参考文件以获取确切的端点和参数
- 使用端点和 JSON 参数运行命令
使用方法
bash
uv run {baseDir}/scripts/fal.py ENDPOINT --json {param:value} -f output.ext [-i input.ext]
- - ENDPOINT — 参考文件中的 fal.ai 模型路径(例如 fal-ai/nano-banana-2)
- --json — 以 JSON 对象形式提供的模型参数
- -f — 输出文件名
- -i — 要上传的输入文件(可重复使用多个),自动注入为 imageurl/imageurls/startimageurl/video_url
- --audio — 音频输入文件(用于唇形同步)
图像生成
照片级真实感、零配置 | 阅读
flux.md |
| FLUX Schnell | ⚡ 最快迭代 | 阅读
flux.md |
| FLUX Pro v1.1 | 加速、商业用途 | 阅读
flux.md |
| FLUX.1 Dev | 120亿参数、易于微调 | 阅读
flux.md |
| GPT Image 1.5 | 透明背景、指令跟随 | 阅读
gpt.md |
| Qwen Image 2 Pro | 中英文、排版、原生2K | 阅读
qwen.md |
| Recraft V4 Pro | 设计/营销、色彩控制 | 阅读
recraft.md |
| Seedream 5 Lite | 多图像编辑、推理 | 阅读
seedream.md |
视频生成
| 模型 | 最佳用途 | 参考 |
|---|
| Kling v3 Pro I2V | 最佳图生视频、多镜头、音频、3–15秒 | 阅读 kling.md |
| Sora 2 T2V |
最长20秒长视频、角色 | 阅读
sora.md |
| Sora 2 I2V | 使用Sora进行图像→视频 | 阅读
sora.md |
| Veo 3.1 T2V | 电影感 + 原生音频/对话 | 阅读
veo.md |
| Veo 3.1 I2V | 图像→视频带音频 | 阅读
veo.md |
| LTX 2.3 T2V Fast | ⚡ 快速、最高2160p/20秒、开源 | 阅读
ltx.md |
| LTX 2.3 I2V | 图像→视频、起始+结束帧 | 阅读
ltx.md |
| Pixverse v5 I2V | 动漫、3D、黏土、赛博朋克风格 | 阅读
pixverse.md |
音频 / 文本转语音
音乐与音效
实用工具
| 工具 | 最佳用途 | 参考 |
|---|
| Topaz Upscale | AI图像/视频2倍–4倍放大 | 阅读 topaz.md |
| BRIA RMBG |
专业背景去除 | 阅读
bria-rmbg.md |
| Sync Lipsync | 音频驱动的视频唇形同步 | 阅读
sync-lipsync.md |
注意事项
- - 无需手动设置 Python。 该脚本使用 PEP 723 内联元数据。uv run 会在首次运行时自动创建隔离的虚拟环境并安装 fal-client 依赖。
- fal.ai 使用队列系统——脚本会轮询直到生成完成。
- 视频生成可能需要30秒到3分钟。
- 在文件名中使用时间戳:yyyy-mm-dd-hh-mm-ss-name.ext。
- 脚本会打印 MEDIA: 行供 OpenClaw 自动附加。
- 不要回读已生成的媒体;仅报告保存路径。
支持
由 Corespeed 构建。如果您需要帮助或遇到问题: