Google Free Media Generator
Skill สำหรับสร้างรูปภาพและวิดีโอ AI ฟรีผ่าน Google Gemini และ Google Flow โดยใช้ browser automation
🎯 เมื่อไหร่ควรใช้ Skill นี้
ใช้เมื่อผู้ใช้ต้องการ:
- - สร้างรูปภาพ AI สำหรับ cover, thumbnail, banner
- สร้างวิดีโอจากข้อความหรือรูปภาพ (text-to-video, image-to-video)
- ประหยัดค่า API (0 บาท vs 1-3 บาท/รูป ผ่าน API ปกติ)
- สร้างสื่อจำนวนมากโดยไม่กังวลเรื่องต้นทุน
⚠️ ข้อจำกัดที่ต้องรู้
- 1. Quota ฟรีจำกัด: Gemini ~100 รูป/วัน, Flow ~50 credits/วัน (อาจเปลี่ยนแปลง)
- ช้ากว่า API: ต้องเปิด browser และรอ UI load (5-10x ช้ากว่า)
- เสี่ยง UI เปลี่ยน: Google เปลี่ยนปุ่ม/ตำแหน่งบ่อย → อาจต้อง update skill
- Terms of Service: Automation อาจขัดกับ ToS ของ Google free tier
📋 ขั้นตอนการทำงาน
1. ตรวจสอบ Quota ก่อนเริ่ม
node scripts/quota_manager.mjs check
- - ดูว่าเหลือ quota เท่าไหร่
- แจ้งเตือนถ้าใกล้หมด
2. สร้างรูปภาพ (Gemini)
CODEBLOCK1
การทำงาน:
- 1. เปิด browser ไปยัง gemini.google.com
- Login (ถ้ายังไม่ได้ login)
- กดปุ่มสร้างรูป (Image generation)
- ส่ง prompt ที่ enhance แล้ว
- รอ generate และดึงรูป full resolution (=s0 trick)
- บันทึกลงไฟล์
3. สร้างวิดีโอ (Google Flow)
CODEBLOCK2
การทำงาน:
- 1. เปิด browser ไปยัง labs.google/flow
- เลือกโหมด (Text-to-Video หรือ Image-to-Video)
- ส่ง prompt หรืออัพโหลดรูป
- รอ generate
- ดาวน์โหลดวิดีโอ
🔧 Scripts
generate_image.mjs
สร้างรูปภาพผ่าน Google Gemini
Arguments:
- -
--prompt: คำอธิบายรูป (required) - INLINECODE1 : path ไฟล์ output (required)
- INLINECODE2 : style ของรูป (optional: realistic, artistic, minimalist)
- INLINECODE3 : ให้ AI enhance prompt อัตโนมัติ (default: true)
generate_video.mjs
สร้างวิดีโอผ่าน Google Flow (Veo 3.1)
Arguments:
- -
--prompt: คำอธิบายวิดีโอ (required) - INLINECODE5 : path ไฟล์ output (required)
- INLINECODE6 : โหมดการสร้าง (text-to-video, image-to-video)
- INLINECODE7 : path รูปต้นทาง (สำหรับ image-to-video)
- INLINECODE8 : ระยะเวลาวิดีโอ (5-10 วินาที)
quota_manager.mjs
จัดการและติดตาม quota การใช้งาน
Commands:
- -
check: ตรวจสอบ quota ที่เหลือ - INLINECODE10 : รีเซ็ต counter (เริ่มวันใหม่)
- INLINECODE11 : ดู log การใช้งาน
Config File: configs/quota.json
CODEBLOCK3
💡 เทคนิคสำคัญ
1. ดึงรูป Full Resolution
รูปบน Gemini แสดงที่ 1024px แต่สามารถดึง full resolution (1408x768) ได้โดยเปลี่ยน URL:
CODEBLOCK4
2. Session Persistence
- - Login ครั้งเดียวแล้วเก็บ cookie ไว้ใช้ต่อ
- ไม่ต้อง login ใหม่ทุกครั้งที่สร้างรูป
- ใช้ Puppeteer/Playwright session storage
3. Prompt Enhancement
ก่อนส่งให้ Gemini ควร enhance prompt ให้มี:
- - Lighting (soft lighting, dramatic lighting, golden hour)
- Composition (rule of thirds, centered, wide angle)
- Style (photorealistic, cinematic, minimalist, vibrant)
- Quality keywords (4K, ultra detailed, professional)
ตัวอย่าง:
CODEBLOCK5
📁 Storage Organization
ไฟล์ที่สร้างจะเก็บที่:
CODEBLOCK6
🔄 Fallback Strategy
ถ้า Google ใช้ไม่ได้ มีทางเลือกสำรอง:
- 1. Bing Image Creator (ฟรี)
- Leonardo.ai (ฟรี tier)
- Stable Diffusion Online
🚨 การแก้ปัญหา
Login ไม่ได้
- - ตรวจสอบว่า browser ไม่ใช่ headless mode
- ถ้าใช้ VPS ต้องตั้ง Xvfb เป็นจอเสมือน
- ลอง clear cookie แล้ว login ใหม่
UI เปลี่ยน/ปุ่มหาย
- - Update selector ใน scripts
- ตรวจสอบ Google เปลี่ยนตำแหน่งฟีเจอร์
Quota หมด
- - รอวันถัดไป (reset ตอน 00:00)
- ใช้ fallback services แทน
📝 ตัวอย่างการใช้งาน
CODEBLOCK7
Google Free Media Generator
通过浏览器自动化,使用Google Gemini和Google Flow免费生成AI图片和视频的技能
🎯 何时使用此技能
当用户需要时使用:
- - 为封面、缩略图、横幅创建AI图片
- 从文本或图片生成视频(文本转视频、图片转视频)
- 节省API费用(0泰铢 vs 通过常规API每张图片1-3泰铢)
- 无需担心成本地批量生成媒体内容
⚠️ 必须了解的局限性
- 1. 免费配额有限:Gemini约100张/天,Flow约50积分/天(可能变化)
- 比API慢:需要打开浏览器并等待UI加载(比API慢5-10倍)
- UI可能变化:Google频繁更改按钮/位置 → 可能需要更新技能
- 服务条款:自动化可能违反Google免费层的服务条款
📋 工作流程
1. 开始前检查配额
bash
node scripts/quota_manager.mjs check
2. 生成图片(Gemini)
bash
node scripts/generate_image.mjs --prompt 图片描述 --output /path/to/output.jpg
工作流程:
- 1. 打开浏览器访问gemini.google.com
- 登录(如果尚未登录)
- 点击生成图片按钮
- 发送已增强的提示词
- 等待生成并获取全分辨率图片(=s0技巧)
- 保存到文件
3. 生成视频(Google Flow)
bash
node scripts/generate_video.mjs --prompt 视频描述 --output /path/to/output.mp4
工作流程:
- 1. 打开浏览器访问labs.google/flow
- 选择模式(文本转视频或图片转视频)
- 发送提示词或上传图片
- 等待生成
- 下载视频
🔧 脚本
generate_image.mjs
通过Google Gemini生成图片
参数:
- - --prompt:图片描述(必填)
- --output:输出文件路径(必填)
- --style:图片风格(可选:写实、艺术、极简)
- --enhance:让AI自动增强提示词(默认:true)
generate_video.mjs
通过Google Flow生成视频(Veo 3.1)
参数:
- - --prompt:视频描述(必填)
- --output:输出文件路径(必填)
- --mode:生成模式(文本转视频、图片转视频)
- --image:源图片路径(用于图片转视频)
- --duration:视频时长(5-10秒)
quota_manager.mjs
管理和跟踪使用配额
命令:
- - check:检查剩余配额
- reset:重置计数器(新的一天开始)
- log:查看使用日志
配置文件: configs/quota.json
json
{
dailyLimits: {
images: 100,
videoCredits: 50
},
currentUsage: {
images: 0,
videoCredits: 0
},
lastReset: 2026-03-02T00:00:00+07:00
}
💡 重要技巧
1. 获取全分辨率图片
Gemini上的图片显示为1024px,但可以通过更改URL获取全分辨率(1408x768):
从:https://.../image=s1024
改为:https://.../image=s0
2. 会话持久化
- - 登录一次后保存cookie以供后续使用
- 无需每次生成图片时重新登录
- 使用Puppeteer/Playwright会话存储
3. 提示词增强
在发送给Gemini之前,应增强提示词,包含:
- - 光照(柔和光照、戏剧性光照、黄金时刻)
- 构图(三分法、居中、广角)
- 风格(照片写实、电影感、极简、鲜艳)
- 质量关键词(4K、超精细、专业)
示例:
输入:戴眼镜的猫
增强后:一张照片写实风格的可爱猫咪肖像,戴着圆框眼镜,
柔和的工作室灯光,居中构图,专业摄影,
4K超精细,暖色调
📁 存储组织
生成的文件将存储在:
/mnt/storage/adaprojects/aimedia/
├── images/YYYY-MM/
├── videos/YYYY-MM/
└── metadata.json
🔄 备用方案
如果Google不可用,有备用选择:
- 1. Bing Image Creator(免费)
- Leonardo.ai(免费层级)
- Stable Diffusion Online
🚨 问题解决
无法登录
- - 检查浏览器是否不是无头模式
- 如果使用VPS,需要设置Xvfb作为虚拟显示器
- 尝试清除cookie后重新登录
UI变化/按钮消失
- - 更新脚本中的选择器
- 检查Google是否更改了功能位置
配额用完
📝 使用示例
bash
生成帖子封面
node scripts/generate_image.mjs \
--prompt AI工作流程图,未来主义风格,蓝紫色渐变 \
--output /mnt/storage/ada
projects/aimedia/images/2026-03/cover_001.jpg \
--style artistic
从文本生成视频
node scripts/generate_video.mjs \
--prompt 日落时分的海浪,电影感慢动作 \
--output /mnt/storage/ada
projects/aimedia/videos/2026-03/sunset.mp4 \
--duration 8
检查配额
node scripts/quota_manager.mjs check