Google Free Media Generator

Skill สำหรับสร้างรูปภาพและวิดีโอ AI ฟรีผ่าน Google Gemini และ Google Flow โดยใช้ browser automation

🎯 เมื่อไหร่ควรใช้ Skill นี้

ใช้เมื่อผู้ใช้ต้องการ:

- สร้างรูปภาพ AI สำหรับ cover, thumbnail, banner
สร้างวิดีโอจากข้อความหรือรูปภาพ (text-to-video, image-to-video)
ประหยัดค่า API (0 บาท vs 1-3 บาท/รูป ผ่าน API ปกติ)
สร้างสื่อจำนวนมากโดยไม่กังวลเรื่องต้นทุน

⚠️ ข้อจำกัดที่ต้องรู้

1. Quota ฟรีจำกัด: Gemini ~100 รูป/วัน, Flow ~50 credits/วัน (อาจเปลี่ยนแปลง)
ช้ากว่า API: ต้องเปิด browser และรอ UI load (5-10x ช้ากว่า)
เสี่ยง UI เปลี่ยน: Google เปลี่ยนปุ่ม/ตำแหน่งบ่อย → อาจต้อง update skill
Terms of Service: Automation อาจขัดกับ ToS ของ Google free tier

📋 ขั้นตอนการทำงาน

1. ตรวจสอบ Quota ก่อนเริ่ม

node scripts/quota_manager.mjs check

- ดูว่าเหลือ quota เท่าไหร่
แจ้งเตือนถ้าใกล้หมด

2. สร้างรูปภาพ (Gemini)

CODEBLOCK1

การทำงาน:

1. เปิด browser ไปยัง gemini.google.com
Login (ถ้ายังไม่ได้ login)
กดปุ่มสร้างรูป (Image generation)
ส่ง prompt ที่ enhance แล้ว
รอ generate และดึงรูป full resolution (=s0 trick)
บันทึกลงไฟล์

3. สร้างวิดีโอ (Google Flow)

CODEBLOCK2

การทำงาน:

1. เปิด browser ไปยัง labs.google/flow
เลือกโหมด (Text-to-Video หรือ Image-to-Video)
ส่ง prompt หรืออัพโหลดรูป
รอ generate
ดาวน์โหลดวิดีโอ

🔧 Scripts

generate_image.mjs

สร้างรูปภาพผ่าน Google Gemini

Arguments:

- --prompt: คำอธิบายรูป (required)
INLINECODE1: path ไฟล์ output (required)
INLINECODE2: style ของรูป (optional: realistic, artistic, minimalist)
INLINECODE3: ให้ AI enhance prompt อัตโนมัติ (default: true)

generate_video.mjs

สร้างวิดีโอผ่าน Google Flow (Veo 3.1)

Arguments:

- --prompt: คำอธิบายวิดีโอ (required)
INLINECODE5: path ไฟล์ output (required)
INLINECODE6: โหมดการสร้าง (text-to-video, image-to-video)
INLINECODE7: path รูปต้นทาง (สำหรับ image-to-video)
INLINECODE8: ระยะเวลาวิดีโอ (5-10 วินาที)

quota_manager.mjs

จัดการและติดตาม quota การใช้งาน

Commands:

- check: ตรวจสอบ quota ที่เหลือ
INLINECODE10: รีเซ็ต counter (เริ่มวันใหม่)
INLINECODE11: ดู log การใช้งาน

Config File: configs/quota.json
CODEBLOCK3

💡 เทคนิคสำคัญ

1. ดึงรูป Full Resolution

รูปบน Gemini แสดงที่ 1024px แต่สามารถดึง full resolution (1408x768) ได้โดยเปลี่ยน URL: CODEBLOCK4

2. Session Persistence

- Login ครั้งเดียวแล้วเก็บ cookie ไว้ใช้ต่อ
ไม่ต้อง login ใหม่ทุกครั้งที่สร้างรูป
ใช้ Puppeteer/Playwright session storage

3. Prompt Enhancement

ก่อนส่งให้ Gemini ควร enhance prompt ให้มี:

- Lighting (soft lighting, dramatic lighting, golden hour)
Composition (rule of thirds, centered, wide angle)
Style (photorealistic, cinematic, minimalist, vibrant)
Quality keywords (4K, ultra detailed, professional)

ตัวอย่าง:
CODEBLOCK5

📁 Storage Organization

ไฟล์ที่สร้างจะเก็บที่:
CODEBLOCK6

🔄 Fallback Strategy

ถ้า Google ใช้ไม่ได้ มีทางเลือกสำรอง:

1. Bing Image Creator (ฟรี)
Leonardo.ai (ฟรี tier)
Stable Diffusion Online

🚨 การแก้ปัญหา

Login ไม่ได้

- ตรวจสอบว่า browser ไม่ใช่ headless mode
ถ้าใช้ VPS ต้องตั้ง Xvfb เป็นจอเสมือน
ลอง clear cookie แล้ว login ใหม่

UI เปลี่ยน/ปุ่มหาย

- Update selector ใน scripts
ตรวจสอบ Google เปลี่ยนตำแหน่งฟีเจอร์

Quota หมด

- รอวันถัดไป (reset ตอน 00:00)
ใช้ fallback services แทน

📝 ตัวอย่างการใช้งาน

CODEBLOCK7

Google Free Media Generator

通过浏览器自动化，使用Google Gemini和Google Flow免费生成AI图片和视频的技能

🎯 何时使用此技能

当用户需要时使用：

- 为封面、缩略图、横幅创建AI图片
从文本或图片生成视频（文本转视频、图片转视频）
节省API费用（0泰铢 vs 通过常规API每张图片1-3泰铢）
无需担心成本地批量生成媒体内容

⚠️ 必须了解的局限性

1. 免费配额有限：Gemini约100张/天，Flow约50积分/天（可能变化）
比API慢：需要打开浏览器并等待UI加载（比API慢5-10倍）
UI可能变化：Google频繁更改按钮/位置 → 可能需要更新技能
服务条款：自动化可能违反Google免费层的服务条款

📋 工作流程

1. 开始前检查配额

bash node scripts/quota_manager.mjs check

- 查看剩余配额
配额快用完时发出提醒

2. 生成图片（Gemini）

bash node scripts/generate_image.mjs --prompt 图片描述 --output /path/to/output.jpg

工作流程：

1. 打开浏览器访问gemini.google.com
登录（如果尚未登录）
点击生成图片按钮
发送已增强的提示词
等待生成并获取全分辨率图片（=s0技巧）
保存到文件

3. 生成视频（Google Flow）

bash node scripts/generate_video.mjs --prompt 视频描述 --output /path/to/output.mp4

工作流程：

1. 打开浏览器访问labs.google/flow
选择模式（文本转视频或图片转视频）
发送提示词或上传图片
等待生成
下载视频

🔧 脚本

generate_image.mjs

通过Google Gemini生成图片

参数：

- --prompt：图片描述（必填）
--output：输出文件路径（必填）
--style：图片风格（可选：写实、艺术、极简）
--enhance：让AI自动增强提示词（默认：true）

generate_video.mjs

通过Google Flow生成视频（Veo 3.1）

参数：

- --prompt：视频描述（必填）
--output：输出文件路径（必填）
--mode：生成模式（文本转视频、图片转视频）
--image：源图片路径（用于图片转视频）
--duration：视频时长（5-10秒）

quota_manager.mjs

管理和跟踪使用配额

命令：

- check：检查剩余配额
reset：重置计数器（新的一天开始）
log：查看使用日志

配置文件： configs/quota.json
json
{
dailyLimits: {
images: 100,
videoCredits: 50
},
currentUsage: {
images: 0,
videoCredits: 0
},
lastReset: 2026-03-02T00:00:00+07:00
}

💡 重要技巧

1. 获取全分辨率图片

Gemini上的图片显示为1024px，但可以通过更改URL获取全分辨率（1408x768）：

从：https://.../image=s1024
改为：https://.../image=s0

2. 会话持久化

- 登录一次后保存cookie以供后续使用
无需每次生成图片时重新登录
使用Puppeteer/Playwright会话存储

3. 提示词增强

在发送给Gemini之前，应增强提示词，包含：

- 光照（柔和光照、戏剧性光照、黄金时刻）
构图（三分法、居中、广角）
风格（照片写实、电影感、极简、鲜艳）
质量关键词（4K、超精细、专业）

示例：

输入：戴眼镜的猫
增强后：一张照片写实风格的可爱猫咪肖像，戴着圆框眼镜，
柔和的工作室灯光，居中构图，专业摄影，
4K超精细，暖色调

📁 存储组织

生成的文件将存储在：

/mnt/storage/adaprojects/aimedia/
├── images/YYYY-MM/
├── videos/YYYY-MM/
└── metadata.json

🔄 备用方案

如果Google不可用，有备用选择：

1. Bing Image Creator（免费）
Leonardo.ai（免费层级）
Stable Diffusion Online

🚨 问题解决

无法登录

- 检查浏览器是否不是无头模式
如果使用VPS，需要设置Xvfb作为虚拟显示器
尝试清除cookie后重新登录

UI变化/按钮消失

- 更新脚本中的选择器
检查Google是否更改了功能位置

配额用完

- 等待第二天（00:00重置）
改用备用服务

📝 使用示例

bash

生成帖子封面

node scripts/generate_image.mjs \
--prompt AI工作流程图，未来主义风格，蓝紫色渐变 \
--output /mnt/storage/adaprojects/aimedia/images/2026-03/cover_001.jpg \
--style artistic

从文本生成视频

node scripts/generate_video.mjs \ --prompt 日落时分的海浪，电影感慢动作 \ --output /mnt/storage/adaprojects/aimedia/videos/2026-03/sunset.mp4 \ --duration 8

检查配额

node scripts/quota_manager.mjs check

google-free-media谷歌免费媒体