返回顶部
p

picasso-tiktok毕加索抖音

|

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.2.0
安全检测
已通过
252
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

picasso-tiktok

Picasso TikTok 🎨

为TikTok/Reels生成9:16视频,结合源视频 + HeyGen头像 + 同步字幕。

⚠️ 强制流程 — 带验证的逐步操作

绝不要一次性运行完整管道。始终:

  1. 1. 下载 + 分析视频 → 显示时长和信息
  2. 撰写脚本 → 展示给Paul,等待确认
  3. 生成音频 → 发送试听,等待确认
  4. 询问视频配置(布局、源音乐) → 等待确认
  5. 生成HeyGen头像
  6. 转录 + 对照原始脚本修正字幕
  7. 合成最终视频

步骤1:下载视频

Google Drive

bash pip install gdown -q gdown https://drive.google.com/uc?id=FILE_ID&confirm=t -O output.mp4

如果失败(权限问题):请Paul将分享权限设为任何拥有链接的人或通过Telegram发送。

TikTok / YouTube

bash yt-dlp -o output.mp4 URL

Telegram(附件)

附件会到达 ~/.openclaw/media/inbound/

验证

bash ffprobe video.mp4 2>&1 | grep -E Duration|Video:|Audio:

步骤2:脚本

规则:

  • - 阿根廷拉普拉塔河西班牙语(voseo:如grabás、actualizás、imaginá)
  • 前3秒要有强力钩子
  • 动态,无填充内容
  • 无导演注释,仅朗读文本
  • 结尾CTA(例如:加入Morfeo Labs)
  • 目标时长:等于或略长于源视频

展示脚本并在生成音频前等待批准。



步骤3:音频 — TTS

✅ 默认:ElevenLabs Paul Pro

始终生成3种语音变体并发送给Paul选择,然后再继续。

python
import requests, time

CACHE = /home/ubuntu/clawd/projects/picasso-tiktok/cache/JOB_NAME
BASEURL = https://api.elevenlabs.io/v1/text-to-speech/$ELEVENLABSVOICE_ID
HEADERS = {xi-api-key: $ELEVENLABSAPIKEY, Content-Type: application/json}

变体A — 富有表现力,强停顿

变体B — 默认获胜者:长破折号用于戏剧性停顿(stability 0.45)

变体C — 流畅新闻风格,无中断(stability 0.62)

configs = [
(A, scripta, {stability: 0.35, similarityboost: 0.80, style: 0.25}),
(B, scriptb, {stability: 0.45, similarityboost: 0.82, style: 0.15}), # ← 常胜将军
(C, scriptc, {stability: 0.62, similarityboost: 0.78, style: 0.05}),
]

for ver, text, settings in configs:
r = requests.post(BASE_URL, headers=HEADERS,
json={text: text, modelid: elevenmultilingualv2, voicesettings: settings})
with open(f{CACHE}/audio_{ver}.mp3, wb) as f:
f.write(r.content)
print(f✅ V{ver} {len(r.content)//1024}KB)
time.sleep(1)

标点技巧控制节奏:

  • - 独立段落分隔的短语 → 自然长停顿(VA)
  • 句内长破折号 — → 句中戏剧性停顿(VB,获胜者)
  • 全部连在一起无中断 → 纪录片式流畅(VC)

⚠️ 重要:

  • - 模型:elevenmultilingualv2 — 绝不用 elevenv3(会改变口音)
  • Paul Pro语音ID:$ELEVENLABSVOICEID
  • API密钥:$ELEVENLABSAPI_KEY

备用:Cartesia sonic-3

python r = requests.post(https://api.cartesia.ai/tts/bytes, headers={X-API-Key: $CARTESIAAPIKEY, Cartesia-Version: 2025-04-16, Content-Type: application/json}, json={model_id: sonic-3, # 始终用 sonic-3,绝不用 sonic-2 transcript: SCRIPT, voice: {mode: id, id: $CARTESIAVOICEID}, language: es, outputformat: {container: mp3, samplerate: 44100, bit_rate: 128000}})

发送音频试听并在继续前等待确认。



步骤4:询问配置

在生成头像和合成前,确认:

  • - 布局: 60/40(源在上方)、50/50、40/60(头像在上方)
  • 字幕: 是/否
  • 源音频: 是否混合原始音乐?如果是,音量多少?(通常:30%)
  • 前几秒标题(例如:这个女孩不存在 👁️)
  • TikTok标题带话题标签



步骤5:HeyGen头像

上传音频到uguu.se(HeyGen要求)

python import requests

with open(audio.mp3, rb) as f:
r = requests.post(https://uguu.se/upload,
files={files[]: (audio.mp3, f.read(), audio/mpeg)}, timeout=30)
audio_url = r.json()[files][0][url]

生成视频

python HEYGENKEY = $HEYGENAPI_KEY AVATAR_ID = aa7ca06de7454b9caa147b97a534e813 # Paul默认

r = requests.post(https://api.heygen.com/v2/video/generate,
headers={X-Api-Key: HEYGEN_KEY, Content-Type: application/json},
json={
video_inputs: [{
character: {type: avatar, avatarid: AVATARID, avatar_style: normal},
voice: {type: audio, audiourl: audiourl},
background: {type: color, value: #000000}
}],
dimension: {width: 432, height: 768}, # 小9:16,缩放效果更好
aspect_ratio: 9:16
})
videoid = r.json()[data][videoid]

轮询直到完成(约2-4分钟)

python import time while True: r = requests.get(fhttps://api.heygen.com/v1/videostatus.get?videoid={video_id}, headers={X-Api-Key: HEYGEN_KEY}) data = r.json().get(data) or {} if data.get(status) == completed: avatarurl = data[videourl] break time.sleep(15)

下载和cropdetect

bash curl -sL $AVATAR_URL -o avatar.mp4

自动检测裁剪(去除HeyGen的黑色填充)

ffmpeg -ss 2 -i avatar.mp4 -vframes 10 -vf cropdetect=24:2:0 -f null - 2>&1 | grep crop= | tail -2

典型结果:crop=432:244:0:262


步骤6:字幕 — 始终对照原始脚本

用Whisper转录

python import requests, os

with open(audio.mp3, rb) as f:
r = requests.post(https://api.openai.com/v1/audio/transcriptions,
headers={Authorization: fBearer {os.environ[OPENAIAPIKEY]}},
files={file: (audio.mp3, f, audio/mpeg)},
data={model: whisper-1, responseformat: verbosejson,
timestamp_granularities[]: word, language: es})
words = r.json()[words]

⚠️ 始终对照原始脚本检查并修正

Whisper在西班牙语/拉普拉塔语+技术术语上常犯错误:

Whisper写的正确
ClingKLING
Confi / Confy
COMFY |
| Imagina | IMAGINÁ |
| Grabas | GRABÁS |
| Actualizas | ACTUALIZÁS |
| Buscas | BUSCÁS |
| Preparas | PRE

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 picasso-tiktok-1776115512 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 picasso-tiktok-1776115512 技能

通过命令行安装

skillhub install picasso-tiktok-1776115512

下载

⬇ 下载 picasso-tiktok v1.2.0(免费)

文件大小: 6.32 KB | 发布时间: 2026-4-15 13:53

v1.2.0 最新 2026-4-15 13:53
v1.2: ElevenLabs 3-variation flow, Runway Gen-4.5 B-roll, image-to-video con Nano Banana Pro + animación con Gen-4.5, layouts avanzados, correcciones de Whisper para voseo rioplatense, checklist completo

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部