Nirvana-OS 套件包
套件包

Nirvana — Creative Studio

视频、图像、音频与剧集化制作——从剧本到成品资产。

四家工作室与十三个 squads,覆盖整条视听产业链。剧本与 treatment、图像生成、基于 Veo、Kling 与 Higgsfield 的视频、图生视频动画、克隆声线配音以及覆盖六家 TTS 提供商的后期。剧集化制作与可复用的声线身份,从 brief 到成品资产。

13 squads4 企业56 mind-clones
US$990.00
v0.1.21 · 实名许可 · 3 台机器

一次性付款。在登录区按购买者签名下载。

包内含什么

企业 · 4

cinema-machine

制作机构宣传片、广告、pitch films 与 short-form content,由客户在作者电影的经典范式中选择视觉署名——以 precision-noir、dialogue-driven 等流派进行导演……

serial-showrunner-nirvana

内容剧集的 showrunner。逐集产出一个频道的全部 360 度交付物(剧本、AI 视频、帖子、迷你 PDF、电子书、落地页、创意素材、广告),借助一部 bible 复用角色、场景与声线……

vivid-pancake

专注于 AI-first 营销/品牌震撼视频(Reels、广告、15-90 秒品牌内容)的 Nirvana 企业。差异化在于:keyframe-first 的 I2V 管线,配以显式的 vision QA(MCP nano-banana-pro describe_image)+ overlays……

voicecraft

专注于为纯云端 TTS 音频生成(默认 Gemini 3.1 Flash TTS,并支持 ElevenLabs v3、OpenAI gpt-4o-mini-tts、Hume Octave、Cartesia Sonic-3 与 Azure Neural……)撰写结构化、无可挑剔指令的企业。

Squads · 13

audio-chunking

使用 Murch 边界决策树将长源文本切分为适配 TTS 的片段。对每个候选边界打分(场景断点 1.00 / 段落 0.85 / 句子 0.70 / 从句 0.40 / 从句中部禁止)。

audio-postprod

通过本地 ffmpeg 以三角形交叉淡入淡出(默认 100ms,场景边界处 200-300ms)拼接各片段 WAV 文件,随后进行两遍 loudnorm 至目标 LUFS(默认 -16,播客标准),再导出为多种格式(WAV……

audio-render-cloud

调用云端 TTS 提供商 API(默认 Gemini,外加 ElevenLabs/OpenAI/Hume/Cartesia/Azure 的回退链)将每个片段渲染为 WAV 文件。在 429/5xx/超时时实现自动回退。提供商不匹配时进行重采样。

brandcraft

品牌一致的视觉交付物:从 URL 提取设计系统(Refero + 实时提取)、生成 PDF、PPTX、社交帖子、轮播图与程序化视频,经由两条路径(Veo 3.1 + Remotion 处理 AI 素材;HyperFrames……

higgsfield-studio-nirvana

最强媒体生成能力,经由 Higgsfield 官方 CLI(@higgsfield/cli),无头且 agent-native:照片级写实图像(Soul 2.0 / Nano Banana)、多模型视频(Kling 3.0、Veo 3.1、Seedance 2.0、DoP),含 50+ 运动预设……

image2-virtuoso

经由 Codex 用 gpt-image-2 生成照片级写实图像与震撼照片:导演级摄影(光线、镜头、相机、构图、影棚对……

infographic-virtuoso

极高质量的编辑级信息图:犀利叙事、扎实数据、2026 艺术指导与质量闸门。

multi-provider-prompt-build

将 voice-seed.json + chunks_plan.json 转换为各提供商专属的提示词(Gemini Layer Cake / ElevenLabs inline tags / OpenAI instructions / Hume voice_prompt / Cartesia SSML / Azure SSML)。

nirvana-video-creator

跨引擎的 AI 视频路由与规划层——理解用户请求,在 19+ 引擎(Veo 3.1、Sora 2、Kling、Runway、Luma、Wan 2.2、HunyuanVideo、LTX、Sync.so、LatentSync……)之间进行工具/成本仲裁。

tts-brief-analysis

读取自由格式的用户 brief + 源文本,输出结构化的 brief-spec.yaml——提取语言、语域、受众、交付物类型、提供商覆盖(如有)、口音提示、性别/年龄提示、预期时长,以及前 500……

veo-motion-studio

经由 GenAI 使用 Google Veo 3.1 图生视频的专家:用运动指令为图像注入动态、固定图像并仅令选定元素动起来(cinemagraph)、生成完美循环、带多语言对白与唇形同步的视频,以及带……的系列。

vivid-pancake-keyframe-i2v

面向营销 reels 与广告(15-90 秒)的 keyframe-first I2V。将 brief 分解为 shot list → keyframes(Nano Banana Pro)→ vision QA(MCP nano-banana-pro__describe_image)→ I2V(Veo 3.1,应用黄金法则)→ 音频 → Remotion overlays → ……

voice-seed-architect

从 brief-spec 设计规范的声线身份(voice-seed.json)。以 Andrea Romano(表演)+ Geoff Lindsey(语音学)共同奠基。始终输出一个为全部 6 家支持的提供商预先计算好跨提供商映射的 seed。

如何安装

  1. 安装引擎: npx @nirvana-os/cli
  2. 购买后,在登录区下载你的专属带签套件包并运行 bun setup.ts
  3. 随时更新: nrv update creative-studio

诚实说明

这些 squads 与企业在 Nirvana-OS 引擎之上生成真实的策略、文档、代码、文案、计划与报告。图像与视频的生成使用你所在环境中的工具;在外部平台上的发布与执行取决于你自己的密钥与集成。内容归你所有,可自由使用与改编。

Nirvana — Creative Studio — Nirvana-OS