◆套件包

Nirvana — Creative Studio

视频、图像、音频与剧集化制作——从剧本到成品资产。

四家工作室与十三个 squads，覆盖整条视听产业链。剧本与 treatment、图像生成、基于 Veo、Kling 与 Higgsfield 的视频、图生视频动画、克隆声线配音以及覆盖六家 TTS 提供商的后期。剧集化制作与可复用的声线身份，从 brief 到成品资产。

13 squads4 企业56 mind-clones

US$990.00

v0.1.21 · 实名许可 · 3 台机器

一次性付款。在登录区按购买者签名下载。

包内含什么

企业 · 4

cinema-machine

制作机构宣传片、广告、pitch films 与 short-form content，由客户在作者电影的经典范式中选择视觉署名——以 precision-noir、dialogue-driven 等流派进行导演……

serial-showrunner-nirvana

内容剧集的 showrunner。逐集产出一个频道的全部 360 度交付物（剧本、AI 视频、帖子、迷你 PDF、电子书、落地页、创意素材、广告），借助一部 bible 复用角色、场景与声线……

vivid-pancake

专注于 AI-first 营销/品牌震撼视频（Reels、广告、15-90 秒品牌内容）的 Nirvana 企业。差异化在于：keyframe-first 的 I2V 管线，配以显式的 vision QA（MCP nano-banana-pro describe_image）+ overlays……

voicecraft

专注于为纯云端 TTS 音频生成（默认 Gemini 3.1 Flash TTS，并支持 ElevenLabs v3、OpenAI gpt-4o-mini-tts、Hume Octave、Cartesia Sonic-3 与 Azure Neural……）撰写结构化、无可挑剔指令的企业。

Squads · 13

audio-chunking

使用 Murch 边界决策树将长源文本切分为适配 TTS 的片段。对每个候选边界打分（场景断点 1.00 / 段落 0.85 / 句子 0.70 / 从句 0.40 / 从句中部禁止）。

audio-postprod

通过本地 ffmpeg 以三角形交叉淡入淡出（默认 100ms，场景边界处 200-300ms）拼接各片段 WAV 文件，随后进行两遍 loudnorm 至目标 LUFS（默认 -16，播客标准），再导出为多种格式（WAV……

audio-render-cloud

调用云端 TTS 提供商 API（默认 Gemini，外加 ElevenLabs/OpenAI/Hume/Cartesia/Azure 的回退链）将每个片段渲染为 WAV 文件。在 429/5xx/超时时实现自动回退。提供商不匹配时进行重采样。

brandcraft

品牌一致的视觉交付物：从 URL 提取设计系统（Refero + 实时提取）、生成 PDF、PPTX、社交帖子、轮播图与程序化视频，经由两条路径（Veo 3.1 + Remotion 处理 AI 素材；HyperFrames……

higgsfield-studio-nirvana

最强媒体生成能力，经由 Higgsfield 官方 CLI（@higgsfield/cli），无头且 agent-native：照片级写实图像（Soul 2.0 / Nano Banana）、多模型视频（Kling 3.0、Veo 3.1、Seedance 2.0、DoP），含 50+ 运动预设……

image2-virtuoso

经由 Codex 用 gpt-image-2 生成照片级写实图像与震撼照片：导演级摄影（光线、镜头、相机、构图、影棚对……

infographic-virtuoso

极高质量的编辑级信息图：犀利叙事、扎实数据、2026 艺术指导与质量闸门。

multi-provider-prompt-build

将 voice-seed.json + chunks_plan.json 转换为各提供商专属的提示词（Gemini Layer Cake / ElevenLabs inline tags / OpenAI instructions / Hume voice_prompt / Cartesia SSML / Azure SSML）。

nirvana-video-creator

跨引擎的 AI 视频路由与规划层——理解用户请求，在 19+ 引擎（Veo 3.1、Sora 2、Kling、Runway、Luma、Wan 2.2、HunyuanVideo、LTX、Sync.so、LatentSync……）之间进行工具/成本仲裁。

tts-brief-analysis

读取自由格式的用户 brief + 源文本，输出结构化的 brief-spec.yaml——提取语言、语域、受众、交付物类型、提供商覆盖（如有）、口音提示、性别/年龄提示、预期时长，以及前 500……

veo-motion-studio

经由 GenAI 使用 Google Veo 3.1 图生视频的专家：用运动指令为图像注入动态、固定图像并仅令选定元素动起来（cinemagraph）、生成完美循环、带多语言对白与唇形同步的视频，以及带……的系列。

vivid-pancake-keyframe-i2v

面向营销 reels 与广告（15-90 秒）的 keyframe-first I2V。将 brief 分解为 shot list → keyframes（Nano Banana Pro）→ vision QA（MCP nano-banana-pro__describe_image）→ I2V（Veo 3.1，应用黄金法则）→ 音频 → Remotion overlays → ……

voice-seed-architect

从 brief-spec 设计规范的声线身份（voice-seed.json）。以 Andrea Romano（表演）+ Geoff Lindsey（语音学）共同奠基。始终输出一个为全部 6 家支持的提供商预先计算好跨提供商映射的 seed。

如何安装

安装引擎： npx @nirvana-os/cli
购买后，在登录区下载你的专属带签套件包并运行 bun setup.ts
随时更新： nrv update creative-studio

诚实说明

这些 squads 与企业在 Nirvana-OS 引擎之上生成真实的策略、文档、代码、文案、计划与报告。图像与视频的生成使用你所在环境中的工具；在外部平台上的发布与执行取决于你自己的密钥与集成。内容归你所有，可自由使用与改编。