Nirvana — Creative Studio
Video, imagen, audio y producción episódica — del guion al asset final.
Cuatro estudios y trece squads que cubren la cadena audiovisual entera. Guion y treatment, generación de imagen, video en Veo, Kling y Higgsfield, animación imagen-a-video, locución con voz clonada y posproducción en seis proveedores de TTS. Producción episódica e identidad de voz reutilizable, del brief al asset final.
Pago único. Descarga sellada por comprador en el área privada.
Qué incluye
Empresas · 4
Producir videos institucionales, publicidad, pitch films y contenido short-form en los que el cliente elige la firma visual entre cánones consagrados del cine de autor — dirección en escuelas como precision-noir, dialogue-driven…
Showrunner de series de contenido. Produce, episodio a episodio, todos los entregables 360 grados de un canal (guion, video IA, post, mini-PDF, ebook, landing, creativos, anuncios), reutilizando personajes, escenarios y voces mediante una biblia…
Empresa Nirvana especializada en videos espectaculares de marketing/brand IA-first (Reels, ads, branded content de 15-90s). Diferencial: pipeline keyframe-first I2V con vision QA explícito (MCP nano-banana-pro describe_image) + overlays…
Empresa especializada en crear instrucciones estructuradas e impecables para generación de audio TTS cloud-only (Gemini 3.1 Flash TTS como default, con soporte para ElevenLabs v3, OpenAI gpt-4o-mini-tts, Hume Octave, Cartesia Sonic-3 y Azure Neural…
Squads · 13
Divide texto fuente largo en chunks aptos para TTS usando el árbol de decisión de límites de Murch. Puntúa cada límite candidato (corte de escena 1.00 / párrafo 0.85 / oración 0.70 / cláusula 0.40 / mitad de cláusula prohibido).
Concatena archivos WAV por chunk vía ffmpeg local con crossfade triangular (100ms por defecto, 200-300ms en cortes de escena), luego aplica loudnorm de dos pasadas hacia el LUFS objetivo (por defecto -16, estándar podcast), luego exporta a multiformato (WAV…
Llama a las APIs de proveedores de TTS en la nube (Gemini por defecto + cadena de fallback ElevenLabs/OpenAI/Hume/Cartesia/Azure) para renderizar cada chunk en un archivo WAV. Implementa fallback automático ante 429/5xx/timeout. Resamplea ante desajuste de proveedor.
Entregables visuales brand-consistent: extrae design systems de URLs (Refero + live extraction), genera PDFs, PPTX, posts sociales, carruseles y videos programáticos por dos caminos (Veo 3.1 + Remotion para footage de IA; HyperFrames…
El más capaz para generar medios vía la CLI oficial de Higgsfield (@higgsfield/cli), headless y agent-native: imagen fotorrealista (Soul 2.0 / Nano Banana), video multimodelo (Kling 3.0, Veo 3.1, Seedance 2.0, DoP) con más de 50 presets de movimiento…
Genera imágenes fotorrealistas y fotos espectaculares con gpt-image-2 vía Codex: fotografía dirigida (luz, lente, cámara, composición, estudio vs.
Infografías editoriales de altísima calidad: narrativa afilada, datos fundamentados, dirección de arte 2026 y quality gate.
Transforma un voice-seed.json + chunks_plan.json en prompts específicos por proveedor (Gemini Layer Cake / ElevenLabs inline tags / OpenAI instructions / Hume voice_prompt / Cartesia SSML / Azure SSML).
Capa de ruteo y planificación cross-engine para video con IA — entiende el request del usuario, hace arbitraje de herramienta/costo entre más de 19 engines (Veo 3.1, Sora 2, Kling, Runway, Luma, Wan 2.2, HunyuanVideo, LTX, Sync.so, LatentSync…
Lee un brief libre del usuario + texto fuente y emite un brief-spec.yaml estructurado — extrae idioma, registro, audiencia, tipo de entregable, override de proveedor (si lo hay), pistas de acento, pistas de género/edad, duración esperada y los primeros 500…
Especialista en Google Veo 3.1 image-to-video vía GenAI: anima imágenes con instrucciones de movimiento, fija la imagen y anima solo elementos seleccionados (cinemagraph), genera loops perfectos, videos con habla multilingüe y lip-sync, y series con…
Keyframe-first I2V para reels y ads de marketing (15-90s). Descompone brief → shot list → keyframes (Nano Banana Pro) → vision QA (MCP nano-banana-pro__describe_image) → I2V (Veo 3.1, aplicando la regla de oro) → audio → Remotion overlays →…
Diseña la identidad de voz canónica (voice-seed.json) a partir de un brief-spec. Co-grounding en Andrea Romano (performance) + Geoff Lindsey (fonética). Siempre emite un seed con mapeo cross-provider precalculado para los 6 proveedores soportados.
Cómo instalar
- Instala el motor:
npx @nirvana-os/cli - Tras la compra, descarga tu pack sellado en el área privada y ejecuta
bun setup.ts - Actualiza cuando quieras:
nrv update creative-studio
Nota honesta
Los squads y las empresas generan estrategia, documentos, código, copy, planes e informes reales sobre el motor Nirvana-OS. La generación de imagen y video usa las herramientas de tu entorno; la publicación y la ejecución en plataformas externas dependen de tus claves e integraciones. El contenido es tuyo para usar y adaptar.