Whisperwood Narrator Engine

La voix
de la forêt.

Darkvalley Show Control Suite · 6ᵉ produit

Narrateur invisible pour show control. Synthèse vocale multi-moteur, latence courte, voix clonables. Whisperwood donne une voix au narrateur — le secret transmis bouche à oreille au cœur de la forêt.

6 moteurs · 200+ voix · 40+ langues · Clonage one-shot

Ouvrir le dashboard → Voir les 6 moteurs ↓

Le narrateur invisible
des shows Darkvalley.

Whisperwood agrège 6 moteurs de synthèse vocale — 4 cloud (Mistral Voxtral, Cartesia Sonic-2, ElevenLabs V3, OpenAI TTS HD) et 2 self-host gratuits (Kokoro, Bark) — derrière une seule API et une seule UI. Pas n'importe quel TTS — le moteur narratif des spectacles, des annonces, des persos clonés.

Génération < 200 ms (Cartesia), clonage one-shot 10–60 s (Voxtral, Cartesia, ElevenLabs), 70+ langues (ElevenLabs V3), expressivité narrative avec balises [laughs] [whispers] [excited] (Bark + ElevenLabs V3), cache disque LRU, budget cap quotidien. Pilotable par OSC, REST, Node-RED, Chataigne, QLab.

Service privé hébergé par Darkvalley. Pas de signup public, pas de tracking tiers. Le dashboard demande login + 2FA, la landing reste accessible à toute l'équipe.

Voxtral

Mistral AI

⊕

0,016 $/1k chars
~1,3 s latence
FR · EN

Voix neutres polyglottes. Idéal pour annonces institutionnelles et multilingue répété.

Cartesia

Sonic-2

⊕

0,015 $/1k chars
~150 ms 🏎️
40+ langues

Le plus rapide. 5 émotions, idéal cue live, déclenchement temps-réel.

ElevenLabs

V3 alpha

⊕

0,18 $/1k chars
~900 ms
70+ langues

Référence qualité expressive. Balises audio inline [laughs] [whispers] [excited], voix signature, personnages récurrents.

OpenAI

tts-1-hd

0,030 $/1k chars
~3 s
9 voix multilingues

Cloud middle tier fiable. Voix HD fixes, fallback robuste sans dépendance hardware.

Kokoro

self-host · MIT

gratuit

0 $/1k chars
~4 s
15 voix US/GB/FR/IT

82M params MIT. Idéal annonces volumiques répétitives — zéro coût marginal.

Bark

self-host · expressif

gratuit

0 $/1k chars
~20 s
131 voix · 13 langues

Balises expressives [laughs] [sighs] [whispers]. Idéal personnages narratifs et atmosphère théâtrale.

Des voix pour vos shows,
vos installations, vos univers.

Spectacle théâtral

Narrateur invisible qui ouvre la pièce, voix off entre les actes, doublages de personnages absents. ElevenLabs pour la voix signature, Cartesia pour les répliques au cue.

ElevenLabs · Cartesia

Escape game / Immersion

Voix du gardien des lieux, indices murmurés, personnages PNJ déclenchés au capteur. Bark pour les chuchotements, Kokoro pour les annonces volumiques.

Bark · Kokoro

Narration vidéo / Podcast

Narration longue, voix clonée pour cohérence, doublage multilingue. Voxtral pour la base économique, ElevenLabs pour la signature.

Voxtral · ElevenLabs · OpenAI

Animatronique / Robot

Voix temps-réel pour personnage interactif, déclenchement au capteur. Cartesia pour la latence sous 200 ms, voix fixées par catalog.

Cartesia · OpenAI

Au-delà de la voix,
deux extensions premium.

Whisperwood reste un moteur TTS — deux modules Pro étendront l'usage vers le dialogue conversationnel et la génération musicale.

PRO · bientôt

Personnage conversationnel guidé

Agent IA scripté qui dialogue en direct avec vos visiteurs — kiosques, escape games, installations interactives. Persona configurable, mémoire de session, voix Whisperwood au cue.

Live · Persona · Mémoire

PRO · bientôt

Studio musique IA

Génération musicale qualité studio — jingles, ambiances, thèmes. Style guidé, durée maîtrisée, export multi-formats. Pilotable au cue avec votre TTS.

Jingles · Ambiances · Studio

Trois étapes,
une voix au creux du bois.

REQUEST

POST `/api/tts/say`

Le client envoie le texte, choisit la voix, le moteur et le format. Authentification via Bearer token, pas de session à gérer. Compatible OSC, REST, ou wrapper CLI.

ENGINE

6 moteurs disponibles

Whisperwood route vers le moteur choisi parmi les 6 (4 cloud + 2 self-host). Cache disque LRU sur le hash texte+voix : si la phrase est déjà connue, retour immédiat sans nouvelle facturation. Budget cap par jour, par moteur.

RESPONSE

audio.mp3 + métadonnées

Le client reçoit le fichier audio, ses dimensions, sa latence, et le filename canonique <slug>__<voice>__<engine>__<sha8>.mp3. Lecture immédiate ou archivage local pour replay.

Dans la chaîne show control,
comme une voix off naturelle.

Whisperwood s'invite dans la chaîne show control existante. Aucun adaptateur ad-hoc — REST, OSC ou wrapper CLI suffisent. La même API que tu connais déjà côté Obsidian Forge ou Sentry Watch.

Apps show-control

QLab
Chataigne
Node-RED

Protocoles

OSC
REST API
WebSocket events

Suite Darkvalley

Modbus via Obsidian Forge
wne CLI

La voix
de la forêt.

Le narrateur invisible
des shows Darkvalley.