Whisperwood Narrator Engine
OUVRIR LE DASHBOARD →

La voix
de la forêt.

Darkvalley Show Control Suite · 6ᵉ produit

Narrateur invisible pour show control. Synthèse vocale multi-moteur, latence courte, voix clonables. Whisperwood donne une voix au narrateur — le secret transmis bouche à oreille au cœur de la forêt.

6 moteurs · 200+ voix · 40+ langues · Clonage one-shot

6 moteurs TTS· Latence < 200 ms· Clonage one-shot· 40+ langues· Expressivité Bark· Self-host gratuit· OSC · REST · WebSocket· Service privé Darkvalley· 6 moteurs TTS· Latence < 200 ms· Clonage one-shot· 40+ langues· Expressivité Bark· Self-host gratuit· OSC · REST · WebSocket· Service privé Darkvalley·
LE CONCEPT

Le narrateur invisible
des shows Darkvalley.

Whisperwood agrège 6 moteurs de synthèse vocale — 4 cloud (Mistral Voxtral, Cartesia Sonic-2, ElevenLabs Multilingual v2, OpenAI TTS HD) et 2 self-host gratuits (Kokoro, Bark) — derrière une seule API et une seule UI. Pas n'importe quel TTS — le moteur narratif des spectacles, des annonces, des persos clonés.

Génération < 200 ms (Cartesia), clonage one-shot 10–60 s (Voxtral, Cartesia, ElevenLabs), 40+ langues, expressivité narrative avec balises [laughs] [sighs] [whispers] (Bark), cache disque LRU, budget cap quotidien. Pilotable par OSC, REST, Node-RED, Chataigne, QLab.

Service privé hébergé par Darkvalley. Pas de signup public, pas de tracking tiers. Le dashboard demande login + 2FA, la landing reste accessible à toute l'équipe.

SIX MOTEURS, UN DASHBOARD

Une seule API,
six caractères.

Chacun a sa force. Le dashboard te laisse comparer en parallèle pour choisir le bon.

Voxtral

Mistral AI
  • 0,016 $/1k chars
  • ~1,3 s latence
  • FR · EN

Voix neutres polyglottes. Idéal pour annonces institutionnelles et multilingue répété.

Cartesia

Sonic-2
  • 0,015 $/1k chars
  • ~150 ms 🏎️
  • 40+ langues

Le plus rapide. 5 émotions, idéal cue live, déclenchement temps-réel.

ElevenLabs

Multilingual v2
  • 0,18 $/1k chars
  • ~900 ms
  • 30+ voix

Référence qualité expressive. Voix signature, personnages récurrents, émotion fine.

OpenAI

tts-1-hd
  • 0,030 $/1k chars
  • ~3 s
  • 9 voix multilingues

Cloud middle tier fiable. Voix HD fixes, fallback robuste sans dépendance hardware.

Kokoro

self-host · MIT
gratuit
  • 0 $/1k chars
  • ~4 s
  • 15 voix US/GB/FR/IT

82M params MIT. Idéal annonces volumiques répétitives — zéro coût marginal.

Bark

self-host · expressif
gratuit
  • 0 $/1k chars
  • ~20 s
  • 131 voix · 13 langues

Balises expressives [laughs] [sighs] [whispers]. Idéal personnages narratifs et atmosphère théâtrale.

POUR QUOI FAIRE

Des voix pour vos shows,
vos installations, vos univers.

Spectacle théâtral

Narrateur invisible qui ouvre la pièce, voix off entre les actes, doublages de personnages absents. ElevenLabs pour la voix signature, Cartesia pour les répliques au cue.

ElevenLabs · Cartesia

Escape game / Immersion

Voix du gardien des lieux, indices murmurés, personnages PNJ déclenchés au capteur. Bark pour les chuchotements, Kokoro pour les annonces volumiques.

Bark · Kokoro

Narration vidéo / Podcast

Narration longue, voix clonée pour cohérence, doublage multilingue. Voxtral pour la base économique, ElevenLabs pour la signature.

Voxtral · ElevenLabs · OpenAI

Animatronique / Robot

Voix temps-réel pour personnage interactif, déclenchement au capteur. Cartesia pour la latence sous 200 ms, voix fixées par catalog.

Cartesia · OpenAI
COMMENT ÇA MARCHE

Trois étapes,
une voix au creux du bois.

1
REQUEST

POST /api/tts/say

Le client envoie le texte, choisit la voix, l'engine et le format. Authentification via Bearer token, pas de session à gérer. Compatible OSC, REST, ou wrapper CLI.

2
ENGINE

6 moteurs disponibles

Whisperwood route vers le moteur choisi parmi les 6 (4 cloud + 2 self-host). Cache disque LRU sur le hash texte+voix : si la phrase est déjà connue, retour immédiat sans nouvelle facturation. Budget cap par jour, par engine.

3
RESPONSE

audio.mp3 + métadonnées

Le client reçoit le fichier audio, ses dimensions, sa latence, et le filename canonique <slug>__<voice>__<engine>__<sha8>.mp3. Lecture immédiate ou archivage local pour replay.

INTÉGRATIONS

Dans la chaîne show control,
comme une voix off naturelle.

Whisperwood s'invite dans la chaîne show control existante. Aucun adaptateur ad-hoc — REST, OSC ou wrapper CLI suffisent. La même API que tu connais déjà côté Obsidian Forge ou Sentry Watch.

Apps show-control

  • QLab
  • Chataigne
  • Node-RED

Protocoles

  • OSC
  • REST API
  • WebSocket events

Suite Darkvalley

  • Modbus via Obsidian Forge
  • wne CLI
L'UNIVERS WHISPERWOOD

La forêt qui souffle,
le chuchotement transmis bouche à oreille.

Whisper · le murmure, la voix qui se forme à peine, le secret transmis bouche à oreille au cœur de la forêt. Voix fragile et intime — exactement la sensation d'un narrateur qui s'adresse au public.

Wood · la forêt enchantée, lieu central de la cosmologie Darkvalley. Le bois qui, creux, devient instrument résonant — flûte, cor, lyre.

Tension voulue : intimité du chuchotement × immensité de la forêt. Le détail audio infime au service d'une atmosphère immersive vaste.

Univers de référence Sleepy Hollow · Cabin in the Woods · From · Les Revenants · Darkmoor Village · l'heure du gloaming entre chien et loup.
PLACE DANS LA SUITE

Sixième produit
de la Darkvalley Suite.