Skip to main content
Jonathan Andrei
Retour aux billets
Déc. 20256 min de lecture

Transformer un téléphone en flux de réalisateur

La plupart des générateurs d'IA veulent un prompt par image. Shot Supervisor renverse la logique : un projet se décompose en scènes, les scènes en plans, et le contrôle déterministe en JSON de Bria FIBO maintient le langage visuel cohérent sur l'ensemble.

React NativeBria FIBOGenerative ImageMobile

Le problème de la génération prompt-par-prompt, c'est qu'on ne peut pas tourner un film avec. On peut tourner un moodboard. Shot Supervisor, c'est ce qui arrive quand on laisse le flux d'un réalisateur piloter les prompts, projets, scènes, plans, et les choix de modèles sont au service de la structure plutôt qu'à sa place.

Aperçu de l'application Shot Supervisor sur mobile.
Shot Supervisor : un outil mobile façon réalisateur pour planifier, générer, retoucher et exporter des plans.

Pourquoi je l'ai construit

La production visuelle professionnelle souffre d'un écart réel entre l'intention créative et l'exécution technique. Aujourd'hui, les créateurs sautent d'un outil à l'autre, prompts, exports, ajustements manuels, juste pour garder des plans cohérents dans un projet. La génération par prompt est puissante mais imprévisible, et elle s'effondre vite quand la précision, la répétabilité ou les standards pro comme HDR, profondeur de bits et espace colorimétrique comptent.

Le contrôle déterministe et JSON-natif de Bria FIBO ressemblait à la pièce manquante. Au lieu de me battre avec des prompts, je voulais un outil où les plans sont planifiés, générés, retouchés et exportés avec un contrôle de niveau production, n'importe où, sur un téléphone.

Projet → scène → plan

Une décomposition pilotée par LLM transforme un brief en arbre structuré. La génération déterministe de Bria FIBO garde le rendu reproductible sur tout l'arbre, le même personnage à la même heure du jour reste le même personnage. L'UI mobile-first permet d'éditer en ligne à table, dans un train ou sur un plateau.

Onglet Projets listant plusieurs plans de tournage.
Onglet Projets. Un nouveau projet peut se déployer en jusqu'à 5 plans générés par IA via la décomposition LLM.

Ce que ça fait

Trois onglets cartographient le flux : Projets, Plans, Éditeur. Projets contient un nom, une description et jusqu'à 5 plans auto-générés à partir de la description. Plans, c'est là où chaque entrée reçoit un titre, un prompt et une image de référence optionnelle depuis la pellicule ou prise dans l'app. Éditeur, c'est l'étape post, sur le même appareil.

Des contrôles d'éditeur qui comptent vraiment sur un plateau

  • Suppression d'arrière-plan et remplacement piloté par prompt, plus flou d'arrière-plan.
  • Contrôles HDR (endpoint custom) : exposition, contraste, hautes lumières, ombres.
  • LUT : Aucune, Cinema (Filmic), Teal & Orange, Vibrant.
  • Espaces colorimétriques : sRGB, AdobeRGB, DCI-P3, Rec2020.
  • Profondeur de bits : 8, 10, 12, 16 bits.
  • Édition produit via l'API Product de Bria.
Écran de l'éditeur avec contrôles HDR, LUT, espace colorimétrique et profondeur de bits.
L'éditeur : contrôle des tons HDR, LUT, espace colorimétrique, profondeur de bits, tout sur un téléphone.

De la vraie post-production sur un téléphone

Contrôle des tons HDR, LUT, choix d'espace colorimétrique, traitement en grande profondeur de bits, exports multi-format (JPEG, PNG, TIFF, EXR). Les standards ne sont pas une liste à cocher, c'est ce qui rend la sortie utilisable en aval par quiconque dispose d'un vrai pipeline d'étalonnage.

Écran d'export avec options de format JPEG, PNG, TIFF, EXR.
Les exports vont sur l'appareil ou par courriel, en JPEG, PNG, TIFF ou EXR, pour que le fichier atterrisse dans l'outil d'étalonnage suivant.

Comment je l'ai construit

React Native et TypeScript côté client, Supabase pour l'auth et la base projets / plans, et un ensemble d'endpoints hébergés sur Vercel devant Bria pour qu'aucun secret ne traîne sur l'appareil : bria-generate, bria-edit, bria-product, export-hdr, hdr-tone-map, email et llm-breakdown. L'endpoint llm-breakdown utilise DeepSeek-V3 pour convertir une description de projet en texte libre en un plan structuré que l'API generate de Bria peut consommer directement.

Diviser la génération, l'édition et le traitement HDR en endpoints modulaires garde chacun indépendamment scalable et permet à la couche HDR d'aller au-delà des contraintes par défaut de l'API tout en restant compatible avec le pipeline de Bria.

Ce qui a été difficile

  • Concevoir un flux d'édition pro sur mobile sans saturer l'écran.
  • Trouver l'équilibre entre liberté créative et contrôle structuré, déterministe.
  • Rendre le HDR et la haute profondeur de bits intuitifs plutôt que techniques.
  • Écrire des endpoints HDR custom qui prolongent les défauts tout en restant compatibles avec Bria.

Ce que j'ai appris

  • Les pros ne veulent pas de meilleurs prompts, ils veulent de meilleurs contrôles.
  • La génération structurée de FIBO débloque des flux que les modèles prompt-only n'atteignent pas.
  • HDR, espace colorimétrique et profondeur de bits comptent vraiment en production réelle.
  • La génération JSON-native se marie très bien avec les pipelines agentiques et automatisés.

La suite

  • Aperçu HDR en temps réel dans l'éditeur.
  • Audit de cohérence des plans à travers les projets.
  • Édition photo basée sur l'histogramme.
  • Chat Bria via MCP pour des retouches conversationnelles.
  • Support vidéo.
  • Déplacer les variables Supabase encore côté client entièrement côté serveur.
Construit avec Bria FIBO, DeepSeek-V3, React Native, TypeScript, Supabase et Vercel.
Projet associé

Shot Supervisor: Professional AI Shot Planning & Post-Production

Voir le projet