Failover vidéo : bonnes pratiques pour une diffusion sans interruption
Pourquoi le failover est essentiel
En diffusion en direct, une coupure de flux n’est pas qu’un problème technique, c’est une perte d’audience, de revenus et de réputation. Que vous diffusiez un événement sportif à 50 000 spectateurs ou une assemblée générale d’entreprise à 500 collaborateurs, les attentes sont les mêmes : ça ne doit pas tomber.
Le failover de flux vidéo est le filet de sécurité qui rattrape votre diffusion lorsque le flux principal échoue.
Qu’est-ce que le failover vidéo ?
Le failover est le basculement automatique d’une entrée vidéo principale vers une entrée de secours lorsque le système détecte une défaillance. Un bon système de failover :
- Détecte rapidement les défaillances : en millisecondes, pas en secondes
- Bascule sans coupure visible : perturbation visuelle minimale pour les spectateurs
- Récupère automatiquement : retourne sur le flux principal lorsqu’il redevient opérationnel
- Ne nécessite aucune intervention manuelle : l’automatisation est la base du système
Architecture : entrées redondantes
La base de tout dispositif de failover repose sur des entrées redondantes. Vous avez besoin d’au moins deux chemins indépendants :
Actif/Standby
Le modèle le plus simple. Une entrée est active, l’autre est en attente :
SRT Principal → [Passerelle] → Sortie
RTMP Secours → [Passerelle] ↗ (en cas de défaillance)
- L’entrée principale transporte le flux
- L’entrée de secours est connectée et prête mais non utilisée
- En cas de défaillance du principal, la passerelle bascule sur le secours
Actif/Actif
Les deux entrées transportent le flux simultanément. La passerelle sélectionne le meilleur :
Entrée A (SRT) → [Passerelle : comparaison] → Meilleur signal → Sortie
Entrée B (SRT) → [Passerelle : comparaison] ↗
- Les deux chemins sont supervisés en temps réel
- La passerelle peut basculer en fonction de la qualité, pas seulement de la connectivité
- Coût en bande passante plus élevé, mais fiabilité supérieure
Détection : quelle est votre vitesse de réaction ?
La rapidité du failover dépend de la vitesse à laquelle vous détectez le problème. Méthodes de détection courantes :
Supervision de la santé du flux
Surveillez le flux entrant pour détecter :
- Perte de paquets : SRT le rapporte en temps réel
- Chutes de débit : une diminution soudaine du débit précède souvent une défaillance complète
- Images noires/figées : détection basée sur le contenu (avancée)
- Silence audio : perte du signal audio
Délais d’expiration
Définissez des délais agressifs mais réalistes :
| Méthode de détection | Délai typique | Notes |
|---|---|---|
| Perte de paquets SRT | <50ms | Les statistiques SRT sont instantanées |
| Déconnexion TCP | 1-5s | Dépend du timeout TCP |
| Seuil de débit | 200-500ms | Fenêtre configurable |
| Analyse de contenu | 500ms-2s | Gourmand en calcul |
L’objectif des 50ms
Les équipements de diffusion professionnels visent un failover inférieur à 50ms. Cela signifie :
- Défaillance détectée en 20ms
- Commande de basculement émise en 10ms
- Le tampon de sortie absorbe la transition en 20ms
À 50ms, le basculement est invisible pour les spectateurs — il se produit en 1 à 2 trames vidéo.
Modèles d’implémentation
Modèle 1 : failover au niveau de la passerelle
La passerelle gère elle-même la logique de failover. C’est l’approche la plus simple et la plus fiable.
Vajra Cast l’implémente nativement :
- Configurez les entrées principale et de secours
- Définissez les seuils de détection (pourcentage de perte de paquets, débit plancher, timeout)
- La passerelle bascule automatiquement et enregistre chaque événement
- Quand le principal se rétablit, elle rebascule (configurable)
Modèle 2 : redondance au niveau de l’encodeur
Faites fonctionner deux encodeurs indépendamment, chacun envoyant vers la passerelle :
Caméra → Encodeur A → SRT → Passerelle
Caméra → Encodeur B → SRT → Passerelle (secours)
Cela protège contre les défaillances de l’encodeur, pas uniquement contre les défaillances réseau.
Modèle 3 : redondance géographique
Pour les diffusions critiques, répartissez sur plusieurs sites :
Encodeur site → SRT → Passerelle (Région A)
Encodeur site → SRT → Passerelle (Région B) [failover]
Les deux passerelles envoient vers le CDN. Le failover d’origine au niveau CDN constitue la dernière couche de protection.
Supervision et alertes
Un failover sans supervision, c’est voler à l’aveugle. Mettez en place :
- Tableaux de bord temps réel : visualisez simultanément les métriques de santé de toutes les entrées
- Alertes automatisées : soyez prévenu lors de l’activation du failover (Slack, email, webhook)
- Journalisation des événements : horodatez chaque basculement pour l’analyse post-incident
- Notifications de rétablissement : sachez quand le principal est de retour et stable
Tester votre failover
Ne faites jamais confiance à un système de failover que vous n’avez pas testé. Testez régulièrement :
- Exercices programmés : déconnectez le câble principal pendant un flux de test
- Simulation réseau : injectez de la perte de paquets avec des outils comme
tcpour tester la récupération SRT face au seuil de failover - Défaillance d’encodeur : arrêtez le processus de l’encodeur et mesurez le temps de basculement
- Test de rétablissement : vérifiez que le système retourne sur le principal après une défaillance
- Test de charge : confirmez que le failover fonctionne en conditions de pointe
Erreurs courantes
- Point de défaillance unique dans le commutateur lui-même : si votre dispositif de failover tombe en panne, tout tombe. Utilisez une passerelle éprouvée et fiable.
- Flux de secours non supervisé : votre secours pourrait être hors service au moment où vous en avez besoin. Supervisez les deux entrées en permanence.
- Délais d’expiration trop agressifs : basculer sur une perte de paquets momentanée crée des perturbations inutiles. Ajustez vos seuils avec soin.
- Pas de retour automatique : un “retour sur le principal” manuel signifie que quelqu’un doit être éveillé à 3h du matin.
- Pas de tests : la première fois que votre failover se déclenche ne devrait pas être pendant un événement en direct.
L’avantage Vajra Cast
Vajra Cast a été conçu avec le failover comme fonctionnalité centrale, pas comme un ajout postérieur :
- Failover multi-entrées avec chaînes de priorité configurables
- Basculement en moins de 50ms sur les entrées SRT
- Supervision de santé en temps réel avec métriques par entrée
- Rétablissement automatique avec temporisateurs de maintien configurables
- Journalisation complète de chaque événement de failover
- Agnostique en protocole — le failover fonctionne avec les entrées SRT, RTMP et HLS
Configurez-le une fois pour protéger vos diffusions.