La société israélienne Lightricks, connue pour son application d’édition photo Facetune, a dévoilé LTX-2, un modèle de base vidéo open source capable de générer simultanément l’audio et la vidéo en 4K à 50 images par seconde. Selon le communiqué officiel, il s’agit du premier modèle complet de ce type, avec une qualité « professionnelle » tout en restant accessible sur des cartes graphiques grand public.
Conçu pour la production, LTX-2 se distingue autant par sa vitesse que par son efficacité. Lightricks affirme qu’il peut produire une vidéo HD de six secondes en environ cinq secondes, soit jusqu’à vingt fois plus vite que Sora 2 d’OpenAI (propriétaire), tout en réduisant de moitié les coûts de calcul grâce à une pile d’inférence multi-GPU. La promesse est claire : rapprocher la puissance des modèles de recherche de la réalité du tournage et de la postproduction.
LTX-2 adopte une approche résolument ouverte, rare dans l’écosystème de la vidéo générative, avec une licence MIT. Ses composants principaux sont déjà accessibles sur GitHub, et la publication complète des poids du modèle est annoncée pour l’automne. Le précédent modèle, LTX-1, était diffusé sous licence Apache 2.0, laissant présager une continuité dans la philosophie de partage. Ce choix distingue Lightricks dans un marché dominé par les modèles fermés de Google et d’OpenAI, et ouvre la porte à une personnalisation libre pour les chercheurs, studios ou développeurs.
Sur le plan technique, LTX-2 parvient à générer image, mouvement, dialogues, sons d’ambiance et musique dans un seul flux, supprimant la nécessité de synchroniser l’audio et la vidéo en postproduction. Cette génération simultanée améliore considérablement la cohérence temporelle et narrative, un enjeu central pour les formats publicitaires, les courts-métrages ou les contenus destinés aux réseaux sociaux. Le modèle propose aussi un contrôle très fin sur le rendu, grâce au conditionnement multimodal (texte, image, audio, carte de profondeur ou vidéo de référence) et à des fonctions de direction artistique comme le fine-tuning LoRA ou la logique de caméra 3D.
Accessible via la plateforme LTX2.ai, LTX-2 offre trois paliers d’utilisation. Un accès par API est déjà proposé à certains partenaires, notamment Fal, Replicate et ComfyUI, avant une disponibilité élargie sur les places de marché d’ici la fin de l’année.
