Le marché des infrastructures d’intelligence artificielle n’en finit plus de se retourner. Alors que les développeurs se retrouvent trop souvent contraints de l’avouer face au monopole des grands laboratoires fermés, les solutions souveraines et indépendantes structurent leur riposte. La plateforme d’inférence serverless Featherless.ai vient de finaliser une levée de fonds de 20 millions de dollars (soit environ 17,2 millions d’euros) en Série A.
Ce tour de table stratégique a été co-dirigé par AMD Ventures et Airbus Ventures, avec la participation notable de BMW i Ventures, Panache Ventures, Kickstart Ventures et Wavemaker Ventures. Ce ralliement de grands conglomérats industriels démontre que la maîtrise de l’infrastructure IA est devenue un impératif critique, bien au-delà de la Silicon Valley.
Le « hot-swapping » pour terrasser les coûts du cloud
Fondée fin 2023 par Eugene Cheah, Harrison Vanderbyl et Wesley George, Featherless.ai a connu une trajectoire fulgurante. En à peine un an, la start-up est passée de 4 000 modèles hébergés à plus de 30 000 aujourd’hui, couvrant le traitement du langage, de la vision et de l’audio. Elle s’est ainsi imposée comme le plus grand fournisseur d’inférence open-weight sur Hugging Face, traitant plus de 6 milliards de tokens par jour.
L’innovation technique majeure de Featherless repose sur une méthode logicielle de permutation à chaud (hot-swapping). Cette technologie permet de charger et de libérer des modèles d’IA sur les processeurs graphiques (GPU) en moins de cinq secondes en fonction de la demande. En éliminant les temps d’inactivité du matériel, la plateforme optimise l’usage des puces à un niveau que les services cloud traditionnels peinent à atteindre.
En finir avec la facturation au token
Cette efficacité technique permet à Featherless d’attaquer frontalement le modèle économique dominant de l’industrie : la facturation au token. La start-up propose un système d’abonnement à capacité fixe, débutant à 10 dollars par mois (environ 8,60 €), offrant des requêtes illimitées. La tarification se différencie uniquement par la taille des modèles et le nombre de connexions simultanées, supprimant de fait la barrière psychologique de l’évaluation des coûts à la volée.
Cette approche prend tout son sens avec l’avènement des flux de travail « agentiques ». En mars dernier, la start-up a lancé Managed OpenClaw, un environnement d’exécution géré et sécurisé en sandbox pour les assistants autonomes. Ces agents effectuent de nombreuses opérations de réflexion en arrière-plan, un cas d’usage qui s’avère financièrement prohibitif sous les grilles tarifaires des API propriétaires classiques.
Le choix de la diversité matérielle et de la neutralité
Face aux risques de dépendance technologique, l’alliance avec AMD Ventures s’avère hautement politique. Featherless s’assure que les principaux modèles open source mondiaux s’exécutent de manière native sur la plateforme libre ROCm d’AMD, offrant une véritable alternative à l’écosystème hégémonique de Nvidia.
L’infrastructure de Featherless, répartie équitablement entre l’Union européenne et les États-Unis, se positionne comme une couche neutre, déconnectée des intérêts des grands fournisseurs de cloud. Pour l’équipe fondatrice, l’indépendance de l’IA ne dépend plus seulement de l’ouverture du code des modèles, mais de la liberté de choisir le matériel et le pays où les données sont traitées.
