C’est une attaque frontale contre le modèle économique des GAFAM. Une équipe de chercheurs de l’École Polytechnique Fédérale de Lausanne (EPFL) a développé un logiciel qui rend obsolète le besoin de centres de données massifs pour exécuter l’intelligence artificielle. Leur solution, nommée Anyway Systems, permet aux entreprises et administrations de faire tourner des modèles d’IA open source (comme un GPT-120B d’OpenAI) sur leurs propres machines locales, sans jamais envoyer la moindre donnée sensible dans le cloud.
L’enjeu est colossal, car l’inférence — le processus de réponse aux requêtes IA — représente entre 80 et 90 % de la puissance de calcul liée à l’IA. C’est ce qui fait gonfler la facture écologique et la dépendance aux Big Tech. La technologie présentée en Suisse permet aux utilisateurs de télécharger des modèles d’IA open source (notamment Apertus, dont nous vous parlions dans cet article) et de les exécuter sur des réseaux d’ordinateurs ordinaires sans envoyer aucune donnée à des services cloud tiers
La preuve par quatre : un modèle géant pour 9200 €
Pendant des années, on nous a fait croire que faire tourner une IA de la taille de ChatGPT nécessitait des racks spécialisés coûtant plus de 100 000 francs suisses. Anyway Systems prouve le contraire. Le logiciel coordonne et combine des machines sur un réseau local pour créer un cluster sur site. Pour un modèle aussi grand que le GPT-120B, il ne faut plus qu’un minimum de quatre machines équipées d’une carte graphique standard. Le coût unitaire de ces GPU est d’environ 2 300 CHF (environ 2 400 €).
« Pendant des années, les gens ont cru qu’il n’était pas possible d’avoir de grands modèles de langage et des outils d’IA sans ressources énormes… mais ce n’est pas le cas et des approches plus intelligentes et frugales sont possibles », a déclaré le Professeur Rachid Guerraoui, chef du Laboratoire de calcul distribué (DCL).
Confidentialité, souveraineté et écologie
Anyway Systems répond directement à trois préoccupations.
Premièrement, la confidentialité est garantie car aucune donnée n’est envoyée à des services cloud tiers ; les dossiers patients, les requêtes clients et les documents confidentiels restent entièrement sécurisés au sein du réseau local.
Deuxièmement, le logiciel renforce la souveraineté en permettant aux pays et aux entreprises de reprendre le contrôle de leur infrastructure, réduisant ainsi la dépendance aux corporations transnationales qui dominent actuellement les données et les algorithmes.
Enfin, cette approche favorise la durabilité : l’optimisation des ressources locales permet de contredire l’idée que le déploiement de l’IA nécessite l’expansion des centres de données traditionnels et énergivores.
Le logiciel utilise des techniques d’auto-stabilisation initialement développées pour la blockchain et les a adaptées à l’IA, avec un succès inattendu. Le déploiement est simple : le cluster peut être installé en seulement une demi-heure. Bien qu’il puisse y avoir une légère perte de latence par rapport au cloud, les tests pilotes n’ont montré aucune perte de précision du modèle.
Pourquoi Apertus, le nouvel LLM open source suisse, pourrait changer la donne en Europe
Transformé en start-up, Anyway Systems est déjà testé par des entreprises et administrations en Suisse, y compris à l’EPFL. Si l’application ne fonctionne pas encore sur un seul PC à la maison, le professeur Guerraoui prédit que, comme l’histoire de l’informatique le montre, « nous serons en mesure de tout faire localement en termes d’IA ».
