Retouche d'image : Apple publie un modèle IA sur Github (MGIE)

Retouches d’image : Apple publie un modèle IA sur Github

La preuve qu’Apple investit massivement dans l’intelligence artificielle ? Un nouveau modèle de retouche d’image avec IA vient d’être présenté. Le document de conférence a été publié à l’occasion de l’ICLR 2024. Le développement se fait en open source.

Par petites touches, les avancées d’Apple dans l’intelligence artificielle se font au grand jour. L’entreprise californienne vient en effet de mettre en ligne MGIE (Guiding Instruction-based Image Editing via Multimodal Large Language Models).

Ce modèle permet de modifier une image en utilisation des indications IA données de manière totalement naturelle : les changements peuvent être très généraux ou plus élaborés. Par exemple, on peut modifier les vêtements d’une personne ou encore effacer certains éléments d’une photo (à l’image de la gomme magique des téléphones Pixel de Google).

Le modèle a été élaboré en collaboration avec des chercheurs de l’UC Santa Barbara. L’idée ici est d’exploiter l’IA pour l’édition d’images, mais en guidant les retouches par un texte.

Pour Apple, il s’agit de démontrer ainsi que l’on peut considérablement améliorer le contrôle et l’accessibilité de la manipulation visuelle en suivant des commandes humaines.

  • Le document de conférence est accessible en PDF
  • On peut suivre le développement sur Github
  • Une démo (via un navigateur web) est proposée depuis cette page sur Huggingface.  Bonne nouvelle : cette démo fonctionne non seulement sur Safari, mais également sur Firefox et pour les navigateurs basés sur Chromium.
Retour en haut