Clé à emporter
- Un nouveau collectif de développeurs construit des modèles d'IA open source.
- Le groupe utilise des modèles massifs de formation linguistique qu'il publiera sous licences ouvertes.
- L'IA open source pourrait aider à rendre la puissance potentiellement révolutionnaire de la nouvelle technologie moins sujette aux biais et aux erreurs.
Il y a beaucoup de recherches sur l'intelligence artificielle par de grandes entreprises (IA), mais un groupe en ligne veut démocratiser le processus.
EleutherAI est un collectif récemment formé de chercheurs, d'ingénieurs et de développeurs bénévoles qui se concentrent sur la recherche en IA open source. L'organisation utilise les bases de code GPT-Neo et GPT-NeoX pour former des modèles de langage massifs qu'elle prévoit de publier sous des licences ouvertes.
"Les données open source profitent aux chercheurs car les scientifiques disposent de plus de ressources gratuites à utiliser pour former des modèles et effectuer des recherches", a déclaré Edward Cui, PDG de la société d'intelligence artificielle Graviti, à Lifewire dans une interview par e-mail. Son entreprise n'est pas impliquée dans EueutherAI. "Nous savons que des dizaines de projets d'IA ont été retardés par un manque général de données de haute qualité provenant de cas d'utilisation réels, il est donc essentiel d'établir des directives qui garantissent la qualité des données, avec l'aide de la communauté participante."
C'est le chemin
Les débuts de l'EleutherAI étaient modestes. L'année dernière, un chercheur indépendant en intelligence artificielle nommé Connor Leahy a posté le message suivant sur un serveur Discord: "Hé les gars, laissez [SIC] donner à OpenAI du fil à retordre comme au bon vieux temps."
Et ainsi, le groupe s'est formé. Il compte désormais des centaines de contributeurs qui publient leur code sur le référentiel de logiciels en ligne GitHub.
Les efforts d'IA en open source ne sont pas nouveaux. En fait, la plate-forme de gestion de flux de travail Airflow d'Airbnb et le moteur de découverte de données de Lyft sont le résultat de l'utilisation d'outils open source pour permettre aux équipes de données de mieux travailler avec les données, a souligné Ali Rehman, chef de projet pour la société de logiciels CloudiTwins dans un entretien par e-mail avec Lifewire.
"Tout comme la révolution open source a conduit à une transformation du développement logiciel, elle a également été le moteur du développement et de la démocratisation de la science des données et de l'intelligence artificielle", a déclaré Rehman. "L'open source est devenu un catalyseur essentiel des solutions de science des données d'entreprise, la majorité des data scientists utilisant des outils open source."
Ouvrir la porte
Le développement d'une IA open source pourrait aider à rendre la puissance potentiellement révolutionnaire de la nouvelle technologie moins sujette aux biais et aux erreurs, selon certains observateurs.
La recherche sur l'IA se déroule désormais principalement à l'air libre, presque toutes les entreprises, laboratoires de recherche et universités présentant leurs résultats immédiatement dans des publications savantes, a déclaré Kush Varshney, chercheur en IA chez IBM, à Lifewire dans une interview par e-mail.
"Cette communauté ouverte est essentielle, car elle fournit des niveaux améliorés de freins et contrepoids pour garantir que l'IA est recherchée, créée, déployée et appliquée de manière responsable", a ajouté Varshney. "Cela est particulièrement critique dans les situations où ces systèmes peuvent influencer la vie des membres les plus vulnérables de la société. Cette ouverture s'applique non seulement à l'apprentissage automatique général et aux algorithmes d'apprentissage en profondeur, mais également aux éléments d'IA dignes de confiance."
Rehman a déclaré que l'une des principales différences entre les logiciels propriétaires et open source est la flexibilité et la personnalisation. La recherche propriétaire sur l'IA aura des problèmes de sécurité, de mises à jour et d'optimisations.
"C'est parce que l'approche open source basée sur la communauté bénéficie de la contribution précieuse de milliers d'experts de l'industrie qui identifient les vulnérabilités de sécurité potentielles qui sont ensuite corrigées plus rapidement", a ajouté Rehman."Le consensus de la communauté signifie que la qualité est garantie et que de nouvelles opportunités sont plus facilement identifiées."
Un autre problème est que la recherche propriétaire sur l'IA ne sera pas interopérable, ce qui signifie qu'elle ne peut pas fonctionner avec différents formats de données et qu'elle sera probablement verrouillée par un fournisseur, ce qui empêchera les entreprises de tester et d'essayer le logiciel avant de s'engager dans une solution, Rehman a dit.
Mais tous les aspects de la recherche sur l'IA ne doivent pas nécessairement être open source, a déclaré Chris Kent, PDG de la société d'IA médicale Reveal Surgical, à Lifewire dans une interview par e-mail. "Il est important de protéger les incitations économiques qui stimulent le développement commercial des applications clés de l'IA", a-t-il déclaré.
Cependant, la recherche sur l'IA a besoin d'un composant open source robuste, a déclaré Kent. Il a ajouté que l'open source permet d'établir la confiance et d'utiliser des ensembles de données qui ne sont pas ou ne devraient pas être contrôlés par des institutions ou des entreprises uniques.
"Une approche open source est le meilleur moyen d'identifier et de compenser les biais sous-jacents qui peuvent exister dans les ensembles de formation et conduira à des applications plus holistiques, créatives et fiables de l'IA", a déclaré Kent.