D’importantes percées révolutionnaires s’annoncent dans le champ de l’intelligence artificielle (IA), portées par une nouvelle technologie exploitant la lumière. Cette innovation pourrait démultiplier par 25 la puissance de ChatGPT, une IA développée par des chercheurs du MIT. Ils ont élaboré une méthode de Machine Learning innovante qui ouvre la voie à des IA 25 fois plus puissantes que ChatGPT, tout en étant 100 fois plus écoénergétiques. Une avancée majeure qui pourrait même hisser la puissance d’un smartphone au niveau d’un centre de données…
Durant les mois récents, ChatGPT a engendré des retombées positives dans diverses industries, en raison de sa capacité à générer du texte voire du code informatique à partir d’instructions simples. À présent, une équipe de scientifiques du MIT franchit une étape significative en mettant au point un système susceptible de créer des IA nettement plus performantes que celles utilisées par ChatGPT.
En outre, ce système serait nettement plus économe en énergie que les superordinateurs de pointe actuellement nécessaires pour exécuter les modèles de Machine Learning. Mais en quoi consiste précisément cette nouvelle technologie ? Leur système réalise des calculs en tirant parti des propriétés de la lumière plutôt que des électrons, en utilisant de multiples lasers à l’échelle microscopique.
Cette approche pourrait accroître l’efficacité énergétique de 100 fois et augmenter la densité de calcul de 25 fois par rapport aux méthodes conventionnelles employées dans le domaine du Machine Learning. L’équipe de chercheurs souligne que ce n’est que le début, et que des améliorations futures pourraient considérablement renforcer la puissance et l’efficacité de cette technologie.
Votre smartphone va être autant performant qu’un Data Center
Ainsi, les chercheurs soulignent que cette méthode « pave la voie à la création de processeurs optoélectroniques à grande échelle, capables d’accélérer les opérations d’apprentissage automatique, de la centralisation dans les centres de données jusqu’à l’inclusion dans les périphériques ».
En résumé, cela pourrait signifier que des appareils tels que les smartphones et autres dispositifs compacts pourraient éventuellement exécuter des programmes qui actuellement requièrent la puissance de vastes fermes de serveurs…
De plus, ce qui est encore plus intéressant, c’est que les composants de ce système pourraient être fabriqués en utilisant les méthodes de production déjà en cours d’utilisation aujourd’hui. En conséquence, cette technologie pourrait arriver sur le marché en seulement quelques années.
Un exemple concret est l’utilisation répandue des lasers dans la transmission de données et la reconnaissance faciale, comme c’est le cas avec le système Face ID de l’iPhone.
La solution qui va booster l’agent conversationnel ChatGPT
D’après l’un des chercheurs principaux du projet, Dirk Englund, les capacités actuelles de ChatGPT sont entravées par les limites de puissance de calcul des superordinateurs actuels. En raison de cette contrainte, il n’est actuellement pas justifiable sur le plan économique de développer des modèles de taille supérieure.
En conséquence, leur nouvelle technologie ouvre la voie à d’énormes avancées pour les modèles de Machine Learning, des avancées qui seraient autrement inatteignables à court terme.
En imaginant une augmentation de puissance de calcul de l’ordre de 100 fois, on peut se demander quelles performances ChatGPT pourrait atteindre. Cette question reste encore sans réponse, même pour les chercheurs qui travaillent sur le projet.
Une architecture unique et moderne pour les réseaux de neurones optiques
Opter pour la lumière au lieu des électrons dans les réseaux de neurones profonds offre des avantages significatifs. Cela englobe une réduction de la consommation énergétique ainsi qu’une amélioration de la bande passante et de la densité de calcul. La capacité de la lumière à transmettre davantage d’informations sur une surface plus petite est particulièrement remarquable. Cependant, les réseaux de neurones optiques (ONN) actuellement en usage présentent des limitations notables. Leur consommation énergétique est élevée en raison de leur inefficacité à convertir les données électriques en signaux lumineux.
En outre, les composants requis pour les ONN sont encombrants et requièrent un espace considérable. Même s’ils sont performants pour les calculs linéaires comme les additions, leur efficacité diminue pour les calculs non linéaires tels que les multiplications.
Afin de relever ces défis, les chercheurs ont élaboré une architecture novatrice et compacte. Cette conception repose sur l’utilisation de réseaux de lasers verticaux à émission de surface (VCSEL), une technologie relativement récente utilisée dans divers domaines tels que l’impression laser et les capteurs LIDAR.
Une équipe à la pointe de l’intelligence artificielle, sous la direction de Dirk Englund, a récemment accompli cette percée majeure. En 2019, cette même équipe avait jeté les bases théoriques qui ont finalement abouti à la mise en œuvre actuelle.
Parmi les chercheurs engagés dans ce projet figurent des individus tels que Ryan Hamerlu, Alexander Sludds, Ronald Davis, Ian Christen, Liane Bernstein et Lamia Ateshian, tous rattachés au Research Laboratory of Electronics. De plus, Tobias Heuser, Niels Heermeier, James A. Lott et Stephan Reitzenstein de l’Université Technique de Berlin ont contribué de manière significative à cette avancée remarquable.