Nouvelles Du Monde

Cerebras dévoile de nouveaux partenariats pour le LLM et les outils d’IA générative

Cerebras dévoile de nouveaux partenariats pour le LLM et les outils d’IA générative

Consultez les sessions à la demande du sommet Low-Code/No-Code pour apprendre à innover avec succès et à gagner en efficacité en améliorant et en faisant évoluer les développeurs citoyens. Regarde maintenant.


Les grands modèles de langage (LLM) font actuellement parler d’eux dans le monde de l’IA, mais leur formation peut être difficile et coûteuse ; les modèles avec plusieurs milliards de paramètres nécessitent des mois de travail par des ingénieurs expérimentés pour se mettre en place et fonctionner (de manière fiable et précise).

Une nouvelle offre conjointe de Cerebras Systems et Cirrascale Cloud Services vise à démocratiser l’IA en donnant aux utilisateurs la possibilité de former des modèles de classe GPT beaucoup moins cher que les fournisseurs existants – et avec seulement quelques lignes de code.

“Nous pensons que les LLM sont sous-médiatisés”, Andrew Feldman, PDG et cofondateur de Systèmes Cérébras dit dans un pré-briefing. “Au cours de la prochaine année, nous assisterons à une augmentation considérable de l’impact des LLM dans divers secteurs de l’économie.”

De même, l’IA générative est peut-être l’une des avancées technologiques les plus importantes de l’histoire récente, car elle permet d’écrire des documents, de créer des images et de coder des logiciels à partir d’entrées de texte ordinaires.

Événement

Sommet sur la sécurité intelligente

Découvrez le rôle critique de l’IA et du ML dans la cybersécurité et des études de cas spécifiques à l’industrie le 8 décembre. Inscrivez-vous pour votre laissez-passer gratuit aujourd’hui.

S’inscrire maintenant

Lire aussi  Les tempêtes solaires et les astéroïdes ont donné à Mercure une queue semblable à une comète ; La même chose peut-elle arriver à la Terre ?

Pour aider à accélérer l’adoption et à améliorer la précision de l’IA générative, Cerebras a également annoncé aujourd’hui un nouveau partenariat avec la plateforme de contenu d’IA Jaspe IA.

“Nous avons vraiment l’impression que le prochain chapitre de l’IA générative est constitué de modèles personnalisés qui s’améliorent continuellement”, a déclaré Dave Rogenmoser, PDG de Jasper.

La première étape de la technologie était “vraiment excitante”, a-t-il dit, mais “elle est sur le point de devenir beaucoup, beaucoup plus excitante”.

Libérer les opportunités de recherche

Par rapport aux LLM, les fournisseurs de cloud traditionnels peuvent rencontrer des difficultés car ils ne sont pas en mesure de garantir la latence entre un grand nombre de GPU. Feldman a expliqué que la latence variable engendre des défis complexes et chronophages dans la distribution d’un grand modèle d’IA entre les GPU, et qu’il y a “de grandes variations de temps pour s’entraîner”.

Le nouveau Cerebras AI Model Studio, qui est hébergé sur le Nuage d’innovation IA Cirrascale, permet aux utilisateurs de former des modèles de classe de transformateurs génératifs (GPT), y compris GPT-J, GPT-3 et GPT-NeoX, sur des clusters Cerebras Wafer-Scale. Cela inclut le supercalculateur Andromeda AI récemment annoncé.

Les utilisateurs peuvent choisir parmi des modèles de classe GPT à la pointe de la technologie, allant de 1,3 milliard de paramètres à 175 milliards de paramètres, et suivre une formation avec un temps de précision huit fois plus rapide que sur un A100, et à la moitié du prix du cloud traditionnel fournisseurs, a déclaré Feldman.

Lire aussi  Événements astronomiques de juillet 2023

Par exemple, le temps de formation sur GPT-J avec un cloud traditionnel prend environ 64 jours à partir de zéro ; le Cerebras AI Model Studio réduit cela à huit jours à partir de zéro. De même, sur les clouds traditionnels, les coûts de production sur les GPU seuls peuvent atteindre 61 000 USD ; tandis que sur Cerebras, il est de 45 000 $ pour le cycle de production complet.

Le nouvel outil élimine le besoin de devops et de programmation distribuée ; la numérisation du modèle à bouton-poussoir peut aller de un à 20 milliards de paramètres. Les modèles peuvent être formés avec des longueurs de séquence plus longues, ouvrant ainsi de nouvelles opportunités de recherche.

“Nous débloquons une capacité fondamentalement nouvelle de recherche à cette échelle”, a déclaré Andy Hock, responsable produit de Cerebras.

Comme Feldman l’a noté, la mission de Cerebras est “d’élargir l’accès à l’apprentissage en profondeur et d’accélérer rapidement les performances des charges de travail d’IA”.

Son nouveau AI Model Studio est “facile et extrêmement simple”, a-t-il déclaré. “Nous avons organisé cela pour que vous puissiez sauter dessus, vous pouvez pointer, vous pouvez cliquer.”

Accélérer le potentiel de l’IA

Pendant ce temps, le jeune Jasper (fondé en 2021) utilisera le supercalculateur Andromeda AI de Cerebras pour former ses modèles de calcul intensif en « une fraction du temps », a déclaré Rogenmoser.

Comme il l’a noté, les entreprises veulent des modèles personnalisés, “et elles les veulent vraiment”.

“Ils veulent que ces modèles s’améliorent, s’auto-optimisent en fonction des données d’utilisation passées, en fonction des performances”, a-t-il déclaré.

Lire aussi  Le chromosome Y n'a pas d'effet toxique sur la longévité des individus XY

Dans son travail initial sur les petites charges de travail avec Andromeda – qui a été annoncé ce mois-ci à SC22la conférence internationale sur le calcul haute performance, la mise en réseau, le stockage et l’analyse – Jasper a découvert que le supercalculateur accomplissait un travail que des milliers de GPU étaient incapables de faire.

La société s’attend à “faire considérablement progresser le travail d’IA”, y compris en formant des réseaux GPT pour adapter les sorties d’IA à tous les niveaux de complexité et de granularité de l’utilisateur final. Cela permettra à Jasper de personnaliser rapidement et facilement le contenu de plusieurs catégories de clients, a déclaré Rogenmoser.

Le partenariat “nous permet d’inventer l’avenir de l’IA générative en faisant des choses qui ne sont pas pratiques ou tout simplement impossibles avec une infrastructure traditionnelle”, a-t-il déclaré.

Les produits de Jasper sont utilisés par 100 000 clients pour rédiger des textes destinés au marketing, des publicités, des livres et d’autres supports. Rogenmoser a décrit l’entreprise comme éliminant “la tyrannie de la page blanche” en servant de “copilote d’IA”.

Comme il l’a dit, cela permet aux créateurs de se concentrer sur les éléments clés de leur histoire, “pas sur le banal”.

La mission de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques d’acquérir des connaissances sur la technologie d’entreprise transformatrice et d’effectuer des transactions. Découvrez nos Briefings.

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT