Nouvelles Du Monde

Nous jouons avec l’API ChatGPT. Nous avons connecté notre assistant vocal Živák à l’intelligence artificielle – Živěcz

Nous jouons avec l’API ChatGPT.  Nous avons connecté notre assistant vocal Živák à l’intelligence artificielle – Živěcz

Au cours des six derniers mois, le monde s’est assis sur le cul de ChatGPT, du nouveau Bing et d’autres IA textuelles du soi-disant grands modèles de langage (LLM), cependant, les lecteurs réguliers de notre série de bricolage sont restés glacials.

Elle maîtrisait déjà la plupart des connaissances pratiques du robot des laboratoires OpenAI il y a deux ans technologie de pointe de Brno nommé assistant vocal Živak!

Eh bien, ce n’était pas si révolutionnaire, mais cela a révélé un peu le nombre de robots et de moteurs de recherche sémantiques et apparemment omniscients qui fonctionnaient jusqu’à cette époque.

Regardez la vidéo de la façon dont nous avons connecté la technologie ChatGPT à notre assistant vocal Živák :

Avant l’avènement de l’IA, Wikipédia fournissait l’intelligence

À l’époque, des programmes similaires mettaient toute leur logique dans une ressource très vaste basée sur la connaissance et sans licence que vous connaissez tous très bien, à savoir Wikipedia et ses API pour les développeurs.

Alors, quand nous avons posé une question à notre Živák Qu’est-ce que le paprika ?, lui-même n’a fait aucune analyse sémantique, mais a simplement transmis la chaîne de texte dans sa forme originale au serveur Wikipedia. Ce n’est qu’alors qu’elle s’est rendu compte que nous demandions probablement la date paprika et offert tous les articles disponibles sur le sujet.

Cliquez pour une image plus grande
Živák a entendu “Qu’est-ce que le paprika” et a cherché la réponse sur Wikipedia

Notre Živak a ensuite choisi le premier dans l’ordre et à nouveau via l’API a demandé à Wikipedia de renvoyer un bref résumé. Autrement dit, pas le texte de l’intégralité de l’article sur l’encyclopédie communautaire, mais seulement un perex rapide et riche en informations de quelques phrases, que notre robot a finalement affiché sur le moniteur et l’a lu via le synthétiseur vocal dans Windows 10/11 et la voix MicrosoftJakubName.

C’était efficace tout fonctionnait en chromeet même s’il ne contenait qu’une centaine de lignes de code HTML complet, y compris Javascript et commentaires, un profane pourrait penser qu’il communiquait vraiment avec une sorte d’IA sophistiquée que l’équipe de développeurs avait construite pendant des mois sur un superordinateur quelque part.

Mais où! Tout écolier d’Asie de l’Est axé sur la performance prendrait notre application de démonstration vers la gauche.

Aujourd’hui, nous allons connecter ChatGPT à Živák

Cependant, le temps a passé, aujourd’hui OpenAI est à la mode, donc après deux ans, nous connecterons également notre Živák à sa technologie. Nous ne répéterons pas en détail comment cela fonctionne réellement – ici, je vous renvoie aux parties précédentes :

Et nous allons entrer directement dans le vif du sujet.

Nouveau modèle gpt-3.5-turbo

OpenAI propose depuis un certain temps une interface d’application pour les développeurs, et sa documentation et ses conditions sont disponibles sur le site Web. plateforme.openai.com. Chaque utilisateur reçoit un crédit pour jouer au début, après quoi il doit créer un compte payant.

Aujourd’hui, la plate-forme OpenAI peut fonctionner avec toute une gamme de ses propres technologies, en commençant par la complétion et la classification du texte et en terminant par la génération d’images. Puis il y a quelques jours deux nouveaux modèles ont été ajoutés:

Lire aussi  L'avocate de Trump, Jenna Ellis, fait face à une plainte de radiation au Colorado

Alors que le premier modèle mentionné et continuellement amélioré sera mis à disposition par le bot ChatGPT, Chuchoter peut traduire la parole prononcée enregistrée par exemple en MP3 en texte.

Dans le monde des grands modèles de langage, vous ne payez pas pour le temps CPU, vous payez pour le traitement jetons, qui est leur plus petite unité d’information. Nous avons expliqué ce que sont les jetons dans le cas d’OpenAI et ChatGPT en utilisant plusieurs exemples dans un article séparé.

Je répéterai seulement qu’un jeton a en moyenne environ quatre caractères, et dans le cas du modèle gpt-3.5-turbo, qui a subi une optimisation massive depuis les premières versions, OpenAI facture 0,002 $ par millier de jetons. C’est un ordre de grandeur de moins qu’avant.

Tout d’abord, nous créons une clé API

Essayons-le dans la pratique. Supposons que vous ayez créé un compte sur le site Web de la plate-forme OpenAI, que vous disposiez d’un certain crédit pour commencer ou que vous payiez déjà pour l’accès, et vous avez généré votre clé APIavec lequel vous signerez des requêtes vers la plateforme OpenAI.

Cliquez pour une image plus grandeCliquez pour une image plus grande
Chaque nouvel utilisateur obtient un crédit d’essai au début et crée une clé d’accès à l’API

Ensuite, vous pouvez avec les neurones et leurs modèles communiquer via la bibliothèque dans l’un des nombreux langages de programmation pris en charge. OpenAI développe directement sa propre bibliothèque pour Python et Node.js, la communauté également pour PHP, C#, Java, Kotlin et d’autres technologies.

Et maintenant, nous allons poser des questions sur le poivre à partir de la ligne de commande

Cependant, vous pouvez également communiquer directement avec l’API via une simple requête HTTP. Donc, si vous avez un client HTTP texte pratiquement standard sur votre ordinateur aujourd’hui boucleune requête pour le robot ChatGPT comme suit :

« Qu’est-ce que le paprika ? Écrivez la réponse en tchèque”

Cela pourrait ressembler à ceci sur la ligne de commande :

curl  -H "Authorization: Bearer API klíč" -H "Content-Type: application/json" -d '{"model": "gpt-3.5-turbo", "messages": [{"role": "user", "content": "Co je to paprika? Odpověď napiš v češtině"}]}'

Décomposons-le brièvement :

  • https://api.openai.com/v1/chat/ est l’adresse HTTP de destination
  • -H “Autorisation : clé API du support” est un en-tête HTTP avec une clé API
  • -H “Type de contenu : application/json” est un en-tête HTTP avec le format de données
  • -dXXX sont des données HTTP POST au format JSON

La structure JSON avec les paramètres de requête a alors la forme suivante :

{
  "model": "gpt-3.5-turbo",
  "messages": [
    {
      "role": "user",
      "content": "Co je to paprika? Odpověď napiš v češtině"
    }
  ]
}

Et nous le décomposons à nouveau :

  • modèle est l’IA du menu OpenAI que nous voulons utiliser
  • rôle est le rôle de cette requête. Nous demandons en tant qu’utilisateur, donc utilisateur
  • contenu est la question elle-même en tchèque naturel

Notez que nous n’enveloppons pas la requête avec des paramètres. Par exemple, en identifiant la langue dans laquelle nous souhaitons recevoir une réponse. Du côté d’OpenAI, la requête textuelle est d’abord traduite en identifiants de jetons numériques et ceux-ci sont envoyés au réseau de neurones lui-même et à son modèle.

Lire aussi  Les crypto-monnaies comme Bitcoin montent en flèche malgré une période brutale : NPR
Cliquez pour une image plus grandeCliquez pour une image plus grande
Notre requête a été convertie en jetons d’architecture GPT-3. Essayez-le vous-même à tokeniser

Le modèle est en fait une structure statistique apprise des liens entre les jetons individuels, de sorte que l’IA peut estimer quelle séquence de jetons correspond le plus probablement à une autre séquence de jetons d’une longueur donnée.

Et voici à quoi ressemblera la réponse

Le traducteur/détokéniseur reconvertit la séquence de jetons générée en caractères lisibles, qu’il nous envoie finalement avec les statistiques calculées au format JSON.

Cliquez pour une image plus grande
Complétez la question et la réponse sur l’API OpenAI à partir de la ligne de commande

La réponse dans un format JSON exploitable par machine et sous une forme plus lisible peut alors ressembler à l’exemple ci-dessous dans le cas des poivrons. Mais attention, ChatGPT n’est pas Wikipédia, donc chaque réponse est quelque peu unique et peut sembler un peu différente de la précédente.

Réponse au format JSON :

{
  "id": "chatcmpl-6qmMNCSVreZN0Gw9JDvl93QGrMnJN",
  "object": "chat.completion",
  "created": 1678036971,
  "model": "gpt-3.5-turbo-0301",
  "usage": {
    "prompt_tokens": 28,
    "completion_tokens": 88,
    "total_tokens": 116
  },
  "choices": [
    {
      "message": {
        "role": "assistant",
        "content": "nnPaprika je pálivá nebo sladká koření, která se získává z různých odrůd paprikového pepře. Může být používána jako koření do jídel, jako zelenina, nebo se z ní vyrábí paprikový olej."
      },
      "finish_reason": "stop",
      "index": 0
    }
  ]
}

Nous n’expliquerons pas ce que représente exactement chacun des éléments de réponse – je pense que c’est assez clair à partir de l’exemple – donc seulement les plus importants. Dans la clé modèle nous voyons la version spécifique d’une IA donnée utilisée par OpenAI. Dans la clé rôle on voit qu’il s’agit d’une réponse en mode assistant, et sa formulation est dans la clé contenu.

La section est également très importante usage, qui nous indique combien de jetons nous avons consommés. La question elle-même les occupait 28une réponse assez courte alors 88. Mais pour des réponses plus élaborées, cela peut être des centaines. Il a complètement brûlé la question 116 jetons.

Et maintenant la même chose en pur Javascript et HTML

Cela fonctionne en ligne de commande avec le client HTTP curl, mais réécrivons maintenant le tout sous la forme d’un simple site Web qui fonctionnera localement sans aucun serveur en l’ouvrant simplement dans un navigateur.

Cliquez pour une image plus grande
Une simple interface Web de l’API ChatGPT

N’oubliez pas de définir la valeur de la variable openai_api_click un identifiant personnalisé que vous êtes généré sur le site OpenAI.



    
        Dotaz na ChatGPT pomocí API
        
    
    
        
         
        
        
        
        

Une page simple se compose d’une saisie de texte, d’un bouton et d’un conteneur qui affiche la réponse de ChatGPT et, pour une meilleure idée, les statistiques des jetons consommés.

Lorsque le bouton est cliqué via le client HTTP asynchrone intégré Récupérer l’API on se connecte au serveur OpenAI et après quelques secondes (selon la charge) on obtient une réponse en JSON.

Lire aussi  L’utilisation des transports publics a atteint un niveau record l’année dernière, dépassant les niveaux d’avant la pandémie

L’API Fetch simple est prise en charge par pratiquement tous les navigateurs Web actuels depuis des années, il n’est donc pas nécessaire de continuer à utiliser des bibliothèques externes telles que jQuery pour des banalités similaires.

Enfin, nous intégrons l’IA directement dans Živák

Comme vous pouvez le voir, le travail de base avec OpenAI est très simple, même avec des pages HTML simples, et pour d’autres langages, y compris le populaire Python, il existe des bibliothèques directement des créateurs de la technologie ou de la communauté.

Cliquez pour une image plus grande
Cette fois, Živak a envoyé la question “Qu’est-ce qu’un poivre” au serveur OpenAI et demande à être traitée par le modèle gpt-3.5-turbo qui se comporte comme le dernier ChatGPT

Mais nous nous contenterons du code ci-dessus, que nous utiliserons pour étendre notre Živak à partir de 2021. Dans l’état par défaut, nous enverrons toutes les entrées de texte que nous avons obtenues de la couche SST (Speech To Text) aux serveurs OpenAI.

Cependant, nous ne voulons pas nous débarrasser complètement de Wikipédia, donc Živak prendra en charge les deux sources de connaissances, ce qui convient pour comparer les capacités. Nous pouvons basculer entre les deux sources dans l’application sur le clavier.

Changement de source de recherche

Par défaut, Živak recherche une réponse sur Wikipédia. La source de recherche peut être commutée en appuyant sur les touches C et W :

  • C définit la source de recherche sur ChatGPT
  • O définit la source de recherche sur Wikipedia

Vous pouvez voir le code commenté de Živák dans un seul fichier HTML ci-dessous, et pour une compréhension plus approfondie, je vous redirigerai à nouveau vers les articles originaux, dans lesquels nous avons d’abord montré comment travailler avec la conversion de la voix en texte et vice versa sur Windows et Chrome , et par la suite, comment se connecter à Wikipédia, trouver des articles sur le sujet souhaité et en obtenir un bref résumé, que notre application affichera et racontera ensuite.

Code Živák qui utilise à la fois ChatGPT et Wikipedia

N’oubliez pas de remplacer le texte dans la variable dans le code openai_api_click un identifiant personnalisé que vous êtes généré sur le site OpenAI.




    Asistent Živák
    
    
    
    
        /* CSS styl stránky
         * Bez okraje, bez posuvníků
         * S rozložením tabulky
        */
        html, body{
            font-family: "Sofia Sans Semi Condensed", sans-serif;
            margin: 0;
            padding: 0;
            width: 100%;
            height: 100%;
            display: table;
            overflow: hidden;
            cursor: pointer;
        }
        /* CSS styl tagu s indetifikatorem vysledek
         * Pružná velikost písma podle výšky okna,
         * zobrazení jako tabulková buňka s vycentrovaným obsahem
        */
        #vysledek{
            font-size: 5vh;
            display: table-cell;
            text-align: center;
            vertical-align: middle;
            padding: 50px 50px;
        }
        /* CSS styl tagu s indetifikatorem informace
         * Druhý řádek tabulky, funkce patičky stránky
        */
        #informace{
            color: #bbbbbb;
            font-size: 3vh;
            display: table-row;
            text-align: center;
        }
        /* Třída stylu error pro obarvfení chyby do ruda */
        .error{
            color:coral;
        }


    
    


    
    
Klepni a na něco se zeptej
Budoucnost je nyní

Facebook
Twitter
LinkedIn
Pinterest

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

ADVERTISEMENT