Qu'est ce un modèle?
Un modèle est un type d'outil de prédiction dans le domaine de l'intelligence artificielle, généralement conçu pour un type de scénario spécifique. Ces modèles sont utilisés pour anticiper divers résultats - des tendances météorologiques et boursières aux résultats sportifs et à l'identification du contenu des images. Le point commun entre ces modèles est leur capacité à prendre des inputs de base (comme les données météorologiques actuelles) et à réaliser une prédiction (comme les prévisions de demain), souvent accompagnée d'un niveau de confiance.
L'exactitude et la fiabilité de ces prédictions peuvent varier considérablement. Avant l'avènement des modèles GPT, il n'y avait pas de modèle efficace capable de prédire avec précision la suite d'une "entrée de texte".
Cependant, OpenAI a innové en créant une nouvelle catégorie de modèles connus sous le nom de transformateurs pré-entrainés génératifs (GPT), qui ont amélioré cela de manière significative. Ces modèles GPT peuvent effectivement 'prolonger' un texte d'entrée dans de nombreuses circonstances, égalant, voire surpassant la vitesse et la compétence d'un humain moyen.
Comme "l'entrée de texte" (text input) est un concept largement applicable, ces modèles GPT peuvent être utilisés pour une gamme de tâches, allant de la réponse à des requêtes jusqu'à l'écriture de code, en passant par le respect des requêtes d'édition et de formatage.
En résumé, un modèle GPT est un outil de prévision utilisé pour du contenu textuel.
Histoire des différents modèles d'OpenAI
Avant de comprendre les différences entre ces différents modèles, faisons un retour en arrière dans le passé proche pour comprendre les modèles GPT qu'OpenAI a publiés au cours des 7 dernières années de son existence.
GPT (Generative Pretrained Transformer) : Sorti en 2018, le modèle GPT a constitué une percée dans le domaine de la compréhension et de la génération du langage. Il a été pré-entrainé sur une gamme diversifiée de textes provenant d'internet, mais il n'était pas sans ses limites, produisant parfois des réponses créatives mais aussi parfois absurdes.
GPT-2 : Introduit en 2019, GPT-2 était une mise à niveau directe de son prédécesseur, offrant plus de paramètres et de meilleures performances. Le modèle complet n'a pas été publié initialement, en raison de préoccupations concernant une utilisation potentielle abusive. Cependant, il a ensuite été entièrement open-source (mis à disposition du grand public) plus tard dans l'année.
GPT-3 : La troisième itération, sortie en 2020, a augmenté la capacité du modèle de manière significative, avec 175 milliards de paramètres d'apprentissage automatique. Ce modèle était capable de générer des réponses impressionnantes par leur cohérence et leur pertinence contextuelle, surpassant même ses prédécesseurs dans la traduction, la réponse aux questions et d'autres tâches.
Variants de GPT-3 "fine-tuned" : OpenAI a également publié certains modèles GPT-3 qui ont été affinés pour des tâches spécifiques. Par exemple, le modèle ChatGPT (techniquement GPT-3.5), une version de GPT-3, a été spécifiquement affiné pour générer des réponses conversationnelles.
GPT-4, sorti en 2023, est le modèle le plus avancé jusqu'à présent avec 1 milliard de paramètres. Lors des tests internes, le modèle a réussi à se classer dans le 94e percentile (meilleurs que 94% des étudiants) au SAT (examen de fin de lycée aux USA), le 88e percentile au LSAT (Law School Admission Test), et le 90e percentile à l'examen du barreau (examen d'avocat). Ces résultats sont remarquables par rapport au modèle précédent, GPT-3.5, qui a obtenu des scores dans le 82e percentile au SAT, le 40e percentile au LSAT, et seulement le 10e percentile à l'examen du barreau.
Alors, quelles sont les différences entre les modèles GPT-3, GPT-3.5 et GPT-4 ?
Les modèles de la gamme GPT-3 sont conçus pour générer du texte en réponse à des directives spécifiques, mais ils ne sont pas aussi efficaces pour générer des réponses fluides et conversationnelles. Le modèle le plus performant de cette catégorie est text-davinci-003, bien qu'il soit plus cher. Au tout début de GPT Workspace, tous nos services utilisaient text-davinci-003, qui est aussi assez lent.
La série GPT-3.5, également connue sous le nom de ChatGPT, qui a été lancée le 1er mars 2023, est conçue pour mettre l'accent sur la conversation via la possibilité de "chat". Ces modèles peuvent également gérer des signaux d'instruction avec une certaine expertise, similaires à celle de text-davinci-003. Cependant, dans certaines situations, ils peuvent générer des réponses qui sont un peu plus verbeuses ou plus fantaisistes que nécessaire. Cependant, ce ne sont pas de réels inconvénients car ce modèle fonctionne extrêmement bien sur la plupart des tâches, est également extrêmement rapide et peu coûteux à utiliser. Comparé à la dernière version de Bard AI, le concurrent des modèles GPT de Google, il a tendance à être plus logique et à beaucoup moins "halluciner" (inventer des réponses imaginaires).
Les modèles GPT-4, sont le dernier modèle d'openAI, il s'agit actuellement du summum des modèles GPT (disponible uniquement pour nos membres Premium) et probablement le modèle le plus intelligent disponible sur le marché. Extrêmement bon en raisonnement, il excelle également en écriture, en invention et en raisonnement déductif. OpenAI a également annoncé la multimodalité (la capacité d'exécuter des requêtes via des images et d'autres types de médias, pas seulement du texte). Il est également capable de faire des calculs mathématiques extrêmement complexes, une fonctionnalité que GPT-3.5 n'était tout simplement pas capable de faire. Ses principaux défauts sont qu'il est lent et cher, tellement cher qu'OpenAI limite (au moment de l'écriture de cet article) même ses clients payants à 25 messages toutes les 3 heures.
Alors, quel modèle choisir ?
Pour les tâches liées à la productivité, la réponse courte est : GPT-3.5 Turbo. Ce modèle est particulièrement bon avec tout ce qui est lié à Google Sheets pour fournir rapidement des résultats et remplir rapidement des cellules, des listes et des tableaux.
Cependant, pour une utilisation professionnelle et pour les personnes qui ne se soucient pas de la latence, l'utilisation de GPT-4 surpassera largement tous les autres modèles. Beaucoup de gens attendent GPT-4-Turbo, mais il faudra probablement un certain temps avant qu'il ne soit disponible.
Les modèles plus anciens comme text-davinci-003 ont simplement été retirés de GPT Workspace, car ils ne fournissaient pas les performances attendues par nos utilisateurs.
Conclusion
En conclusion, la série de modèles GPT d'OpenAI a révolutionné le domaine de la compréhension et de la génération du langage. Du premier modèle GPT au dernier GPT-4, chaque itération a apporté des améliorations significatives en termes de paramètres, de performances et de capacités spécifiques. Alors que les modèles GPT-3 excellent dans la génération de texte en réponse à des directives spécifiques, le GPT-3.5 Turbo brille dans les tâches liées à la conversation et à la productivité. GPT-4, bien qu'étant plus lent et plus coûteux, est inégalé dans ses capacités d'intelligence et de raisonnement. Le choix entre ces modèles dépend largement des cas d'utilisation spécifiques et des exigences. Alors que nous anticipons la sortie de GPT-4 Turbo, nous ne pouvons qu'imaginer les avancées qu'il apportera. Comprendre les caractéristiques uniques et les capacités de chaque modèle peut aider les utilisateurs à prendre les bonnes décisions et à exploiter pleinement la puissance de ces outils d'IA. Nous espérons que cet article vous a donné une meilleure compréhension des modèles GPT d'OpenAI et de leur évolution et vous aidera à mieux choisir un modèle lors de l'utilisation de GPT Workspace.
Comprendre les jetons ("tokens") GPT d'OpenAI : Un guide complet