¿Qué modelo de OpenAI elegir? ¿Cuál es la diferencia entre GPT-3.5 y GPT-4? Una breve guía que explica las diferencias entre los modelos de openAI de chatGPT, incluidos los modelos más antiguos como text-davinci-003.

 Dos robots frente a frente para simbolizar la inteligencia artificial

¿Qué es un modelo?

Un modelo es un tipo de herramienta de predicción en el campo de la inteligencia artificial, diseñado generalmente para un tipo de escenario específico. Estos modelos se utilizan para anticipar una variedad de resultados, desde patrones meteorológicos y tendencias del mercado de valores hasta resultados deportivos e identificación de contenido en imágenes. El hilo común entre estos modelos es su capacidad para tomar una determinada entrada (como los datos meteorológicos actuales) y generar una predicción (como el pronóstico de mañana), a menudo acompañada de un nivel de confianza.

 

La precisión y fiabilidad de estas predicciones pueden variar ampliamente. Antes del advenimiento de los modelos GPT, no existía un modelo eficiente capaz de predecir con precisión la continuación de una "entrada de texto".

 

Sin embargo, OpenAI fue pionero en una nueva categoría de modelos conocidos como transformadores generativos preentrenados (GPT), que mejoraron significativamente esto. Estos modelos GPT pueden 'extender' efectivamente un texto de entrada en muchas circunstancias, igualando o a veces superando la velocidad y la competencia de un humano promedio.

 

Dado que la "entrada de texto" es un concepto de amplia aplicabilidad, estos modelos GPT pueden ser empleados para una variedad de tareas, desde responder consultas y adherirse a pautas de edición/formato hasta incluso escribir código.

 

Entonces, en esencia, un modelo GPT es una herramienta de pronóstico para contenido textual.

Historia de los diferentes modelos de OpenAI

Antes de entender las diferencias entre estos diferentes modelos, vamos a hacer un viaje por la (corta) memoria y entender los modelos GPT que OpenAI ha lanzado durante los últimos 7 años de su existencia.

 

GPT (Transformador Generativo Preentrenado): Lanzado en 2018, el modelo GPT fue un gran avance en el dominio de la comprensión y generación del lenguaje. Fue preentrenado en una amplia gama de textos de internet, pero no estuvo exento de limitaciones, incluyendo la generación de respuestas creativas pero a veces sin sentido.

 

GPT-2: Introducido en 2019, GPT-2 fue una mejora directa a su predecesor, ofreciendo más parámetros y mejor rendimiento. Inicialmente, debido a preocupaciones sobre el posible mal uso, el modelo completo no fue liberado. Sin embargo, fue totalmente de código abierto más tarde ese mismo año.

 

GPT-3: La tercera iteración, lanzada en 2020, aumentó significativamente la capacidad del modelo, con 175 mil millones de parámetros de aprendizaje automático. Este modelo fue capaz de generar respuestas impresionantemente coherentes y contextualmente relevantes, superando a sus predecesores en traducción, respuesta a preguntas y otras tareas.

 

Variantes afinadas de GPT-3: OpenAI también lanzó algunos modelos GPT-3 que han sido afinados para tareas específicas. Por ejemplo, el modelo ChatGPT (técnicamente GPT-3.5), una versión de GPT-3, fue afinado específicamente para generar respuestas conversacionales.

 

GPT-4, lanzado en 2023, es el modelo más avanzado hasta ahora con 1 billón de parámetros. En las pruebas

 

internas, el modelo logró puntuar en el percentil 94 en el SAT (examen de fin de bachillerato en los Estados Unidos), el percentil 88 en el LSAT (Examen de Admisión a la Escuela de Derecho), y el percentil 90 en el Examen de la Barra Uniforme (Examen de Abogados). Estos resultados son notables en comparación con el modelo anterior, GPT-3.5, que logró puntuaciones en el percentil 82 en el SAT, el percentil 40 en el LSAT, y sólo el percentil 10 en el Examen de la Barra Uniforme.

Entonces, ¿cuáles son las diferencias entre los modelos GPT-3, GPT-3.5 y GPT-4?

Los modelos de la gama GPT-3 están diseñados para generar texto en respuesta a directivas específicas, pero no son tan efectivos para generar respuestas fluidas y conversacionales. El máximo exponente en esta clase es text-davinci-003, aunque tiene un precio más alto. Al principio de GPT Workspace, todos nuestros servicios usaban text-davinci-003, que también es bastante lento.

 

La serie GPT-3.5, también conocida como ChatGPT, que fue lanzada el 1 de marzo de 2023, está diseñada con un enfoque en la conversación. Estos modelos también pueden manejar indicaciones instructivas de manera bastante competente, similar a text-davinci-003. Sin embargo, en ciertas situaciones, pueden generar respuestas que son un poco más verbosas o imaginativas de lo necesario. Sin embargo, estos no son verdaderos inconvenientes ya que este modelo se desempeña extremadamente bien en la mayoría de las tareas, también es extremadamente rápido y barato de ejecutar. Comparado con el último lanzamiento de Bard AI, el competidor de los modelos GPT de Google, tiende a ser más lógico y "alucina" (inventa respuestas imaginarias) mucho menos.

 

Los modelos GPT-4, son el último modelo de openAI, actualmente son la vanguardia de los modelos GPT (disponibles sólo para nuestros miembros Premium, Team) y probablemente el modelo más inteligente disponible en el mercado en este momento. Son extremadamente buenos en razonamiento también sobresalen en escritura, invención y razonamiento deductivo. OpenAI también anunció la multimodalidad (la capacidad de ejecutar consultas a través de imágenes y otros tipos de medios, no sólo texto). También es capaz de realizar cálculos matemáticos extremadamente bien, una parte en la que GPT-3.5 simplemente no era capaz. Su único y mayor inconveniente es que es... lento. Y también caro, tanto que OpenAI limita (en el momento de escribir) incluso a sus clientes de pago a 25 mensajes cada 3 horas.

Entonces, ¿qué modelo elegir?

Para tareas de productividad, la respuesta corta es: GPT-3.5 Turbo. Es particularmente bueno con todo lo relacionado con Google Sheets para proporcionar resultados rápidos y rellenar celdas, listas y tablas rápidamente. Sin embargo, para una utilización profesional y para personas a las que no les importa la latencia, el uso de GPT-4 superará en la mayoría de los lugares. Mucha gente está esperando GPT-4-Turbo, pero

 

probablemente pasará un tiempo antes de que sea lanzado.

 

Los modelos más antiguos como text-davinci-003 han sido simplemente degradados de GPT Workspace, ya que no proporcionaban el rendimiento esperado de nuestros usuarios.

Conclusión

En conclusión, la serie de modelos GPT de OpenAI ha revolucionado el campo de la comprensión y generación de lenguaje. Desde el modelo GPT inicial hasta el último GPT-4, cada iteración ha aportado mejoras significativas en términos de parámetros, rendimiento y capacidades específicas. Mientras que los modelos GPT-3 son excelentes para generar texto en respuesta a directivas específicas, el GPT-3.5 Turbo brilla en tareas relacionadas con la conversación y la productividad. GPT-4, a pesar de ser más lento y más costoso, es inigualable en sus capacidades de inteligencia y razonamiento. La elección entre estos modelos depende en gran medida de los casos de uso específicos y los requisitos. A medida que anticipamos el lanzamiento de GPT-4 Turbo, sólo podemos imaginar los avances que traerá. Entender las características y capacidades únicas de cada modelo puede ayudar a los usuarios a tomar decisiones informadas y aprovechar al máximo estas herramientas de IA. Esperamos que este artículo le haya proporcionado una comprensión más profunda de los modelos GPT de OpenAI y su evolución y le ayude a elegir mejor un modelo al usar GPT Workspace.

 

Comprender los tokens GPT de OpenAI: Una guía completa

Cubos que se juntan para formar uno más grande