Qual o modelo OpenAI a escolher? Qual é a diferença entre o GPT-3.5 e o GPT-4? Um pequeno guia que explica as diferenças entre os modelos chatGPT openAI, incluindo modelos mais antigos como o text-davinci-003.

um ícone de pesquisa junto a quadrados de diferentes tamanhos e formas para simbolizar a inteligência artificial

O que é um modelo

Um modelo é uma espécie de ferramenta de previsão no campo da inteligência artificial, normalmente projetada para um tipo específico de cenário. Esses modelos são usados para antecipar uma variedade de resultados - desde padrões climáticos e tendências do mercado de ações até resultados esportivos e identificação de conteúdo de imagem. O fio comum entre esses modelos é a capacidade de receber um certo input (como dados climáticos atuais) e produzir uma previsão (como a previsão do tempo para amanhã), muitas vezes acompanhada por um nível de confiança.

 

A precisão e confiabilidade dessas previsões podem variar amplamente. Antes do advento dos modelos GPT, não havia um modelo eficiente capaz de prever com precisão a continuação de um determinado "input de texto".

 

No entanto, a OpenAI pioneirizou uma nova categoria de modelos conhecidos como transformadores gerativos pré-treinados (GPT), que melhoraram significativamente isso. Esses modelos GPT podem efetivamente 'estender' um input de texto em muitas circunstâncias, igualando ou às vezes superando a velocidade e proficiência de um humano médio. Como o "input de texto" é um conceito amplamente aplicável, esses modelos GPT podem ser empregados para uma variedade de tarefas, desde responder a perguntas e aderir a diretrizes de edição/formatação até mesmo escrever código.

 

Então, em essência, um modelo GPT é uma ferramenta de previsão para conteúdo textual.

 

História dos diferentes modelos da OpenAI

Antes de entender as diferenças entre esses diferentes modelos, vamos dar uma breve olhada na história e entender os modelos GPT que a OpenAI lançou ao longo dos últimos 7 anos de sua existência.

 

GPT (Generative Pretrained Transformer): Lançado em 2018, o modelo GPT foi uma inovação no domínio da compreensão e geração de linguagem. Foi pré-treinado em uma gama diversificada de textos da internet, mas não estava sem suas limitações, incluindo gerar respostas criativas, mas às vezes sem sentido.

 

GPT-2: Introduzido em 2019, o GPT-2 foi uma atualização direta de seu antecessor, oferecendo mais parâmetros e melhor desempenho. Inicialmente, devido a preocupações com possíveis abusos, o modelo completo não foi lançado. No entanto, ele foi totalmente de código aberto mais tarde naquele ano.

 

GPT-3: A terceira iteração, lançada em 2020, aumentou significativamente a capacidade do modelo, ostentando 175 bilhões de parâmetros de aprendizado de máquina. Este modelo foi capaz de gerar respostas coerentes e relevantes ao contexto de forma impressionante, superando seus predecessores em tradução, resposta a perguntas e outras tarefas.

 

Variantes de GPT-3 afinadas: A OpenAI também lançou alguns modelos GPT-3 que foram ajustados para tarefas específicas. Por exemplo, o modelo ChatGPT (tecnicamente GPT-3.5), uma versão do GPT-3, foi ajustado especificamente para gerar respostas conversacionais.

 

GPT-4, lançado em 2023, é o modelo mais avançado até agora com 1 trilhão de parâmetros. Em testes internos, o modelo conseguiu pontuar dentro do percentil 94 no SAT (exame de fim de ensino médio nos EUA), o percentil 88 no LSAT (Teste de Admissão à Faculdade de Direito) e o percentil 90 no Exame Uniforme da Ordem (Exame de Advogado). Esses resultados são notáveis quando comparados com o modelo anterior, GPT-3.5, que alcançou pontuações no percentil 82 no SAT, no percentil 40 no LSAT e apenas no percentil 10 no Exame Uniforme da Ordem.

Então, quais são as diferenças entre os modelos GPT-3, GPT-3.5 e GPT-4?

Os modelos da gama GPT-3 são projetados para gerar texto em resposta a diretivas específicas, mas não são tão eficazes para gerar respostas fluidas e conversacionais. O melhor desempenho nesta classe é o text-davinci-003, embora venha com um preço mais alto. No início do GPT Workspace, todos os nossos serviços usavam text-davinci-003, que também é bastante lento.

 

A série GPT-3.5, também conhecida como ChatGPT, que foi lançada em 1 de março de 2023, foi projetada com foco na conversação. Estes modelos também podem lidar muito bem com instruções, semelhante ao text-davinci-003. No entanto, em certas situações, eles podem gerar respostas que são um pouco mais verbosas ou imaginativas do que o necessário. No entanto, esses não são realmente desvantagens, já que este modelo se sai extremamente bem na maioria das tarefas, é extremamente rápido e barato de rodar. Em comparação com o último lançamento do Bard AI, o concorrente dos modelos GPT do Google, ele tende a ser mais lógico e "alucina" (inventa respostas imaginárias) muito menos.

 

Os modelos GPT-4, são os últimos modelos da OpenAI, atualmente na vanguarda dos modelos GPT (disponíveis apenas para nossos membros Premium, Equipe) e provavelmente o modelo mais inteligente disponível no mercado agora. Extremamente bom em raciocínio, ele também se destaca em escrita, invenção e raciocínio dedutivo. A OpenAI também anunciou multimodalidade (a capacidade de rodar consultas via imag

 

ens e outros tipos de mídia, não apenas texto). Ele também é capaz de fazer cálculos matemáticos extremamente bem, uma parte em que o GPT-3.5 simplesmente não era capaz. Sua única e maior desvantagem é que é... lento. E também caro, tanto que a OpenAI limita (no momento da escrita) até mesmo seus clientes pagantes a 25 mensagens a cada 3 horas.

 

Então, qual modelo escolher?

Para tarefas de produtividade, a resposta curta é: GPT-3.5 Turbo. Ele é particularmente bom em tudo relacionado ao Google Sheets para fornecer resultados rápidos e preencher células, listas e tabelas rapidamente. No entanto, para uma utilização profissional e para pessoas que não se importam com a latência, usar o GPT-4 superará em quase todos os lugares. Muitas pessoas estão esperando pelo GPT-4-Turbo, mas provavelmente vai demorar um pouco até ser lançado. Os modelos mais antigos como o text-davinci-003 foram simplesmente descontinuados do GPT Workspace, pois não estavam fornecendo o desempenho esperado pelos nossos usuários.

Conclusão

Em conclusão, a série de modelos GPT da OpenAI revolucionou o campo da compreensão e geração de linguagem. Do modelo GPT inicial ao último GPT-4, cada iteração trouxe melhorias significativas em termos de parâmetros, desempenho e capacidades específicas. Enquanto os modelos GPT-3 se destacam na geração de texto em resposta a diretivas específicas, o GPT-3.5 Turbo brilha em tarefas relacionadas à conversação e produtividade. GPT-4, apesar de ser mais lento e mais caro, é inigualável em sua inteligência e capacidades de raciocínio. A escolha entre esses modelos depende em grande parte de casos de uso específicos e requisitos. Enquanto aguardamos o lançamento do GPT-4 Turbo, só podemos imaginar as melhorias que ele trará. Entender as características e capacidades únicas de cada modelo pode ajudar os usuários a tomar decisões informadas e aproveitar totalmente o poder dessas ferramentas de IA. Esperamos que este artigo tenha proporcionado uma compreensão mais profunda dos modelos GPT da OpenAI e de sua evolução e ajudará você a escolher melhor um modelo ao usar o GPT Workspace.

 

Entendendo os tokens GPT do OpenAI: Um guia abrangente