GPT‑5.4: quando o avanço deixa de ser teoria e vira trabalho de verdade

GPT‑5.4: quando o avanço deixa de ser teoria e vira trabalho de verdade

Quem me conhece sabe: sou obcecada por lançamentos de modelos. Também sei que eles não permanecem “estado da arte” por muito tempo. Na minha viagem recente para São Francisco, aprendi que a janela de relevância de um modelo está mais próxima de quatro semanas — ou até que um dos outros três grandes players lance uma atualização.

Especialistas em tecnologia também reforçaram nessa viagem que a capacidade do modelo, por si só, caminha rapidamente para se tornar uma commodity. O verdadeiro diferencial estará nas aplicações verticais construídas sobre ela.

smart_display

Nossos vídeos em destaque

Ainda assim, acompanhar — e sentir — esse ritmo de progresso de perto continua sendo fascinante. A velocidade com que esses modelos evoluem é, sinceramente, impressionante. No dia 5 de março, a OpenAI lançou o GPT‑5.4 e, sim, eu fiquei bastante animada e comecei a ler tudo sobre o tema – e, obviamente, testei o modelo.

O GPT‑5.4 chegou com mais expectativa do que alguns lançamentos recentes porque foi apresentado como um avanço mais estrutural. A OpenAI o descreve como um modelo que reúne seus progressos mais recentes em raciocínio, programação e fluxos de trabalho com agentes em um único “modelo de fronteira”, pensado para uso profissional. Ele também traz uma janela de contexto de 1 milhão de tokens.

Para quem não vive imerso em especificações técnicas, vale a tradução simples: a janela de contexto é a quantidade de informação que o modelo consegue manter “em mente” ao mesmo tempo. Quanto maior ela é, mais documentos longos, abas abertas, instruções e tarefas em múltiplas etapas o modelo consegue executar sem perder o fio da meada.

Desta vez, a OpenAI foi especialmente explícita em duas prioridades: trabalho intelectual e uso do computador. As chamadas “capacidades de uso de computador” significam, na prática, que o modelo consegue operar um computador como um humano — interpretando o que está na tela e usando mouse e teclado para concluir tarefas em diferentes aplicações.

Em seus próprios benchmarks, o GPT‑5.4 atingiu uma taxa de sucesso de 75,0% no OSWorld‑Verified, um teste que mede se o modelo consegue navegar por fluxos reais de trabalho em desktops a partir de capturas de tela, cliques e comandos de teclado.

Esse número chama atenção não apenas por estar bem acima dos 47,3% do GPT‑5.2, mas também por superar a performance média humana no mesmo teste. Em termos simples: os modelos estão ficando significativamente melhores em usar softwares de verdade — não apenas em falar sobre eles.

Isso importa porque a próxima grande mudança de interface provavelmente não será feita por humanos clicando em sites e sistemas, mas por agentes fazendo isso por nós. Se esse cenário se confirmar, empresas precisarão cada vez mais de produtos, sites e fluxos de trabalho que não sejam apenas intuitivos para pessoas, mas também fáceis de entender e executar para agentes.

A OpenAI também deu destaque ao desempenho no GDPval, seu benchmark voltado ao trabalho profissional do conhecimento, que cobre 44 ocupações em nove dos principais setores que compõem o PIB dos Estados Unidos.

Em termos simples, o GDPval mede quão bem o modelo executa tarefas reais do dia a dia corporativo: planilhas, apresentações, agendas, análises e outros entregáveis que as pessoas efetivamente produzem no trabalho.

Nesse indicador, o GPT‑5.4 igualou ou superou profissionais da indústria em 83,0% das comparações — contra 70,9% do GPT‑5.2. Houve também um salto expressivo em tarefas de modelagem em planilhas, de 68,4% para 87,3%, algo particularmente relevante para fluxos intensivos em finanças.

E, sim, o recado para o mercado financeiro foi bastante claro. Junto com o lançamento do modelo, a OpenAI apresentou o ChatGPT para Excel, um add‑in em beta que leva o GPT‑5.4 diretamente para dentro das planilhas.

Isso importa porque um dos casos de uso corporativos mais evidentes desses modelos está justamente em modelagem financeira, análises de cenário e trabalhos pesados em dados — atividades que ainda consomem uma parcela desproporcional do tempo de analistas.

Mais do que um novo modelo, o GPT‑5.4 sinaliza uma transição: da IA que responde bem para a IA que executa, navega, constrói e entrega. E esse, ao que tudo indica, é o verdadeiro próximo capítulo.

Autor

  • Gaby Souza é criador do MdroidTech, especialista em tecnologia, aplicativos, jogos e tendências do mundo digital. Com anos de experiência testando dispositivos e softwares, compartilha análises, tutoriais e notícias para ajudar usuários a aproveitarem ao máximo seus aparelhos. Apaixonado por inovação, mantém o compromisso de entregar conteúdo original, confiável e fácil de entender