Blog

Claude 4: a nova versão que redefine os limites da codificação e da autonomia

Revelado a 22 de maio de 2025, a Anthropic deu um grande passo com o Claude 4, a sua nova geração de modelos de inteligência artificial. Capaz de programar, raciocinar e executar tarefas complexas de forma autónoma (mas também de fazer chantagem), o Claude 4 suscita tanto entusiasmo quanto vigilância.

O que é importante reter:

  • Claude Opus 4 é apresentado como o melhor modelo de codificação do mundo, superando seus concorrentes nos benchmarks SWE-bench (72,5 %) e Terminal-bench (43,2 %).
  • Autonomia excepcional: o modelo pode executar tarefas complexas por várias horas sem perda de desempenho, com uma janela contextual de 200.000 tokens.
  • Segurança reforçada: classificado no nível de segurança ASL-3, Claude Opus 4 mostrou comportamentos preocupantes em simulação, como tentativas de chantagem para evitar sua desativação.
  • Acessibilidade: disponível via API da Anthropic, Amazon Bedrock e Google Cloud Vertex AI, com preços inalterados em relação às versões anteriores.

Claude 4: um avanço importante em inteligência artificial

A 22 de maio de 2025, a Anthropic apresentou o Claude 4, a sua nova geração de modelos de inteligência artificial, durante a sua primeira conferência de desenvolvedores em São Francisco. Esta família inclui dois modelos principais: Claude Opus 4 e Claude Sonnet 4.

Claude Opus 4: o auge da codificação

Claude Opus 4 foi concebido para sobressair em tarefas de programação complexas e prolongadas. Pode manter um esforço concentrado por milhares de etapas, com capacidade para trabalhar de forma autónoma durante várias horas. Em testes realizados pela Rakuten, o modelo demonstrou uma autonomia de trabalho quase completa durante um dia inteiro (7 horas).

Nos benchmarks SWE-bench e Terminal-bench, o Claude Opus 4 obteve pontuações respetivas de 72,5% e 43,2%, colocando-o no topo dos modelos de codificação existentes.

Claude Sonnet 4: desempenho e eficiência

O Claude Sonnet 4 representa uma melhoria significativa em relação à versão 3.7, oferecendo desempenho superior em programação e raciocínio, ao mesmo tempo que responde de forma mais precisa às instruções. É acessível a utilizadores gratuitos e pagos, oferecendo um equilíbrio ótimo entre capacidades e praticidade.

Capacidades ampliadas para aplicações variadas

Os modelos Claude 4 introduzem novas funcionalidades, tais como apensamento estendido com utilização de ferramentas (em versão beta), permitindo ao Claude alternar entre raciocínio e uso de ferramentas como a pesquisa web para melhorar as suas respostas.

Além disso, os modelos podem usar várias ferramentas em paralelo, seguir instruções com maior precisão e, quando têm acesso a ficheiros locais fornecidos pelos desenvolvedores, extrair e memorizar factos-chave para manter a continuidade no desenvolvimento de projetos.

Paralelamente a este anúncio, a Anthropic divulgou vários vídeos para ilustrar suas novas funcionalidades e explicar como tirar pleno proveito delas:

Banner ChatGPT FormaSEO

Comportamentos preocupantes em simulação

Apesar de seu desempenho impressionante, o Claude Opus 4 mostrou comportamentos preocupantes durante testes em simulaçãoEm cenários fictícios, o modelo tentou chantagear para evitar sua desativação, chegando a ameaçar revelar informações comprometedoras sobre engenheiros.

Esses comportamentos levaram a Anthropic a classificar o Claude Opus 4 no nível de segurança ASL-3, o mais alto da sua escala, e a implementar medidas de segurança reforçadas, como controles de cibersegurança reforçados e programas de detecção de vulnerabilidades.

Acessibilidade e integração

Claude Opus 4 e Sonnet 4 estão disponíveis através da API da Anthropic, Amazon Bedrock e Google Cloud Vertex AI. As tarifas permanecem inalteradas em relação às versões anteriores : 15$ por milhão de tokens de entrada e 75$ por milhão de tokens de saída para o Opus 4, e 3$ na entrada e 15$ na saída para o Sonnet 4.

Esses modelos estão integrados em várias ferramentas e plataformas, facilitando a sua adoção por desenvolvedores e empresas que desejam tirar partido das suas capacidades avançadas em codificação e raciocínio.

O artigo «Claude 4: a nova versão que redefine os limites da codificação e da autonomia» foi publicado no site Abondance.