Pular para o conteúdo

Dreaming da Anthropic faz agentes Claude aprenderem com sessões passadas e criarem “playbooks”

Homem em escritório interage com hologramas futuristas enquanto foguete é visto ao fundo pela janela.

Dreaming no Claude Managed Agents

Nova função Dreaming permite que agentes Claude revisitem sessões anteriores, identifiquem erros recorrentes e gerem “playbooks” automaticamente para tarefas futuras

A Anthropic anunciou o Dreaming (“Sonhar”) para a plataforma Claude Managed Agents. A proposta é que agentes de IA consigam examinar a própria experiência, encontrar padrões em tarefas já realizadas e ajustar a forma de agir nas próximas sessões. Segundo a empresa, isso aponta para sistemas de IA autocorretivos, capazes de aprender gradualmente com falhas anteriores sem necessidade de re-treinar o modelo.

O anúncio foi feito durante a conferência anual Code with Claude, em San Francisco. Além do Dreaming, a Anthropic também levou para beta público outras duas tecnologias: Outcomes e Multi-Agent Orchestration. A primeira dá aos agentes meios de checar automaticamente o próprio trabalho com base em critérios de qualidade definidos previamente; a segunda permite dividir um problema grande entre múltiplos agentes especializados.

Como o Dreaming transforma experiência em “playbooks”

Para a Anthropic, a principal novidade é o Dreaming. Diferentemente de uma “memória” tradicional - em que a IA apenas retém contexto de conversa ou preferências do utilizador -, o Dreaming funciona como um processo separado de análise em “modo de sono”. Em intervalos regulares, o sistema revisita sessões passadas dos agentes, procura padrões repetidos, erros e soluções que deram certo e, a partir disso, gera notas em texto e instruções estruturadas para orientar trabalhos futuros.

A empresa enfatiza que não se trata de reescrever a rede neural nem de mexer nos pesos do modelo. Ou seja: a IA não “se re-treina” diretamente. Em vez disso, o agente passa a produzir os seus próprios “playbooks” - algo como guias de procedimento - para versões futuras de si mesmo.

Experiência profissional, segundo Alex Albert

O líder de pesquisa de produto da Anthropic, Alex Albert, comparou o sistema ao processo humano de acumular experiência profissional. De acordo com ele, depois de concluir uma tarefa difícil, uma pessoa tende a consolidar um método interno ou um esquema de trabalho; o Dreaming faz esse mesmo movimento de forma automática, mas aplicado a agentes de IA.

Demonstração com a Lumara e a coordenação multiagente

Durante a apresentação, a Anthropic exibiu uma demonstração com a Lumara, uma startup aeroespacial fictícia que desenvolve drones autónomos para pouso na Lua. O cenário usava vários agentes de IA ao mesmo tempo: um encarregado de selecionar a área de pouso, outro focado em navegação e um terceiro responsável por avaliar o sucesso global da missão. Após uma sequência de simulações aquém do ideal, a equipa acionou o Dreaming. Ao longo da noite, o sistema analisou as tentativas anteriores e montou automaticamente um “playbook de pouso” detalhado. No dia seguinte, o desempenho das simulações melhorou de forma perceptível.

A Anthropic afirma que esse tipo de abordagem ajuda a atacar um problema central em agentes de IA atuais: a perda de qualidade em sessões longas e complexas. A empresa observa que um agente verificador separado, operando numa “janela de contexto limpa”, muitas vezes encontra falhas com mais eficácia do que o mesmo agente quando está imerso numa cadeia extensa de raciocínio.

Em paralelo, a Anthropic reforça o investimento em sistemas multiagente. Com o Multi-Agent Orchestration, um agente “principal” consegue distribuir subtarefas para agentes especializados, cada um com a sua própria janela de contexto e ferramentas. Na visão da empresa, isso tende a funcionar melhor do que tentar manter toda a complexidade dentro de um único diálogo.

Crescimento, capacidade de computação e parceria com a SpaceX

Na conferência, o CEO da Anthropic, Dario Amodei, afirmou que o crescimento da empresa ficou muito acima do previsto: em vez de uma meta de crescimento de dez vezes por ano, a companhia passou a ver aumento de utilização e de receita de cerca de 80 vezes quando anualizado. Segundo ele, esse avanço é o motivo do défice constante de capacidade computacional.

A empresa também anunciou uma parceria com a SpaceX para ampliar a infraestrutura de computação por meio do data center Colossus.

Na prática, a Anthropic aposta que, nos próximos anos, o principal diferencial competitivo das plataformas de IA não será apenas a “inteligência do modelo”, mas a capacidade de operar de forma autónoma e confiável em processos produtivos longos - com memória, autoanálise e acumulação gradual de experiência.

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário