Claude Computer Use: A Nova Era de Tarefas Autônomas

A Anthropic lançou oficialmente a funcionalidade “Computer Use” para o Claude, marcando um avanço significativo que permite à IA controlar o computador de forma autônoma e interagir com interfaces assim como um humano, incluindo cliques, digitação e navegação.
Contexto
Diferente de APIs tradicionais focadas apenas em texto ou interações baseadas em endpoints específicos, a funcionalidade “Computer Use” capacita o Claude 3.5 Sonnet a interagir diretamente com o ambiente desktop. A tecnologia funciona permitindo que o modelo tire capturas de tela, reconheça visualmente elementos de interface de usuário (UI), mova o cursor e digite usando o teclado. Inicialmente disponível em research preview, a ferramenta demonstra o próximo grande passo rumo a Agentes de IA que de fato executam o trabalho (“do work”).
Detalhes
O Claude agora não precisa apenas orientar o usuário em como resolver um problema, mas sim agir para resolvê-lo diretamente através de uma interface visual. Para conseguir isso, o sistema entra em um ciclo de agente (“agent loop”). Ao receber uma solicitação, o Claude analisa o objetivo, observa os elementos na tela e decide a sequência de ferramentas para agir. Após cada clique ou comando, ele tira uma nova captura de tela, garantindo que a execução está no caminho correto e ajustando as ações caso seja necessário.
As capacidades incluem:
- Navegação visual: Abrir arquivos, operar navegadores modernos (como pesquisar, clicar, preencher dados).
- Trabalho Complexo: Executar IDEs, realizar commits, fazer pull requests ou executar testes em códigos locais.
- Automação de Tarefas: Inserção repetitiva de dados entre planilhas e janelas que não possuem API.
Além de lançamentos focados em interface de linha de comando ou terminal, a funcionalidade é expandida para o Claude Dispatch (um aplicativo móvel que delega tarefas para o computador a partir do smartphone) e o Claude Cowork (uma solução corporativa para funcionários processarem dados através de várias aplicações locais). Por medidas de segurança e controle, a Anthropic preza por um “uso permissivo”, ou seja, o Claude pede autorização antes de usar aplicações sensíveis, permitindo sempre o cancelamento pelo usuário, mitigando riscos de segurança como prompt injections perigosos.