Deixei a IA controlar meu computador por uma semana. Veja o que aconteceu
Modelo promete automatizar tarefas repetitivas – mas isso exige aceitar algumas limitações

Agora que a IA já consegue controlar seu navegador, o próximo passo parece ser comandar seu computador inteiro. É exatamente isso que a startup Vercept pretende fazer com o Vy, um app gratuito para Windows e Mac que a assume o controle do seu mouse e do teclado para executar tarefas repetitivas do dia a dia por você.
Basta descrever o que quer fazer – e ele cuida de tudo. O Vy foi lançado em versão beta para Mac em maio e agora chegou ao Windows após ser totalmente reformulado.
Nos meus testes, o resultado foi, no mínimo, irregular. Se você já se irritou com o ChatGPT por não seguir suas instruções, imagine isso quando a IA está mexendo na sua máquina inteira. Muitas tarefas que você gostaria de automatizar acabam sendo mais rápidas quando feitas manualmente.
Mesmo assim, consigo ver potencial em um agente que realmente opera o computador – não à toa outras empresas, inclusive a Microsoft, estejam seguindo esse caminho.
Kiana Ehsani, CEO e cofundadora da Vercept, afirma que o Vy age de forma mais “humana” do que agentes embutidos em navegadores, como o Perplexity Comet e o ChatGPT Atlas.
Enquanto esses navegadores analisam a estrutura inteira de uma página, o Vy tira capturas de tela constantemente para entender o que está sendo exibido. A partir disso, executa cliques e comandos como um usuário faria.
Segundo Ehsani, algumas pessoas já usam o Vy para automatizar tarefas no Excel, extrair dados da internet e compartilhá-los em apps como o Slack, ou até para aprender a usar novos programas. “A ideia é criar um modelo que consiga enxergar a tela e agir quase da mesma forma que você agiria”, diz ela.
Mas isso leva tempo, já que cada ação depende de uma captura de tela enviada para análise. Abrir um app, clicar em um menu, rolar uma página – tudo isso exige mais capturas, mais envios e mais espera. Uma tarefa que você resolveria em 10 segundos pode levar cinco minutos.
O Vy tenta contornar isso de duas maneiras. Uma é o modo background, que deixa você continuar usando o computador enquanto o app trabalha em uma janela invisível do navegador. Mas, nesse modo, ele só interage com arquivos e páginas da internet – nada de outros aplicativos.
A outra é agendar tarefas para horários em que você não está usando a máquina. Eu, por exemplo, programei uma rotina diária às 7 da manhã que minimiza janelas abertas, abre o Obsidian, centraliza na tela e carrega minha lista de tarefas.
Assistir tudo isso ao vivo é um teste de paciência, mas deixar tudo pronto para quando eu me sentar à mesa – me forçando a encarar minha lista de afazeres – acaba sendo muito útil.
Ehsani acredita que, quando a IA puder rodar diretamente no dispositivo, tudo ficará mais rápido. Em vez de enviar capturas de tela para a nuvem, o Vy faria a análise localmente. Mas ainda não está claro quando isso será possível – ou qual seria o poder de processamento necessário.
ELE PRECISA DE MUITA ORIENTAÇÃO
Usar o Vy é como dar instruções para uma criança: ele entende, mas do jeito dele – e às vezes ignora completamente.
O Obsidian, por exemplo, tem uma peculiaridade. Se você abre o app enquanto ele já está sendo executado, surge uma segunda janela pedindo para escolher o vault. Para evitar isso, pedi ao Vy para clicar apenas no ícone na barra de tarefas, que expande a janela já aberta.
Mas, nos testes, ele insistia em clicar no atalho da área de trabalho, abrindo uma nova. Eu interrompia e repetia a instrução – mas, ainda assim, o Vy tentava abrir o app de outros modos.
No fim, precisei escrever instruções detalhadas: não clicar no ícone da área de trabalho, não usar o menu Iniciar e não tentar abrir o app de nenhuma outra maneira além da barra de tarefas. Também precisei explicar como identificar o ícone roxo em forma de cristal.
Tudo isso para ajustar uma rotina simples que envolvia, basicamente, minimizar janelas e clicar em um botão. Foram uns 20 minutos só nisso.
Apesar dessas limitações, agentes de IA capazes de controlar dispositivos são uma tendência inevitável. A Vercept levantou US$ 16 milhões de investidores em janeiro, entre eles, o ex-CEO do Google Eric Schmidt e o cientista-chefe da DeepMind Jeff Dean.
A ideia é ir além do computador. Um app para Android já está em desenvolvimento e a empresa imagina um futuro em que você possa dar um comando pelo celular e o Vy execute ações no computador – ou vice-versa.