Este recurso escondido do Gemini irá te ajudar a aprender tecnologia de vez

Fazer com que a IA realize tarefas para você não é tão interessante quanto aprender a fazê-las você mesmo

recursos do Gemini, a inteligência artificial do Google
Créditos: Mariola Grobelska/ Unsplash/ Gemini/ gadost/ Getty Images

Jared Newman 4 minutos de leitura

Há algumas semanas, o Google Gemini me ensinou algumas novas habilidades de design gráfico. Eu estava editando uma captura de tela no Photopea, uma alternativa gratuita e online ao Photoshop, e queria colocar a imagem sobre uma borda colorida com uma sombra projetada atrás dela. 

Em vez de revirar documentações ou procurar tutoriais no YouTube, eu simplesmente compartilhei uma visualização ao vivo do meu navegador de internet com o Gemini e pedi orientação. O assistente de inteligência artificial (IA) do Google, então, me guiou pelos menus complexos do Photopea passo a passo.

Este é o recurso mais subestimado do aplicativo do Gemini para Mac, lançado em abril. Enquanto outros aplicativos de IA para desktop têm se concentrado cada vez mais em assumir o controle direto do seu computador, o aplicativo do Gemini ainda enxerga o valor de ensinar você a fazer as coisas por conta própria.

OLHANDO POR CIMA DO SEU OMBRO

Quando você clica no botão "+" no aplicativo do Gemini para Mac, verá a opção "Compartilhar Janela" na lista de ferramentas do Gemini. Arrastar o cursor sobre essa opção exibe uma lista de janelas abertas para compartilhar com o assistente de IA do Google.

Este recurso exige algumas permissões extras de privacidade, ativadas em Ajustes > Privacidade e Segurança > Gravação de Tela e Áudio do Sistema. A partir daí, você pode ativar a chave do Gemini para que o aplicativo consiga tirar capturas de tela automaticamente.

Depois de compartilhar uma janela com o Gemini, ele tirará um print dessa janela toda vez que você enviar uma pergunta. Isso significa que você pode usar o Gemini lado a lado com seus outros aplicativos e obter ajuda ao longo do caminho.

Ao criar a borda da minha imagem no Photopea, por exemplo, tive problemas para aplicar um efeito de gradiente ao meu fundo. Em resposta, o Gemini olhou para qual menu estava aberto no Photopea e me disse exatamente quais botões clicar a partir dali, citando a documentação online do próprio Photopea.

Desde então, usei o Gemini para me orientar em algumas outras interações com softwares. Ele me ajudou a navegar pelo labiríntico site Fangraphs enquanto eu procurava estatísticas recentes de beisebol e, depois que eu criei por puro instinto alguns scripts no Raycast para gerenciamento de janelas, ele me guiou pelo menu de Configurações do Raycast para ativá-los.

Outros aplicativos de IA para desktop têm suas próprias maneiras integradas de compartilhar a tela, mas o processo é mais travado. O ChatGPT e o Claude exigem que você adicione manualmente novas capturas de tela quando algo muda na sua tela, e no Claude você precisa clicar e arrastar para definir a área de captura toda vez. O modo "Compartilhar Janela" do Gemini parece mais um professor que olha por cima do seu ombro e oferece orientação conforme a necessidade.

Embora não exista um aplicativo oficial do Gemini para Windows, o Google oferece um aplicativo do Google separado para desktop no Windows com um recurso semelhante de compartilhamento de tela. A principal diferença é que a conversa flui por meio do "Modo IA" da Busca do Google, e não pelo Gemini. (O aplicativo Copilot da Microsoft também tem um recurso de compartilhamento de tela, embora, na minha experiência, as instruções dele não tenham sido tão úteis).

O QUE VEM A SEGUIR

Em vez de ensinar você a usar seu computador de forma mais eficaz, os rivais do Google estão se concentrando mais em controlar o computador por conta própria.

Tanto o aplicativo de desktop do Claude quanto o aplicativo ChatGPT Codex da OpenAI agora oferecem modos de "Uso do Computador" que conseguem navegar pela sua área de trabalho com cursores e teclados virtuais, usando capturas de tela contínuas para guiá-los. A esperança é que você consiga automatizar tarefas de computação complexas mesmo quando não estiver diante do computador.

Parece provável que o Google siga por esse caminho em breve. Embora o aplicativo do Gemini não consiga controlar seu computador hoje, o Google começou a demonstrar uma prévia de um modelo de "Uso do Computador" para o Gemini no final do ano passado.

Mas o controle total do computador tem seus pontos negativos. A Anthropic alerta sobre riscos de segurança decorrentes de aplicativos e páginas da web maliciosas, que poderiam pedir ao Claude para ignorar as próprias instruções do usuário. 

Ela também adverte contra permitir que a IA tome decisões com "consequências significativas no mundo real", pelo menos não sem buscar a confirmação humana primeiro. A IA também é muito mais lenta para clicar em botões e menus, e permitir que essas empresas vejam tudo na sua tela é um potencial pesadelo de privacidade.

Minha esperança, portanto, é que, mesmo que o uso do computador se torne um foco maior, o Google não desista de permitir que a IA desempenhe o papel de tutora de software. Nem toda tarefa computacional precisa ser automatizada e eliminada, e sempre há valor em aprender a fazer você mesmo.


SOBRE O AUTOR

Jared Newman é jornalista freelancer de tecnologia há mais de 15 anos e contribui regularmente para a Fast Company, PCWorld e TechHive. saiba mais