Como este astro de K-pop consegue cantar fluentemente em 6 idiomas

Hybe, a gigante da música coreana por trás do BTS, está usando IA de voz para lançar seu mais recente artista, Midnatt, em vários idiomas simultaneamente

Crédito: Hybe

David Salazar 3 minutos de leitura

Quando a Hybe, a gigante do entretenimento por trás do BTS, anuncia um novo artista, o mundo da música fica atento. Afinal, ela não domina apenas o K-pop como também é responsável pela carreira de Justin Bieber e Ariana Grande, entre outros artistas.

Quando a empresa lançou teasers de um novo projeto de inteligência artificial para sua gravadora Big Hit Music envolvendo um cantor chamado Midnatt, fãs do gênero e observadores da indústria começaram a especular se esse seria um grupo totalmente gerado por IA. Mas a resposta é não. Ou melhor, não exatamente.

Midnatt é o alter ego de Lee Hyun, um nome conhecido na cena musical coreana que está com a Hybe desde 2005, quando ainda se chamava Big Hit Entertainment, oito anos antes da estreia do BTS. Por mais que os fãs de K-pop conheçam sua voz há bastante tempo, nunca a ouviram em tantos idiomas.

Seu novo single, “Masquerade”, foi lançado simultaneamente em coreano, inglês, espanhol, chinês, japonês e vietnamita. “Embora minha nova identidade ainda seja desconhecida para os fãs, meu objetivo sempre foi alcançar o público global. E superar as barreiras linguísticas é o primeiro passo nessa jornada”, diz o artista.

Midnatt – que significa “meia-noite” em sueco e “rosto nu” em coreano – marca a primeira colaboração entre uma das gravadoras da Hybe e a Hybe IM, seu braço de mídia interativa.

Para o projeto, foi utilizada a tecnologia da Supertone, uma empresa de síntese de voz de IA adquirida pela Hybe no ano passado. Criada por Lee Kyogu, especialista em processamento de linguagem e machine learning, ela é capaz de reproduzir com precisão a voz de um cantor, além de permitir uma variedade de ajustes.

“A tecnologia não apenas oferece diversas opções de síntese de voz, mas também permite ajustes precisos em cada elemento”, afirma o produtor do single, Hitchhiker, também conhecido como Choi Jin-woo.

Para garantir que as faixas soassem como se estivessem sendo cantadas por um falante nativo, Choi utilizou o Supertone para alternar os dados de voz de Midnatt com os de narradores locais. Além disso, mixou manualmente as duas vozes para assegurar que os vocais em outros idiomas transmitissem a mesma emoção da versão em coreano.

Crédito: Hybe

O Supertone permitiu até mesmo que Midnatt participasse de sua própria faixa com uma voz feminina, que entra na segunda estrofe. É algo que Choi afirma que poucas ferramentas hoje conseguem fazer, mantendo, ao mesmo tempo, a clareza vocal.

PARA O BEM E PARA O MAL

Usar tecnologia para lançar um novo artista de K-pop globalmente, e com sua “própria” voz, é um passo natural para a Hybe. A empresa é uma das principais responsáveis por tornar o gênero popular mundialmente.

A quantidade de fãs de BTS – conhecidos coletivamente como ARMY – chega a (pelo menos) dezenas de milhões. Seu novo grupo feminino de K-pop, NewJeans, que estreou há menos de um ano, alcançou um bilhão de reproduções no Spotify em tempo recorde. Encontrar artistas que possam se conectar e cantar para esses fãs em seus próprios idiomas vem se tornando uma prioridade cada vez maior.

Apesar de serem muito úteis para gravadoras e artistas adaptarem músicas para o público, as ferramentas de síntese de voz de IA, como a do Supertone, vêm chamando bastante atenção com o surgimento de músicas não autorizadas na internet que replicam vozes de artistas famosos.

Lee Kyogu, da Supertone (Crédito: Hybe)

Uma recente faixa produzida com IA chamada “Heart on My Sleeve”, imitando os vocais de Drake e The Weeknd, acumulou 10 milhões de visualizações no TikTok e 250 mil reproduções no Spotify em poucos dias, antes que a Universal Media Group – a gravadora que representa ambos os artistas – a retirasse do ar por violação de direitos autorais.

Lee afirma que a Supertone não permite que sua tecnologia seja usada pelo público em geral e garante que qualquer pessoa cuja voz esteja sendo sintetizada tenha dado autorização. Também diz que a empresa está explorando maneiras de distinguir vozes reais de sintéticas.

“Embora este seja um grande desafio, estamos comprometidos em aprimorar nosso algoritmo de detecção para aplicações em situações do mundo real.”

Midnatt diz estar animado por fazer parte do ambicioso programa de IA da Hybe: “Estou na indústria musical há algum tempo e espero que essa faixa tenha um impacto significativo em outros artistas, assim como Neil Armstrong deixou sua marca.”


SOBRE O AUTOR

David Salazar é editor associado da Fast Company. saiba mais