5 perguntas para Lydia Pintscher, líder do projeto Wikidata
O maior banco de dados de conhecimento livre do mundo conta com 116,6 milhões de pontos de informação, editados quase 500 mil vezes por dia

Enquanto gigantes da tecnologia e da IA guardam seus segredos a sete chaves, um modelo mais aberto vem, discretamente, impulsionando projetos inovadores de São Paulo a Nairóbi. O Wikidata, espinha dorsal colaborativa por trás dos dados estruturados da Wikipédia, tornou-se o maior banco de dados de conhecimento livre do mundo.
Lydia Pintscher, que lidera o projeto Wikidata na Wikimedia Alemanha, supervisiona esse enorme experimento de colaboração aberta. Mais de 25 mil colaboradores em 190 países já construíram um banco de dados com 116,6 milhões de pontos de informação, editados quase 500 mil vezes por dia.
Ao contrário das alternativas proprietárias, qualquer pessoa pode acessar, consultar e contribuir para esse repositório em constante expansão do conhecimento humano. Desenvolvedores podem construir soluções sobre essa base comunitária sem se preocupar com guardiões corporativos ou mudanças repentinas de API.
Nesta entrevista à Fast Company ela fala sobre como os dados abertos desafiam o domínio das big techs, permitindo o desenvolvimento da inovação em mercados negligenciados, e sobre por que a transparência nos knowledge graphs (grafos de conhecimento que estruturam informações e conexões entre pessoas, lugares e conceitos) é mais importante do que nunca.
Fast Company – Quais são alguns projetos construídos sobre o Wikidata que mostram o potencial da tecnologia para o bem da sociedade?
Lydia Pintscher – Há muitos, mas destaco estes:
- Govdirectory, que facilita o contato das pessoas com seus governos e dá voz em temas que importam;
- OpenSanctions, que rastreia pessoas politicamente expostas, suas conexões e sanções aplicadas, garantindo a efetividade das punições internacionais;
- Aletheiafact, um projeto brasileiro de checagem de fatos contra a desinformação;
- Open Parliament TV, que facilita o acompanhamento do que políticos dizem nos parlamentos sobre questões cruciais;
- Gestapo.Terror.Orte, que ajuda a compreender as atrocidades cometidas pela polícia secreta na Alemanha nazista.
Todos esses são esforços de base, possíveis ou facilitados graças ao apoio dos dados e da comunidade do Wikidata.
Fast Company – Quando desenvolvedores podem usar APIs proprietárias de grandes empresas de tecnologia, por que escolher o caminho mais complexo de construir sobre dados abertos?
Lydia Pintscher – Eu responderia com outra pergunta: você quer ficar à mercê dos caprichos de uma grande empresa que pode decidir, amanhã, não disponibilizar mais os dados, ou só fazê-lo a um preço e sob condições inaceitáveis? Ou prefere trabalhar e apoiar um movimento que se importa profundamente com o acesso ao conhecimento para todos?
Além disso, o Wikidata permite que você seja participante ativo, não apenas consumidor. Encontrou um problema nos dados? Algo importante para você está faltando? Você pode ir lá e fazer as mudanças diretamente no Wikidata.
Fast Company – Como a abordagem do Wikidata difere da maneira como empresas como Google ou Microsoft gerenciam seus knowledge graphs?
Lydia Pintscher – O contraste mais evidente é a abertura. No Wikidata, você pode acessar o site, consultar um verbete e ver cada modificação já feita nele, entendendo como chegou ao estado atual.
Mais do que visualizar o presente ou o passado desse verbete, você pode editá-lo e contribuir, com uma única mudança, para a soma do conhecimento humano.
Grandes empresas de tecnologia vêm extraindo valor dos bens comuns há anos, e isso mina os próprios recursos coletivos dos quais dependemos.
Outra diferença está na complexidade e na nuance com que tentamos representar o mundo. Desde o início do Wikidata, já me deparei com entidades fascinantes, estranhas e provocativas que não cabem em modelos simplistas.
Você sabia, por exemplo, que houve um ano em que a Suécia decidiu ter um 30 de fevereiro? Ou que há países com mais de uma capital? Há exemplos curiosos, mas também outros que importam muito – como territórios em disputa, que outros sites podem mostrar apenas sob uma ótica, dependendo de onde o usuário acessa.
Não é possível ter conversas civis quando nem sequer se mostra que existem outras perspectivas sobre um tema. É por isso que considero essencial expor pelo menos parte dessa complexidade. O mundo é complexo, estranho e belo, e a tecnologia que usamos precisa refletir isso.
Fast Company – Um desenvolvedor de Bangladesh pode acessar no Wikidata a mesma infraestrutura de dados que o Google. Como os dados abertos equilibram o campo de inovação no Sul Global?
Lydia Pintscher – Hoje, muitos aplicativos são movidos a dados. Isso significa que, como desenvolvedor, você não precisa apenas construir o aplicativo, mas também coletar e manter os dados dos quais ele depende.
Para uma grande empresa, isso não é um grande problema, mas para um desenvolvedor individual ou uma pequena equipe, isso limita fortemente o que pode ser feito.

É aí que o Wikidata entra em cena, fornecendo dados básicos sobre o que importa no mundo – de pessoas a eventos, locais, cultura. Graças à dedicação de mais de 25 mil editores, você tem acesso a informações atualizadas e confiáveis para desenvolver suas soluções.
O Wikidata também conecta você a mais de 10 mil outros sites, arquivos, redes sociais e muito mais, facilitando o acesso a dados adicionais sobre os tópicos necessários.
Fast Company – Qual sua visão sobre a evolução dos projetos de dados abertos nos próximos anos?
Lydia Pintscher – Grandes empresas de tecnologia vêm extraindo valor dos bens comuns há muitos anos, seja em dados abertos ou em software livre. Como sociedade, precisamos entender que isso mina os próprios recursos coletivos dos quais dependemos. Precisamos exigir algo melhor.
Acredito que, especialmente na era dos LLMs e tecnologias relacionadas, é fundamental compreender sobre o que esses sistemas são construídos. Muitas vezes, isso acontece sem qualquer retorno às comunidades.
o Wikidata permite que você seja participante ativo, não apenas consumidor.
Essas grandes empresas de IA estão, basicamente, minerando a internet sem reposição. Isso ameaça as fontes do material usado no treinamento de seus modelos. Se não houver fluxo de volta para projetos como Wikipédia ou Wikidata, entre muitos outros, eles acabarão sendo cortados das próprias pessoas que tornam as respostas possíveis.
Por isso, gostaria de ver mais gente contribuindo com projetos abertos como o Wikidata e depois construindo soluções a partir desses dados, sempre devolvendo algo ao projeto de que dependem.
A alternativa é um mundo em que a sociedade não tem influência sobre a tecnologia que usa diariamente, e da qual a democracia depende. Nesse cenário, ficaríamos reféns da “caixa-preta” que nos forçam a aceitar. Esse não é o futuro em que desejo viver.