Google e Universidade da Califórnia criam detector de deepfakes que enxerga o que o olho humano não vê

Google e Universidade da Califórnia criam detector de deepfakes que enxerga o que o olho humano não vê

Principais destaques:

  • Novo sistema promete reconhecer vídeos falsos até quando o rosto não aparece.
  • Ferramenta analisa movimento, fundo e luz para detectar manipulações sutis.
  • Tecnologia pode se tornar essencial para jornalistas e redes sociais na luta contra a desinformação.

A ameaça invisível dos deepfakes

Vídeos gerados por inteligência artificial estão cada vez mais realistas e perigosos.

O que antes parecia uma brincadeira tecnológica virou uma ferramenta poderosa de manipulação, capaz de criar imagens e vozes falsas de pessoas reais.

Para enfrentar essa nova forma de desinformação, o Google se uniu à Universidade da Califórnia, em Riverside, e lançou o UNITE, sigla para Universal Network for Identifying Tampered and synthEtic videos.

O UNITE se diferencia de outras tecnologias porque identifica falsificações mesmo quando o vídeo não mostra rostos.

A detecção acontece ao examinar planos de fundo, padrões de movimento e pequenos detalhes que escapam à percepção humana.


Como funciona o detector do Google

O sistema foi construído a partir de um modelo baseado em transformers, a mesma arquitetura usada em grandes modelos de linguagem e visão.

Ele analisa cada quadro do vídeo e procura inconsistências de espaço e tempo, minúsculas falhas geradas quando um conteúdo é manipulado.

A base do funcionamento do UNITE está num mecanismo de aprendizado conhecido como SigLIP (Sigmoid Loss for Language Image Pre-Training), que permite ao modelo reconhecer padrões visuais sem depender de um objeto ou pessoa específica.

Outra inovação é o método chamado “attention-diversity loss”, que obriga o sistema a observar várias regiões da imagem, evitando que ele se concentre apenas em rostos.

A parceria com o Google ofereceu aos pesquisadores acesso a enormes bancos de dados e poder computacional suficiente para treinar o modelo com diferentes tipos de falsificação, desde simples trocas de rosto até vídeos totalmente gerados por IA a partir de texto ou imagens estáticas.


Por que o UNITE é importante

A chegada do UNITE ocorre em um momento crítico.

Ferramentas de geração de vídeo a partir de texto se popularizaram e permitem que qualquer pessoa produza vídeos falsos com aparência profissional.

O que representa uma ameaça séria à reputação de indivíduos, empresas e até à democracia, dependendo do contexto político de cada país.

O estudo foi apresentado na Conferência de Visão Computacional e Reconhecimento de Padrões de 2025 (CVPR), realizada em Nashville, nos Estados Unidos.

O artigo descreve a arquitetura e o processo de treinamento do UNITE e sugere que esta pode ser a primeira solução realmente universal para detecção de vídeos sintéticos, um passo importante para preservar a confiança nas imagens que vemos.

✨ Curtiu este conteúdo?

O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google – e isso só é possível com o apoio de pessoas como você. 🙌

Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!

Clique aqui e faça parte da nossa rede de apoiadores.

Autor

  • Gaby Souza é criador do MdroidTech, especialista em tecnologia, aplicativos, jogos e tendências do mundo digital. Com anos de experiência testando dispositivos e softwares, compartilha análises, tutoriais e notícias para ajudar usuários a aproveitarem ao máximo seus aparelhos. Apaixonado por inovação, mantém o compromisso de entregar conteúdo original, confiável e fácil de entender