27 de Julho de 2024 - Ano 10
NOTÍCIAS
Ciência e Tecnologia
03/03/2024

Por que reproduzir o corpo humano ainda é uma barreira para ferramentas de IA? Confira

Foto: Reprodução

Olhar mais atento evidencia imprecisões nas imagens feitas por inteligência artificial. Em alguns casos, falhas são grotescas

A imagem do Papa usando um casaco puffer branco, criada por inteligência artificial (IA), fez muita gente acreditar que o líder do Vaticano havia saído às ruas com um vestuário nada comum para um Pontífice. Em outro exemplo conhecido, o ex-presidente americano Donald Trump aparece preso. Mas passado o choque inicial, um olhar mais atento evidencia falhas que em alguns casos significam erros grotescos.

 

As mesmas ferramentas capazes de reproduzir com doses de hiper-realismo cenas do cotidiano ou de transformar em imagens visões de futuro deixam a desejar na reprodução do corpo humano. As mãos nos dois exemplos citados aparecem distorcidas. No caso do Papa, os dedos da mão direita se fundem a um objeto. Na imagem de Trump, um dos policiais que o prendia só tinha quatro dedos.

 

Não são apenas as mãos. Apesar de todo o avanço da IA generativa, pés, dentes e outras partes da anatomia parecem ser a barreira mais visível destas ferramentas, em um sinal de que capturar nuances ainda pode ser um desafio para os algoritmos. Em alguns casos, essas falhas são o único ponto que permite distinguir um conteúdo falso do verdadeiro.

 

Veja também

 

Fake Out of Home nas estratégias de marketing

 

Mesmo a 1,6 mil km/h, por que não sentimos a Terra girando?


Mas por que a inteligência artificial ainda tem dificuldade em reproduzir partes do corpo humano? A explicação vai além das telas e da capacidade computacional destas ferramentas digitais. Os próprios artistas sempre tiveram dificuldade em desenhar partes do corpo humano.

 

Algo que é comum entre estudantes de Artes Visuais, explica Lícius Bossolan, artista visual e professor do curso de Pintura da Escola de Belas Artes da UFRJ. Para lidar com esse desafio, os alunos partem do método de observação, como na disciplina Desenho Anatômico, em que analisam como tal músculo ou articulação funciona antes do início de um desenho.


Em seguida, lançam mão da capacidade de abstração frente ao objeto e da técnica de simplificação das formas, puxando para elementos geométricos:

 

— A complexidade maior é o entendimento dos movimentos. Os movimentos da mão, por exemplo, são bastante ricos. São várias articulações — diz Bossolan.

 

Expectativa x realidade: Evento para crianças anunciado com imagens feitas com IA vira caso de polícia na Escócia
Além da sua anatomia mais complexa, há muitos ângulos possíveis de representação que precisam ser compreendidos: elas podem aparecer abertas, fechadas, segurando objetos, acenando ou apontando para alguém, por exemplo. Em alguns casos, a mão pode também estar escondida ou só aparecer alguns dedos.

 

Quando esse desafio de representação migra para os sistemas digitais, há uma dificuldade ainda maior uma vez que o aprendizado da inteligência artificial depende das informações que foram inseridas em seus bancos de dados, lembra Diogo Cortiz, professor da Pontifícia Universidade Católica de São Paulo (PUC-SP):

 

— O principal calcanhar de aquiles é a variedade que a IA tem que pensar na hora de criar a imagem. A inteligência artificial não conhece a realidade como conhecemos. Ela vai tentar recriar uma mão com base no que ela tem de informação em seu banco de dados, que muitas vezes está desfocado, embaçado ou em várias posições diferentes. Isso pode fazer a IA se perder.

 

Imagine um sistema de IA treinado com milhões de imagens, nas quais todas as pessoas usavam sapatos fechados, e o usuário pede a imagem de um indivíduo com chinelos?

 

Esse é o exemplo que ilustra bem as chances de um resultado não ser satisfatório via IA, resume Arthur Igreja, especialista em inovação e tecnologia:

 

O que foi informado ao sistema: imagem hiper-realista retrata um homem tirando uma selfie com os amigos em um cinema lotado. As pessoas assistem a uma comédia e riem muito — Foto: Imagem gerada por Midjourney

Foto: Reprodução

 

— Outro fator é que os modelos aprendem por reforço positivo ou negativo dos usuários. Ou seja, se a imagem solicitada for em uma situação não usual, até que não seja pedido para refazê-la, a IA não terá entendimento. Isso aumenta por consequência a chance de entregar algo estranho.

 

A multiplicação de falhas na representação de partes do corpo, em especial de mãos, pés e dentes, é um desafio para as empresas de inteligência artificial (IA). Mas será que, em um futuro breve, os sistemas já estarão treinados para superar esse entrave? Especialistas avaliam que isso já está muito perto de acontecer e é questão de poucos meses.


Um porta-voz da Stability AI, empresa de IA generativa de código aberto, afirmou ao BuzzFeed no ano passado que, dentro dos conjuntos de dados de IA, as imagens humanas exibem as mãos de forma menos visível que os rostos.


As mãos tendem a ser menores nas imagens que alimentam as ferramentes, pois são raramente expostas em formatos grandes, o que ajudaria a explicar a dificuldade dos sistemas. Procuradas pelo GLOBO, empresas de IA não comentaram.

 

Representar corretamente a anatomia humana é uma curva de aprendizado para a calibragem de conteúdos gerados por IA, diz o especialista em inovação e tecnologia Arthur Igreja. A tendência é que haja um “refino”, pois é do interesse das empresas que desenvolvem a tecnologia. Quando a fase for superada, será ainda mais premente a discussão sobre identificação de imagens geradas por IA para evitar desinformação.

 

— Vamos avançar em como identificar e “taguear” imagens geradas por IA. A partir do momento que a semelhança se torne tal que fique muito difícil para um grande número de pessoas distinguir, e falta pouco para isso, será importante saber o que é uma foto, um acontecimento e o que é gerado por IA. Caso contrário, as pessoas vão formar opiniões a partir disso — destaca Igreja.

 

Já existem na web algoritmos de código aberto que são sistemas de restauração. São capazes de restaurar imagens de baixa qualidade e transformá-las em alta qualidade, eliminando desfoques e distorções, como o GFPGAN (Generative Facial Prior-Generative Adversarial Network) e o CodeFormer.

 

Embora o foco seja a otimização de imagens reais, servem para aprimorar imagens sintéticas, mas são mais voltados a quem tem habilidade com programação.

 

Muitas plataformas já estudam formas de criar algum tipo de marca-d’água via criptografia para identificar conteúdos criados por IA. Um exemplo é o SynthID, em versão beta do Google Cloud. A ideia é que o marcador não seja visível ao olho humano, mas detectável para identificação pelas máquinas — e, quem sabe, ser lido pelas redes sociais. Assim, caso um conteúdo tenha sido criado artificialmente, uma plataforma poderia informar o usuário sobre sua autenticidade. Mas a alternativa está longe de resolver o problema.


Em primeiro lugar, seria necessário algum tipo de operação integrada entre plataformas para permitir este tipo de marca-d’água. Depois, muitas plataformas de IA generativa de código aberto (como Midjourney e Sora, da OpenAI) têm regras próprias.

 

Curtiu? Siga o PORTAL DO ZACARIAS no FacebookTwitter e no Instagram.

Entre no nosso Grupo de WhatAppCanal e Telegram

 

— É um jogo de gato e rato — resume Diogo Cortiz, professor da PUC-SP nas áreas de comunicação e ciências exatas.

 

Fonte: O Globo

LEIA MAIS
DEIXE SEU COMENTÁRIO

Nome:

Mensagem:

publicidade

publicidade

publicidade

publicidade

publicidade

Acompanhe o Portal do Zacarias nas redes sociais

Copyright © 2013 - 2024. Portal do Zacarias - Todos os direitos reservados.