Topo

Próxima geração de efeitos da Adobe inclui foto 'completada' com IA

CEO da Adobe, Shantanu Narayen, abre o Adobe MAX 2019 em Los Angeles - Divulgação
CEO da Adobe, Shantanu Narayen, abre o Adobe MAX 2019 em Los Angeles
Imagem: Divulgação

Gisele Pungan

Colaboração para o TAB, de Los Angeles

28/12/2019 04h01

Com as bochechas rosadas e o sorriso amarelo de quem tenta emplacar uma piada para uma audiência difícil, Zeyu Jin, pesquisador especialista em interação humano-computador, ganhou os aplausos de 15 mil "criativos" que assistiam atentos aos "Sneaks", no Max 2019. A conferência, promovida pela Adobe, reúne designers de todo o mundo para discutir criatividade e apresentar novidades em primeira mão nos aplicativos que são a principal ferramenta de trabalho de quem trabalha com vídeo, áudio e ilustração digital.

Numa cerimônia semelhante à do Oscar, os "Sneaks" são o ponto alto do evento. Comandada pelo humorista americano John Mulaney (a voz do do "Spider-Ham", a versão porco do Homem-Aranha), a festa põe no palco profissionais de tecnologia para apresentar ao vivo, com direito a telas escuras cheias de códigos, uma prévia das tecnologias em fase de pesquisa na Adobe. Zeyu Jin se saiu bem. Arrancou aplausos depois de apresentar uma funcionalidade que elimina ruídos e equaliza um arquivo de áudio em um clique, tarefa que poderia demorar cerca de uma hora com a tecnologia disponível hoje.

Na plateia o visual predominante é cool: cabelos coloridos, óculos de aros grossos, camisas estampadas e centenas ­­- talvez milhares - de tatuagens. Uma jornalista pode parecer extraterreste se ousar abrir um computador rodando Windows num mar de iPhones 11 e Ipads Pro. O palco é dominado por nerds encabulados, mostrando exemplos que podem não passar pelo severo crivo dos criativos.

Em 2019, quem abriu a apresentação foi a fotógrafa Mina Doroudi, com o projeto All In. Na tentativa de cativar o público, ela usou a técnica do storytelling: "No fim de semana passado, fui com meu marido fazer uma trilha no monte Davidson, e queríamos ter uma foto juntos mas não havia ninguém para nos fotografar. Então, eu tirei uma foto dele e ele tirou uma minha. Eu poderia juntar as duas fotos no Photoshop, mas isso tomaria muito tempo, então que tal ver como o All In pode ajudar?"

Doroudi digita um comando e a tela fica cheia de números incompreensíveis. Logo mais vêm as pistas do que está acontecendo: "comparando rostos... uma pessoa encontrada... cortando a pessoa faltante... juntando?" e voilà: 13,479401588439941 segundos depois (o programa faz também a contagem do tempo), temos a foto do casal na paisagem escolhida. Do ponto de vista da inteligência artificial é uma conquista e tanto: o aplicativo lê a imagem, identifica as pessoas nela por reconhecimento facial, mapeia o corpo inteiro do sujeito faltante, recorta a imagem e o insere numa segunda imagem. Mas o designer ao meu lado desdenha: "Não era mais fácil levar um pau de selfie?".

Pó de pirlimpimpim

Todos os Sneaks apresentados no Max 2019 continham inteligência artificial disponibilizada pelo Sensei — termo oriental que significa "aquele que veio antes", e é usado em geral para designar um professor. O nome evoca um mestre enigmático que resolve grandes problemas sem demonstrar muito esforço. Essa personificação não é casual:

"Queremos trazer certa magia para as experiências digitais. Como numa história de Harry Potter: há familiaridade com o mundo, ele faz sentido, mas existe aquela pitada de mágica, seja nas árvores que se mexem com vida própria ou no ensopado que está se cozinhando sozinho no fogão." É assim que Tatiana Mejia, chefe de produtos de marketing e estratégia da Adobe, descreve a Inteligência Artificial da empresa.

Presente em dezenas de produtos, Sensei ajuda nas tarefas triviais até as mais complexas. Pode por exemplo, tratar uma foto do seu RG tirada com o celular na mesa de sua casa. Ele identifica as bordas do documento, corta e corrige a perspectiva para deixar a imagem perfeita, como se você tivesse escaneado. Ou, quase do jeito que os roteiristas de "Black Mirror" imaginaram, faz um cookie em promoção pular na sua frente enquanto você percorre um caminho de olho no celular.

Como qualquer inteligência artificial, o Sensei precisa ser alimentado com dados para "aprender", e a fonte do conhecimento do velhinho é a nuvem da Adobe, o Creative Cloud. Lançada em 2011, a plataforma é um marco na história da empresa, quando softwares como o Photoshop passaram a ser vendidos por assinatura on-line. No novo formato, a empresa fica em contato com os usuários com atualizações frequentes dos programas, e, pela mesma via, coleta informações sobre o uso e o conteúdo que está sendo produzido neles.

A coleta de dados é feita por aprendizado de máquina, o que significa que apenas máquinas vêem quando você passa horas apagando um elemento indesejado numa foto ou escolhe determinada composição num desenho. Então, essas máquinas vão "contar" ao Sensei tudo o que você faz e com isso ele vai "adivinhar" quais são as melhores dicas para o que você precisa. Para deixar a coisa ainda mais misteriosamente mágica, não há nenhum botão, filtro ou comando 'Sensei' nos aplicativos da Adobe. "Ele é um ingrediente, e nós escolhemos não o identificar nos nossos programas. Então, você não vai saber onde está a Inteligência Artificial, a não ser que alguém te conte.", afirma Mejia.

Os próximos truques

O comediante John Mulaney apresenta os Sneaks do Adobe MAX 2019 - Divulgação - Divulgação
O comediante John Mulaney abre os Sneaks 2019
Imagem: Divulgação

Rabiscos que falam, realidade virtual, animações em um clique: veja quais são os truques que deixaram os designers de boca aberta no Max 2019 e podem estar disponíveis em breve nos aplicativos da Adobe.

  • All In - imagine que você está fazendo uma trilha com um amigo e quer tirar uma foto juntos (mas não uma selfie / nem há onde apoiar o celular para tirar a foto com timer). Com essa funcionalidade, a partir de duas fotos (uma de cada pessoa), o programa identifica quem não está na foto escolhida, recorta a pessoa faltando e a coloca na imagem junto com a outra pessoa, tudo em um clique.
  • Sound Seek - elimina sons recorrentes em gravações de áudio. É possível, por exemplo, tirar todos os "hmms" em uma fala longa selecionando apenas o primeiro "hmm" na trilha do áudio.
  • Sweet Talk - cria animações de fala em imagens estáticas a partir de um arquivo de áudio. Dá pra fazer o autorretrato do Van Gogh falar em um clique.
  • Pronto - facilita a prototipação de projetos de realidade aumentada. Com um celular, o usuário grava um vídeo com os gestos que serão os gatilhos de uma ação de realidade aumentada, como um estalar de dedos. Depois ele pode associar esse gesto a uma interação de realidade aumentada -- por exemplo, uma janela virtual se abre. A funcionalidade permite então que essa interação seja testada (alguém estala o dedo em frente ao celular e a janela se abre) sem precisar de um programa de 3D.
  • Image Tango - mistura 2 imagens, levando em conta a forma de uma e a textura de outra. É possível, por exemplo, a partir da imagem de um vestido e imagens de outras roupas, criar novos vestidos com a textura e cores das roupas. É o tipo de tecnologia que pode juntar imagens de duas pessoas para criar uma terceira.
  • Fantastic Fonts - cria animações para fontes (letras) sem perder as propriedades de edição do texto.
  • Go Figure - permite animações de movimentos de personagens a partir de vídeos caseiros gravados pelo celular. Você grava seu amigo andando na rua e com um clique faz o seu personagem de animação andar como ele, sem precisar passar horas animando cada membro do boneco no After Effects.
  • Light Right - a partir de algumas fotos de um mesmo local (ou o usuário tira várias ou ele procura num banco outras imagens de um mesmo local fotografado), a funcionalidade recria a iluminação da cena, do nascer ao pôr-do-sol.
  • Awesome Audio - equaliza e limpa áudios amadores em um clique.
  • Glowstick - cria efeitos de luz em imagens vetorizadas no Illustrator.
  • About Face - identifica quando um retrato de pessoa foi modificado, mostra onde houve alteração e reverte o efeito.

Foi "photoshopado"?

Segundo a Adobe, cerca de 90% dos profissionais que trabalham com imagens hoje usam o Photoshop, produto de maior sucesso da marca. Eles não estão sozinhos: o programa hoje é tão popular que é comum ouvir a expressão "foi photoshopado" quando uma imagem foi adulterada.

No mesmo caminho, as ferramentas de edição de áudio da empresa enfrentam uma questão ética: o que é usado para corrigir e criar também pode ser usado para iludir. No Max de 2016, Zeyu Jin, o pesquisador que apresentou o Awesome Audio neste ano, impressionou a plateia com o projeto VoCo, que ele mesmo apelidou de "Photoshop do áudio". Usando a inteligência do Sensei, a partir de um áudio de 20 minutos da fala, ele emula a voz da pessoa para ler novos textos. Colocar palavras na boca de alguém nunca foi tão fácil — e convincente. Apesar de ter sido apresentada há 3 anos, a funcionalidade ainda não está disponível para o público.

Quem assume a responsabilidade?

A acessibilidade às ferramentas de edição de conteúdo é um dos fatores que contribui para o atual problema da disseminação de conteúdo falso. Na tentativa de remediar essa questão a Adobe anunciou, durante o Max 2019, a Iniciativa da Autenticidade de Conteúdo, em parceria com o jornal The New York Times e o Twitter. "Nós estamos desenvolvendo um padrão para a indústria que vai permitir que os criadores coloquem sua assinatura no seu trabalho digital. Essa atribuição vai acompanhar suas peças de conteúdo em diferentes plataformas, posts e stories", explica Scott Belsky, CPO e Vice-presidente da Adobe.

Scott Belsky, CPO da Adobe, anuncia a Iniciativa da Autenticidade de Conteúdo no Adobe MAX em Los Angeles - Reprodução - Reprodução
Scott Belsky, CPO da Adobe, anuncia a Iniciativa da Autenticidade de Conteúdo no Adobe MAX em Los Angeles
Imagem: Reprodução

O objetivo do projeto é permitir que o público tenha mais material para julgar a confiabilidade do conteúdo consumido, e que os criadores possam ter seu crédito atribuído. "Sabemos que a princípio nem todo mundo vai compartilhar os dados de criação, mas acreditamos que com o tempo o público vai esperar que o conteúdo venha com esse tipo de informação", complementa Belsky.