Matthias Niebner criou um software assustador, mas ele prefere não classificá-lo dessa forma. Ele está cansado de alusões a ditadores e propagandistas. Também não aguenta mais as perguntas sobre manipulação e identidade.
E, mesmo assim, não dá para evitar: Face2Face é assustador. Essa é a primeira expressão que sai da boca das pessoas que assistem à demonstração da tecnologia por Niebner em um auditório no subsolo do Hirshhorn Museum, em Washington (EUA).
O software, desenvolvido pela Niebner e outros quatro cientistas da computação, permite que um usuário controle com precisão realista o rosto de outra pessoa em um vídeo. Você pode literalmente colocar palavras na boca de alguém. Você pode zombar, enganar ou representar.
E ele não necessita de hardware sofisticado ou sensores de movimento – você só precisa de uma webcam e um pouco de conhecimento em código para roubar as expressões faciais de Barack Obama, Angela Merkel ou do papa Francisco. É que o software usa um conceito avançado de reconhecimento facial, que permite as alterações. E em tempo real.
Não era isso que Niebner pretendia com o Face2Face, e ainda não é. Ele vê uso potencial em Hollywood, onde a dublagem dos filmes ainda é desastrosa, bem como no Vale do Silício, onde o professor de Stanford atualmente vive. Ele acha que poderia ser particularmente útil na realidade virtual, onde há um desejo crescente de reconstruir rostos.
E, no entanto, Niebner não consegue escapar do fator “morbidez”, por mais que tente. No Hirshhorn, na última semana, sua apresentação precedeu uma palestra do artista de novas mídias Josh Kline; Kline usou um software de substituição de rosto semelhante ao de Niebner para criticar as ansiedades da vida moderna. “É sobre o poder de roubar identidades”, disse ele, “para assumir o rosto de alguém, a voz de alguém”.
O Washington Post se sentou com Niebner para discutir a morbidez da tecnologia, erros e decepções; e a fonte de ambos.
Pergunta: As pessoas sempre dizem a mesma coisa quando veem esta tecnologia. Primeiro, dizem que é legal, então, dizem que é “assustador” ou “mórbido”. Como você acha vai superar essa reação visceral inicial?
Resposta: Eu trabalhei com computação gráfica por alguns anos. Então, para mim, esta reação é sempre um pouco surpreendente, porque um monte das coisas que vemos o tempo todo são geradas sinteticamente. Eu uso o exemplo de “Avatar”: nesse filme, e um monte de outros filmes recentes, tudo é sintético. Eu acho que é importante que as pessoas saibam disso. Você tem que estar ciente de que o que você vê em um vídeo não é necessariamente real.
P: Uma coisa é um filme de Hollywood de enorme sucesso, como “Avatar”, mas as pessoas provavelmente não têm essa expectativa ao ver um noticiário rápido no YouTube, por exemplo.
R: Mas talvez devessem. A única diferença com a nossa tecnologia é que ela permite que você edite um vídeo existente. Em um filme, você teria que construir modelos 3D primeiramente; teria muita arte envolvida em um trabalho extenso -- nós eliminamos essa necessidade; meio que facilitamos tudo. Mas o resultado com a nossa tecnologia é o mesmo daquele que alguém conseguiria com um vídeo sintético.
Então, digamos que um governo quer te enganar. A nossa tecnologia não faria muita diferença para ele, pois ele já tem os recursos necessários para isso, certo? Mas estamos abrindo essa capacidade de edição para todo mundo.
P: Você disse algo interessante certa vez, que “a tecnologia está avançando e nós temos que estar certos de que vá na direção certa”. Quem é este “nós” da frase? Quem é responsável por isso?
R: Bem, em um ambiente acadêmico, você diria a comunidade, que é um termo muito vago. Queremos dizer a comunidade de pesquisadores. Acho que há alguma responsabilidade deste lado ainda.
Mas acho que muito da responsabilidade vem também das empresas e dos investidores. Um bom exemplo recente é Elon Musk. Ele investiu em uma empresa chamada Open AI e estão tentando descobrir como tornar a aprendizagem de máquina [um conceito dentro de inteligência artificial] acessível ao público e, dessa forma, fazer com que todos possam usá-la e monitorá-la. É, basicamente, um grande esforço para garantir que as máquinas não nos destruam. Parece muito precoce, mas esse é o medo que muitas pessoas têm. E isso acontece muito por conta da mídia -- sem ofensa.
P: Não ofende!
R: A mídia agrava isso. Esse é o trabalho. É assim que se cria audiência, certo? É um jogo justo. Mas isso leva ao medo. Eu acho que é importante que a tecnologia se torne acessível a todos e que, em algum momento, as pessoas conheçam e entendam. Se você não conhece nosso programa e alguém edita um vídeo e te manda, isso se torna muito ruim! Mas se você sabe que estes vídeos são falsos, então não faz qualquer diferença.
P: Tenho a impressão de que você é está cansado de pessoas perguntando sobre as implicações mais obscuras desta tecnologia. Quer dizer, você vive no Vale do Silício, é muito otimista e está, obviamente, superanimado com ela...
R: Sim, está ficando um pouco cansativo. É sempre a mesma pergunta. Nós, obviamente, não estamos tentando fazer quaisquer declarações políticas ou qualquer outra coisa, ou tentando roubar identidades. Estamos aqui para, na verdade, criar aplicações comerciais específicas. Mas a mídia tenta tirar alguma história disso, o que faz sentido.
P: Mas não é só a mídia, certo? O auditório em que você apresenta sua tecnologia, em Washington, também recebe um artista que é fundamentalmente crítico sobre a tecnologia e suas implicações na identidade e bem cívico. E há outros acadêmicos, outras opiniões - qualquer discussão de suas possíveis aplicações parece ser uma crítica válida.
R: Eu acho que os artistas, neste caso, não são necessariamente representantes da opinião pública. A questão é: o que tem apelo público e com os telespectadores? Assim, as pessoas escrevem o que alguém quer ler. É uma espécie de entretenimento. E a arte é mais ou menos igual - se você é um artista e não tem nenhum seguidores, nenhum fã, então tem um problema, certo? Então, eu acho que é por aí.
Eu não sei. Eu posso entender que algumas gerações são, você sabe, preocupadas, mas não estamos fazendo qualquer mal. Não estamos tentando fazer as pessoas falsificarem as coisas. Estamos do outro lado, tentando ajudar as pessoas a descobrirem o que está acontecendo e o que podemos fazer com os dados digitais. Dados digitais são apenas bits e bytes. Você pode editar isso, certo. Então, como se certificar de que é realmente a coisa certa?
P: Quanto tempo temos até enfrentar algumas destas questões?
R: Bem, temos trabalhado nisso há cerca de um ano, eu diria. É tudo relativamente novo. Este campo é que está se movendo muito rapidamente - há tanta coisa legal acontecendo agora, tanto em termos de tecnologia de sensores e aprendizado de máquina quanto em métodos de otimização.
Eu gosto de pensar sobre o smartphone – os smartphones mudaram muito, e mudaram muito o mundo, em um período relativamente curto de tempo. Todo mundo tem um smartphone agora e eles são os computadores que costumavam estar em grandes mesas de trabalho há 10 anos. E eles são muito, muito bons e podem fazer um monte de tarefas complexas. Mas, agora que o mercado de smartphones está saturado, pelo menos nos EUA, as pessoas estão pensando: “qual será o próximo passo?”.