Mesmo com avanços em inteligência artificial, Google ainda não consegue detectar com precisão vídeos extremistas do YouTube| Foto: Pixabay/

Um boicote de anunciantes ao YouTube está testando uma parte promissora e crítica do futuro do Google: a sua capacidade em inteligência artificial (IA). Alguns especialistas da área dizem que a tecnologia ainda não está pronta, mas que se há uma empresa que pode resolver o problema em questão, essa empresa é a gigante das buscas.

CARREGANDO :)

LEIA MAIS: Grandes anunciantes boicotam o Google

Algumas das maiores agências de publicidade do mundo cortaram os investimentos no YouTube depois que anúncios de grandes marcas foram vistos ao lado de vídeos extremistas e repletos de discurso de ódio. Analistas do Nomura Instinet estimam que a Alphabet, empresa-mãe do Google, corre o risco de perder US$ 750 milhões em receita nesse ano por conta do episódio.

Publicidade

O valor é menos de 1% das vendas projetadas para 2017, algo a que o Google consegue absorver sem maiores problemas. Mas é provável que o caso seja um incentivo para a empresa redirecionar investimentos em inteligência artificial e acelerar os esforços de pesquisa já em andamento.

Aprendizagem de máquina

Para detectar e policiar o conteúdo de todo o extenso acervo do YouTube e garantir que os anúncios não sejam veiculados ao lado de conteúdo questionável, o Google deve resolver um problema de AI que ninguém conseguiu ainda: compreender automaticamente tudo o que está acontecendo nos vídeos, incluindo gestos e outras nuances humanas.

Uma solução em potencial está na aprendizagem de máquina, uma poderosa técnica de IA para reconhecer automaticamente padrões em toneladas de dados - uma especialidade do Google. O CEO Sundar Pichai prometeu incorporar a tecnologia em todos os seus produtos e a empresa divulga suas habilidades no campo para desenvolvedores de software, clientes de computação na nuvem, anunciantes e acionistas.

Cientistas da computação duvidam que a tecnologia por si só consiga eliminar os vídeos ofensivos. “Ainda não chegamos no ponto onde poderemos, digamos, detectar todo o conteúdo extremista”, disse Hany Farid, professor de Dartmouth e consultor sênior do Counter Extremism Project, que reiteradamente chama a atenção do YouTube para que ataque o problema. Ele recomenda que empresas como o Google e o Facebook empreguem mais editores humanos para filtrar o conteúdo. “Aprendizagem de máquina, IA não está nem perto disso”, disse. “Não acredite nas promessas.”

Avanços em Inteligência Artificial

A máquina das promessas em IA está a todo vapor no Vale do Silício. Startups e gigantes da tecnologia como Google, Amazon e Microsoft competem para recrutar os engenheiros e cientistas mais qualificados da área.

Publicidade

Os avanços em IA do Google às vezes faz jus às com as promessas, mas não é sempre. Recentemente, por exemplo, a divisão de nuvem da empresa lançou uma ferramenta (não relacionada ao YouTube) que quebra vídeos em suas partes constituintes, tornando-os “pesquisáveis e detectáveis”. No início da semana, uma equipe de acadêmicos publicou uma pesquisa que mostra como enganar esse sistema injetando imagens em vídeos.

O Google usou aprendizagem de máquina e outras ferramentas de IA para dominar o reconhecimento de fala, texto e imagem. Em um caso famoso de 2012, pesquisadores conseguiram fazer uma rede de 16 mil computadores aprender a reconhecer gatos ao analisar milhões de fotos tiradas de vídeos do YouTube. Compreender vídeos inteiros, porém, é mais difícil. Gatos miam, se esticam e saltam em mais de mil quadros de vídeo a cada minuto.

“Um vídeo é tridimensional, com duas dimensões no espaço e uma dimensão adicional no tempo”, disse Jiebo Luo, especialista em inteligência artificial da Universidade de Rochester, que criou filtros de discurso de ódio baseados em texto para serviços de redes sociais como o Twitter. “É um desafio.” Especialmente para algo tão grande como o YouTube. Estima-se que em 2015 os usuários enviaram 300 horas de conteúdo por minuto para o serviço, tornando impossível esse tipo de análise de todos os vídeos na medida em que eles aparecem.

Dois anos se passaram, então poderia o software agora ter evoluído para um ponto onde ele disseca cada vídeo enviado, separando o joio do trigo? “É possível”, disse Luo, “ainda mais se levarmos em conta os enormes recursos computacionais e de pessoas de que o Google dispõe. Nenhuma outra empresa está em melhor posição para fazer isso”.

Ainda assim, não é algo barato. O vídeo exige algoritmos avançados e poder computacional. Hoje, a indústria confia em semicondutores especializados, chamados unidades de processamento gráfico (GPU, na sigla em inglês), para guiar o software. Processar uma hora de vídeo normalmente ocupa metade dos recursos de uma GPU, disse Reza Zadeh, fundador da Matroid, uma da IA focada em vídeo. Uma placa de vídeo com um chip de última geração da líder de mercado Nvidia é vendida por cerca de US$ 500.

Publicidade

O Google gasta bilhões de dólares por ano em data centers, servidores e nos chips que os fazem funcionar. A empresa não diz o quanto disso vai para o YouTube, mas o site de vídeos é conhecido por ter um custo de operação elevado.

Para IA, o Google chegou a desenvolver seu próprio hardware, chamado Unidades de Processamento TensorFlow (TPU). Recentemente, a empresa ofereceu um prêmio de US$ 30 mil para que pesquisadores usassem seus recursos na nuvem e TPUs, ou ferramentas similares de IA, para rotular com precisão os vídeos do YouTube. Pesquisadores do Google aplicam software de aprendizagem de máquina para classificar imagens e sons dentro de vídeos há anos (“este vídeo rotulado como uma música do Prince é realmente o Prince?”), enquanto aperfeiçoa as recomendações e o desempenho dos anúncios. Outra parte da Alphabet - um grupo chamado Jigsaw - está usando ferramentas de IA de outras maneiras a fim de conter o discurso de ódio na Internet.

Em um comunicado enviado a anunciantes do YouTube prejudicados, semana passada, a empresa disse que seus algoritmos de aprendizagem de máquina melhorarão a precisão e a classificação dos vídeos. No entanto, o Google também avisou que com o volume de conteúdo envolvido, isso jamais poderá ser 100% garantido.

Classificar o que ouvimos e assistimos online, tudo ao mesmo tempo, “é um problema que está essencialmente aberto”, disse Zadeh. “O Google está provavelmente fazendo isso agora.”

Ele está provavelmente certo. Em uma conferência do Google realizada em fevereiro, Jeff Dean, chefe do “Brain”, uma unidade de pesquisas em inteligência artificial do Google, falou sobre os avanços de sua equipe. “O próximo grande domínio é o vídeo”, disse.

Publicidade