Assistentes de voz são o exemplo mais próximo de como a inteligência artificial já está mudando a vida das pessoas.| Foto: Bigstock/

Com um celular na mão, muito parecido com o que você provavelmente carrega em seu bolso neste momento, um homem aciona o assistente de voz do Google. “Fazer uma reserva de restaurante”, ele diz. “Ok, eu achei umas opções”, diz a voz feminina que sai do aparelho, enquanto a tela mostra uma listagem com alguns endereços. “Caffé Istambul!”, escolhe o usuário. “’Hum’, parece ótimo. Eu vou ligar para fazer uma reserva no Caffé Istambul. É para quantas pessoas?”, retruca a voz. “Duas”, responde o homem. “Ok, para duas pessoas. Para quando?”, segue com o diálogo o aparelho. Informações coletadas, a voz liga para o restaurante e fala com um atendente do outro lado da linha; combina horário, mesa e dia do jantar. Em menos de um minuto a reserva está efetuada. O smartphone então retorna uma mensagem de confirmação para “seu chefe”, com uma eficiência digna de secretária em novela de Manoel Carlos. Mas com uma pequena diferença: essa secretária é um algoritmo.

CARREGANDO :)

A descrição acima é de um teste do site Venture Beat, especializado em tecnologia, com o novo sistema criado para o assistente de voz do Google: um mecanismo dotado de inteligência artificial (IA) que, de tão sofisticado, rendeu vários “não pode ser” à gigante da tecnologia. É que o Duplex, nome dado a esta IA, fala de forma tão fluída quanto um ser humano. A linguagem é tão natural que muitos tecnólogos pediram uma investigação para saber se o CEO da empresa, Sundar Pichai, não havia fraudado a apresentação do sistema, em maio, na conferência de desenvolvedores do Google.

Na ocasião, Pichai fez uma reserva semelhante à descrita anteriormente. Um dos sites mais importantes dos EUA, o Axios, pediu por semanas esclarecimentos á empresa, ventilando que um humano estaria “interpretando” a máquina.

Publicidade

Não estava. Semanas depois, o Google chamou jornalistas para desafiar o Duplex. Os profissionais teriam que fazer o papel de atendente de restaurante para testar o assistente de voz, caprichando em perguntas capciosas. O sistema provou sua eficiência.

“Eu já trabalhei em restaurantes e devo dizer que, embora a ligação do Duplex tenha sido um pouquinho mais complicada do que a de um humano, você quase não nota isso. A ligação toda durou um pouco mais de um minuto e meio e eu estava intencionalmente tentando confundir o sistema”, descreveu a jornalista Karissa Bell, do Mashable.

LEIA TAMBÉM: Robôs-táxis começam a levar passageiros nos Estados Unidos

Mas você nem precisará ler a avaliação dela. É que o sistema, digno de um cenário futurista de cinema, já começou a chegar aos celulares de gente comum nos Estados Unidos. O Google começou neste mês a disponibilizar esta IA para um grupo que chama de “usuários confiáveis” – não surpreendentemente, todos donos de smartphones da marca Pixel (que é do Google). Esses selecionados já podem reservar restaurantes em cidades como Nova York, Atlanta, Phoenix e San Francisco.

Obviamente, a ideia da empresa é disponibilizar a tecnologia para o máximo de pessoas e lugares nos próximos meses, como forma de demarcar território no competitivo e bilionário segmento das inteligências artificiais (a consultoria IDC diz que os desenvolvedores de IA devem faturar até 40 bilhões de dólares somente até 2020).

Publicidade

Se isso de fato ocorrer, será a primeira vez que a inteligência artificial se tornará, de fato, algo do dia a dia para uma massa de usuários. O Android, sistema operacional do Google para smartphones e onde o Duplex será disponibilizado primeiro, tem nada menos que 2 bilhões de usuários no mundo.

“O lançamento é definitivamente um ponto de ruptura. Mostra que a tecnologia de aprendizagem de máquinas está, finalmente, corrigindo suas falhas e chegando ao usuário final com o potencial que sempre se esperou”, aponta Pedro Paulo Sotto, cientista de dados e consultor em robótica, ex-professor da Universidade Federal de Santa Catarina.

Pode ser uma virada comparável com a do surgimento do iPhone – e consequentemente da era dos smartphones –, em 2007. O momento em que a IA sai dos braços dos entusiastas da tecnologia e das empresas com foco em inovação e passa.

Assistentes de voz dotados de IA para smartphones estão aí há algum tempo, mas nunca conquistaram de fato as massas. Isso porque oferecem uma péssima experiência do usuário. Mesmo a Siri, da poderosa Apple, não é muito mais do que um robô limitado que, muitas vezes, sequer entende os comandos de dono do iPhone. O próprio Google tentou embutir inteligência em um aplicativo de conversa chamado Allo – uma espécie de WhatsApp para interagir só por voz e que, pela ideia inicial, seria capaz de analisar o que os interlocutores conversavam pra sugerir atividades de acordo com seus interesses, por exemplo. Naufragou de vez nessa semana, segundo nota da empresa. É que mais atrapalhava do que ajudava com sua dificuldade para interpretar a voz e acertar nas intenções do usuário. Parece o oposto do Duplex, que consegue manter um padrão conversacional interessante. Inclusive embute interjeições como “hums” e “ahs”, além e pausas que dão um tom humano à conversa.

LEIA TAMBÉM: Suécia está prestes a abolir o dinheiro vivo

Publicidade

É tão fluido levou a uma curiosa pressão ética da comunidade científica. O Google teve que adaptar o Duplex para que se apresente como um sistema automatizado ao ligar para qualquer estabelecimento. Sua primeira frase é algo como “sou um assistente do Google”.

Mas, obviamente, a empresa norte-americana não está disposta a investir alguns milhões no desenvolvimento de uma tecnologia de inteligência artificial apenas para que você reserve uma mesa para comer fondue no fim de semana. Tampouco o objetivo no curto prazo é criar uma espécie de ciborgue que se confunda com um humano – algo que ainda está somente na imaginação de roteiristas de “Black Mirror” e séries sci-fi semelhantes. Há uma meta muito mais próxima: vencer o que os especialistas chamam de “batalha dos bots”, nomenclatura pela qual são chamados estes softwares feitos para se comunicar com humanos.

Tão logo o Duplex ganhou as primeiras páginas dos jornais e destaque nos sites de tecnologia, a gigante chinesa Alibaba (que domina o mercado oriental e bate de frente com o Google) mostrou a alguns jornalistas seu sistema concorrente, o AliMe. O algoritmo chinês, segundo resenhas de jornais que fizeram o teste, também tem habilidade conversacional que foge daquelas dos bots comuns: consegue fazer interrupção, seguir uma estrutura não-linear e implicar ou entender intenções. Para o cérebro humano, tudo isso é instintivo, mas para as máquinas é um martírio, por mais que use processadores poderosos.

E todo mundo está de olho no universo dos bots porque, possivelmente, eles vão sepultar boa parte da internet que conhecemos, incluindo a poderosa ferramenta de buscas do Google. Para muitos especialistas em predições sobre a tecnologia – profissionais chamados de futuristas –, a tendência é que web se torne um espaço tão vazio quanto uma paisagem do meio-oeste americano. Ou melhor, habitado por um bando de robôs. É que com aparelhos dotados de inteligência artificial atuando como secretários 24 horas por dia, os humanos não precisarão vasculhar páginas e páginas de busca para encontrar uma informação que precisa. Esse trabalho será exclusivamente dos robôs.

LEIA TAMBÉM: Robôs são ‘contratados’ para lidar com envelhecimento de agricultores e ausência de imigrantes

Publicidade

Para Andreas Berger, professor da famosa universidade Singularity, nos EUA, especializada justamente em treinar profissionais para tecnologias futuras, os bots já estão em todo lugar na internet. “Eles conversam conosco nos sites de compra, atendem os clientes nos call centers, marcam consultas e até influenciam nas eleições”, afirmou por e-mail. “Muitas operações na internet agora são validadas por bots. Por exemplo: há muitos bots analisando currículos de quem se candidata a um emprego. Ao mesmo tempo, há bots que nos ensinam a criar um currículo que passe por esses ‘robôs empregadores’”, completa. Para o estudioso, as empresas já perceberam o valor dessa forma de comunicação. E, agora, “os usuários comuns também estão aprendendo porque uma IA é fundamental para navegar em um mundo cheio de bots”.

Assim, ele vislumbra, a tendência crescente é que a forma de interação entre uma pessoa e uma empresa, por exemplo, seja inteiramente via robôs. E isso é algo com implicações bastante óbvias: sará mais tempo livre aos humanos para atividades criativas; reduzirá empregos, como o de um atendente de restaurante; e deixará exposto um grande conjunto de dados pessoais. Mas há uma preocupação intrínseca que pe muito maior..

“O problema é simples. Se os bots são mais eficientes do que as pessoas, eles podem realizar tarefas que os humanos não podem. Mas quando há bots dos dois lados, as coisas começam a fugir do controle”, exemplifica Berger em um artigo publicado no site Medium.

O tom pode parecer de alarmismo. Mas cabe lembrar que em 2017 o Facebook encerrou um estudo com chatbots – que são esses sistemas de conversa baseados em IA, mas que usam apenas escrita – após descobrir que os computadores haviam elaborado uma linguagem própria, fora de qualquer padrão estabelecido pelos engenheiros humanos. Ainda não era prenúncio do apocalipse das máquinas, mas assuntou os pesquisadores o fato de não se ter controle sobre o que os computadores estavam “pensando”.

“Os problemas surgem ao deixar esse cenário piorar – isto é, dar aos bots mais e mais controle sobre nossa atividade on-line diária. Se um dia acontecer, a internet todas será baseada em comunicação por máquinas. Não por humanos, como é hoje”, apontou, também por e-mail, Ryan Langstone, professor associado de Ética do MIT.

Publicidade

O especialista sustenta que é “necessário pensar em quais interações gostaríamos de fazer por conta própria e quais deveriam ser feitas somente por máquinas”. Talvez o mundo de bots vs. bots dê mais trabalho aos humanos do que se pensa. “Temos que ser meticulosos aos terceirizar nossas tarefas diárias a um computador”, disse.

Provavelmente nem a Amazon tivesse imaginado o tamanho do sucesso. Com uma tecnologia muito mais simples do que estas apresentadas pelo Google e pelo AliBaba, o Echo, um assistente pessoal que parece uma caixinha de som, esgotou suas unidades em 2016, ano em que chegou, de fato, ao mercado. Segundo o Wall Street Journal, naquele ano foram comercializadas mais de 5 milhões de unidades do aparelho, que realiza tarefas simples, como pedir táxi, ligar luzes, acionar alarmes. Da mesma forma, o Google Home, seu principal concorrente, foi bem recebido.

A empresa vendeu um a cada segundo no último trimestre de 2017. Tais números provam que há uma demanda por aparelhos dotados com algum grau de IA e que facilitem as tarefas cotidianas. “Esses aparelhos saíram do mundo dos entusiastas da tecnologia para chegar ao público geral. Isso mostra que há uma demanda por isso. E analisando historicamente, é fácil entender em que ponto as coisas deslancham”, diz Sotto.

LEIA TAMBÉM: Como o Google Fotos se transformou no dono das nossas memórias

E com um detalhe: se Echo e Google Home custam algumas centenas de reais, o Duplex chegará de graça aos smartphones Android. Isso, por si só, será uma alavanca para seu sucesso.

Publicidade

Mas, embora a tecnologia do Google impressione e dê um vislumbre de futuro, ainda é limitada a tarefas bem específicas. Caso você tente pedir um Uber com o Duplex, ainda não conseguirá. Pelo menos por um tempo. “Vemos várias oportunidades aqui; é uma questão de realmente construir isso. É importante pensarmos não apenas na tecnologia que precisamos acertar, mas em todos os elementos do produto: a divulgação, a experiência com as empresas, a experiência do usuário”, disse a empresa via nota de imprensa.

Parece no caminho certo. E no limiar de um mundo em que não se sabe o que é humano e o que é máquina. Para despertar um debate que é velho, mas começa a bater no umbigo. Todo mundo têm o direito de saber se está falando com um humano ou com uma máquina. É uma base fundamental da interação social. Por isso o Google foi compelido a fazer seu sistema informar, em uma ligação, que é um assistente computadorizado e não simplesmente ligar e se passar por uma pessoa”, defende Lagstone, do MIT.

“Não vejo dilema ético sobre se o funcionário sabe se está falando com uma máquina ou não. Logo a empresa substituirá esse funcionário por um assistente robótico também”, contrapõe Enrique Dans, professor de Inovação na IE Business School, de Madri, Espanha, em um artigo sobre o assunto em seu site.

“Não vamos criar problemas que não existem. A única coisa interessante sobre tudo isso, se você é um sociólogo, é como o nosso comportamento e os nossos protocolos evoluirão em um mundo no qual a voz das máquinas é indiscernível da das pessoas”, ele sustenta.

Essa discussão, sim, ainda caberá aos humanos.

Publicidade

LEIA TAMBÉM: Carne em laboratório e abelhas inteligentes: biotecnologia é próximo boom das startups

A arte da conversa do Duplex do Google – como funciona

É mais fácil criar um propulsor capaz de levar uma nave espacial a Marte do que imitar a complexidade da fala humana. É que, quando se fala, não há muitas regras, não. Falamos rápido, cortando frases, misturando informações... Tudo isso é imperceptível para o cérebro humano, capaz de entender todas essas nuances em um piscar de olhos. Para o computador, porém, é de queimar eletrodos.

Para criar a tecnologia do Duplex, o Google usou uma técnica antiga na ciência de dados, chamada de rede neural recorrente (RNN, na sigla em inglês). Basicamente ela é um estudo de como as informações precisam ser relacionadas com um contexto e com informações anteriores para fazer algum sentido. A gigante norte-americana também usou seu sistema de aprendizagem de máquinas, o TensorFlow. Aprendizagem de máquina é como ensinar um software a analisar padrões e aprender, sozinho, a tirar conclusões.

Os engenheiros do Google juntaram uma quantidade quase infindável de diálogos por telefone entre humanos para “ensinar” seu sistema a reagir às perguntas e, assim, interagir com o interlocutor. É mais ou menos o que todos os desenvolvedores de bots fazem. Mas em um trabalho bem mais meticuloso. A inteligência artificial do Google aprendeu a usar interjeições (como “hum” e “ah”, por exemplo) para tornar a conversa menos robótica. E mais: os desenvolvedores investiram na fluidez da conversa como nenhuma outra empresa de tecnologia conseguiu.

Mas há um limitador. Por enquanto o Duplex consegue manter conversas apenas nas áreas em que foi treinado: reserva de mesas em restaurantes e salões de beleza. O modelo ainda precisará ser adaptado para funcionar em qualquer tipo de conversa.

Publicidade