Uma nova ferramenta de busca lançada pela companhia EveryZing espera mudar o modo como as pessoas procuram por áudio e vídeo on-line. Anteriormente conhecida como PodZinger, uma ferramenta de busca para podcasts, a empresa está investindo em sistemas de transcrição de discurso desenvolvidos pela companhia de tecnologia BBN, que converte palavras faladas em textos que podem ser buscados com 80% de precisão.

CARREGANDO :)

Ao digitar "Paris Hilton" na caixa de buscas, por exemplo, o usuário encontra diversos vídeos - muitos deles do YouTube - em que o nome da socialite é mencionado no áudio. Quando clica em um arquivo específico, a página identifica o momento em que a palavra buscada é mencionada. É possível fazer buscas em diversas línguas, inclusive em português.

A alta precisão permite novas capacidades de busca, como a habilidade de fornecer transcrições completas de vídeo e áudio, além do direcionamento a uma parte específica do arquivo em que a palavra ou frase é falada. Segundo Tom Wilde, diretor-executivo da EveryZing, a tecnologia permitirá que a empresa forneça publicidade associada com conteúdos específicos, do mesmo modo que o Google fornece anúncios baseado no texto de uma página na internet.

Publicidade

De acordo com o site da publicação "Technology Review", é extremamente difícil saber qual a variação de conteúdo está dentro de um arquivo de vídeo ou áudio. O EveryZing faz isso ao extrair o conteúdo de arquivos multimídia e transformando-o em texto para se aproveitar das ferramentas de busca já existentes, como as do Google e do Yahoo.

Apesar da web estar inundada de arquivos com falas no YouTube, em podcasts, reportagens de TV e programas de rádio, ainda é difícil procurar por palavras e nomes específicos e conseguir todos os resultados em que eles são mencionados – geralmente falta descrição suficiente para isso.

O principal objetivo da ferramenta é fazer parcerias com provedores de conteúdo para deixar seus arquivos multimídia aptos para a busca. A companhia quer transcrever todo o conteúdo contido em um vídeo para texto, adicionando marcas de tempo para que a pessoa possa ir diretamente para a parte desejada.

O sistema é capaz de reconhecer palavras de áreas específicas –- esse entendimento do significado é uma ferramenta poderosa, afirma Wilde, pois permite que o EveryZing forneça conceitos para os usuários que permitem refinação da busca –-, além da possibilidade de colocar os anúncios direcionados.

Apesar de boa, o próprio Wilde admite que o sistema não é perfeito. A precisão diminui quando há presença de música de fundo e se há diversas pessoas falando ao mesmo tempo. Mas para o mercado de informações e entretenimento que a companhia almeja, a tecnologia deve oferecer uma melhora significante sobre o que já está disponível.

Publicidade