Uma brainstorm conduzida em 2014 por professores e bolsistas do Instituto Radcliffe para Estudos Avançados da Universidade Harvard analisou a fundo o futuro do uso do big data nas pesquisas de ciências sociais. Em termos simples, o big data é, ao mesmo tempo, a possibilidade de acesso a uma imensa quantidade de informações sobre objetos, sistemas, pessoas e a relação entre esses elementos, e a possibilidade de agregar e extrair valor de tudo isso.
Na ocasião, embora as possibilidades de acesso à informação e as técnicas de análise de dados já tivessem evoluído muito, esses cientistas queriam investigar que tipo de quebra de paradigma o uso dos dados poderia provocar nos estudos urbanos. Não à toa. É cada vez mais comum a presença de pessoas capacitadas em áreas como Física, Estatísticas e Ciência da Computação em núcleos de estudos urbanos, aplicando, ao lado de sociólogos, geógrafos, urbanistas e outros, técnicas avançadas de análise em prol do entendimento dos processos urbanos e do desenvolvimento das cidades.
O encontro resultou em seis grandes aspectos-chave e suas possibilidades, resumidos em um artigo publicado em setembro do ano passado pelos professores de Harvard Robert J. Sampson e Mario Luis Small. Confira esses seis grandes caminhos em que o big data pode provocar grandes transformações urbanas:
1. Coleta de dados
Uma das questões-chave apontadas pelos pesquisadores aqui é a necessidade de se dar transparência a algoritmos e processos de geração de dados. É que embora plataformas de buscas e mídias sociais sejam boas fontes de dados, as companhias responsáveis por elas tendem a mudar de forma frequente suas programações, interferindo diretamente e de forma inesperada em pesquisas e estudos importantes. Outro ponto importante é o fato de que os dados hoje oferecidos por organizações administrativas, como as cidades, tendem a ter um propósito próprio, com problemas de qualidade, abrangência e imparcialidade, limitando a atuação dos pesquisadores, que dessa forma acabam sendo mais “observadores” desses dados do que desenvolvedores deles. Essas duas questões são impactadas, então, por uma terceira: a dificuldade de acesso aos dados. Algumas capitais brasileiras, como Curitiba, por exemplo, dizem ter aberto alguns de seus dados, mas na prática o acesso a eles não é “self-service”. Depende de contatos formais e da assinatura de convênio, explicando que dados serão usado e para quê.
Além disso, a colaboração da sociedade é especialmente importante na coleta dos ditos “dados tradicionais”, como a quantidade de imóveis vazios de uma comunidade, por exemplo. Para fazer isso sozinha, a prefeitura teria de contar com um bom software de georreferenciamento e imagens de satélite (o que custa caro). E ainda assim, teria de fazer parte do trabalho pessoalmente, enviando servidores ao local. Por outro lado, com a ajuda de desenvolvedores seria possível criar um aplicativo e incentivar o engajamento dos próprios moradores do local para mapeá-lo – algo que cidades como Detroit já fizeram. Se não há transparência e acessibilidade de dados, há dificuldade na atuação de pesquisadores e empresas e a sociedade civil como um todo.
2. Diversidade no emprego do big data
A partir da ampliação do acesso e o avanço das possibilidades de análise de dados, também surgiram novas metodologias e maneiras de usar o big data em pesquisas. Durante o encontro, os cientistas discutiram exemplos de estudos realizados que vão da identificação/prevalência de racismo por meio de levantamentos nos mecanismos de busca do Google ao uso dos dados da receita federal norte-americana – que têm alcance nacional e permitem monitoramento ao longo do tempo – para estudar a mobilidade social entre gerações de uma mesma família. São maneiras diferentes de usar os mesmos dados, e também novas maneiras de gerar novos dados.
3. Técnicas analíticas emergentes
Se o big data é, ao mesmo tempo, conteúdo e método, e permite o surgimento de novas variáveis para modelos já existentes, isso quer dizer que alguns parâmetros normalmente usados em pesquisas ganharam, nos últimos anos, ainda mais precisão e possibilidades. Alguns dos exemplos discutidos no encontro de Harvard trataram, por exemplo, da etnografia no ambiente virtual. A possibilidade de observar o modo como as pessoas navegam na internet e como elas tomam algumas decisões na web está criando novas oportunidades para entender melhor e desenvolver estruturas de tomada de decisão e processos de avaliação, importantes não só para os estudos acadêmicos, mas também para as empresas. Um exemplo a partir disso? Um site de busca de imóveis pode ser modelado de forma a mostrar as informações mais relevantes primeiro e de maneira mais clara para “facilitar” a decisão do comprador/internauta. Outro exemplo? Cientistas estão tentando criar um modelo que consiga identificar a razão por trás de um padrão de comportamento: ao levantar dados sobre busca de termos racistas é difícil saber se a procura ocorreu porque o usuário quer apenas saber o significado do termo ou porque o usuário é mesmo racista. Por meio do desenvolvimento de modelos sequenciais de busca, os cientistas pretendem desenhar um método que resolva essa questão. Boa sorte para eles!
4. Dados e instituições
Quem vai levantar dados? Quem vai fiscalizar e garantir a segurança durante este processo? E quem vai desenvolver as ferramentas necessárias para facilitar o acesso às informações para os cientistas? As cidades têm deixado a janela de oportunidade do big data por uma série de razões. Uma delas é que normalmente não há muita gente dentro de uma administração pública de olho nos dados. Essa questão só ganha importância quando é preciso melhorar ou mesmo resolver uma anomalia em um sistema. Outro ponto é que o que as cidades têm buscado em seus dados não é necessariamente a mesma coisa que motiva os cientistas a olharem para os mesmos dados. E é muito difícil que uma cidade, por inúmeras razões, siga uma agenda pré-determinada nesse sentido. Uma das soluções levantadas no encontro de Harvard para isso é a possibilidade de as cidades confiarem nas universidades locais para traçar um caminho. É algo que muitas cidades, incluindo Curitiba, já estão fazendo.
As quatro principais universidades da capital paranaense (UP, UTFPR, UFPR e PUCPR) são parcerias da prefeitura em convênios com os governos da Holanda e da Suécia para projetos de ciclomobilidade e eletromobilidade, respectivamente. É na parceria com as instituições de ensino que também é possível investir mais e melhor em dados, por meio de convênios e financiamentos com empresas e instituições financeiras interessadas na área. Por outro lado, algumas cidades têm optado por fazer parcerias diretamente com empresas, normalmente gigantes multinacionais de tecnologia.
Em meio a toda essa “parceria”, caberá a alguém o papel de fiscalização e controle. O que garante que as pesquisas acadêmica seguirão propósitos genuínos e não a vontade política de um prefeito? E o que garante que as cidades não atenderão aos propósitos de uma empresa? Como os pesquisadores manterão sua independência durante todo o processo? Tudo isso precisa ser pensado, e logo.
5. Privacidade e segurança
Cientistas estão na linha de frente da coleta e análise de dados, mas isso quer dizer que eles também precisam ficar atentos a vulnerabilidades e investir em proteção. Essa foi uma das conclusões do encontro em Harvard. Mas e o restante dos mortais? As cidades e os cidadãos?
Nos últimos dias, a notícia da prisão de suspeitos de terrorismo no Brasil, às vésperas da Olimpíada, e em razão do monitoramento de mensagens de WhatsApp colocou o dedo nessa ferida. As mensagens mandadas pelo aplicativos são criptografadas, ou seja, têm informações embaralhadas para que não possam ser compreendidas caso alguém esteja “espiando” a transmissão delas. Mas a segurança é limitada, frágil na origem e no destino da mensagem (leia mais sobre isso). De qualquer forma, o exemplo levanta várias questões polêmicas típicas dos novos tempos: as grandes multinacionais de tecnologia têm direito de oferecer serviços fechados ou até mesmo “indecifráveis” para as autoridades, mesmo que em nome da privacidade dos usuários? Qual o papel das cidades na fiscalização dessas empresas, que muitas vezes atuam ser nem estarem dentro da legislação municipal e do país? E que segurança o próprio usuário tem de que seus dados e mensagens não estão atendendo algum objetivo obscuro, não transparente, dessa mesma empresa?
6. Interdisciplinaridade
Como mencionado na abertura dessa reportagem, o uso do big data também tem colaborado (e muito) para um movimento de interdisciplinaridade nos ambientes de pesquisa. Mas isso também causa conflitos: enquanto um cientista da área de computação pode estar mais interessados no desenvolvimento de um método, o sociólogo está mais interessado na precisão dos dados finais, que o ajudarão na formulação de um hipótese. Essa parceria só terá um ambiente bom para crescer se as instituições de ensino superior enxergarem a necessidade de incentivar a interdisciplinaridade – e nem todas já entenderam a necessidade e os benefícios disso.