Uma brainstorm conduzida em 2014 por professores e bolsistas do Instituto Radcliffe para Estudos Avançados da Universidade Harvard analisou a fundo o futuro do uso do big data nas pesquisas de ciências sociais. Em termos simples, o big data é, ao mesmo tempo, a possibilidade de acesso a uma imensa quantidade de informações sobre objetos, sistemas, pessoas e a relação entre esses elementos, e a possibilidade de agregar e extrair valor de tudo isso.
Na ocasião, embora as possibilidades de acesso à informação e as técnicas de análise de dados já tivessem evoluído muito, esses cientistas queriam investigar que tipo de quebra de paradigma o uso dos dados poderia provocar nos estudos urbanos. Não à toa. É cada vez mais comum a presença de pessoas capacitadas em áreas como Física, Estatísticas e Ciência da Computação em núcleos de estudos urbanos, aplicando, ao lado de sociólogos, geógrafos, urbanistas e outros, técnicas avançadas de análise em prol do entendimento dos processos urbanos e do desenvolvimento das cidades.
O encontro resultou em seis grandes aspectos-chave e suas possibilidades, resumidos em um artigo publicado em setembro do ano passado pelos professores de Harvard Robert J. Sampson e Mario Luis Small. Confira esses seis grandes caminhos em que o big data pode provocar grandes transformações urbanas:
Como o big data já está mudando a sua vida
Em dezembro de 2015, a Gazeta do Povo mostrou em uma reportagem o quanto o big data já está mudando a vida das pessoas.
Leia matéria completa
1. Coleta de dados
Uma das questões-chave apontadas pelos pesquisadores aqui é a necessidade de se dar transparência a algoritmos e processos de geração de dados. É que embora plataformas de buscas e mídias sociais sejam boas fontes de dados, as companhias responsáveis por elas tendem a mudar de forma frequente suas programações, interferindo diretamente e de forma inesperada em pesquisas e estudos importantes. Outro ponto importante é o fato de que os dados hoje oferecidos por organizações administrativas, como as cidades, tendem a ter um propósito próprio, com problemas de qualidade, abrangência e imparcialidade, limitando a atuação dos pesquisadores, que dessa forma acabam sendo mais “observadores” desses dados do que desenvolvedores deles. Essas duas questões são impactadas, então, por uma terceira: a dificuldade de acesso aos dados. Algumas capitais brasileiras, como Curitiba, por exemplo, dizem ter aberto alguns de seus dados, mas na prática o acesso a eles não é “self-service”. Depende de contatos formais e da assinatura de convênio, explicando que dados serão usado e para quê.
Além disso, a colaboração da sociedade é especialmente importante na coleta dos ditos “dados tradicionais”, como a quantidade de imóveis vazios de uma comunidade, por exemplo. Para fazer isso sozinha, a prefeitura teria de contar com um bom software de georreferenciamento e imagens de satélite (o que custa caro). E ainda assim, teria de fazer parte do trabalho pessoalmente, enviando servidores ao local. Por outro lado, com a ajuda de desenvolvedores seria possível criar um aplicativo e incentivar o engajamento dos próprios moradores do local para mapeá-lo – algo que cidades como Detroit já fizeram. Se não há transparência e acessibilidade de dados, há dificuldade na atuação de pesquisadores e empresas e a sociedade civil como um todo.
2. Diversidade no emprego do big data
A partir da ampliação do acesso e o avanço das possibilidades de análise de dados, também surgiram novas metodologias e maneiras de usar o big data em pesquisas. Durante o encontro, os cientistas discutiram exemplos de estudos realizados que vão da identificação/prevalência de racismo por meio de levantamentos nos mecanismos de busca do Google ao uso dos dados da receita federal norte-americana – que têm alcance nacional e permitem monitoramento ao longo do tempo – para estudar a mobilidade social entre gerações de uma mesma família. São maneiras diferentes de usar os mesmos dados, e também novas maneiras de gerar novos dados.
3. Técnicas analíticas emergentes
Se o big data é, ao mesmo tempo, conteúdo e método, e permite o surgimento de novas variáveis para modelos já existentes, isso quer dizer que alguns parâmetros normalmente usados em pesquisas ganharam, nos últimos anos, ainda mais precisão e possibilidades. Alguns dos exemplos discutidos no encontro de Harvard trataram, por exemplo, da etnografia no ambiente virtual. A possibilidade de observar o modo como as pessoas navegam na internet e como elas tomam algumas decisões na web está criando novas oportunidades para entender melhor e desenvolver estruturas de tomada de decisão e processos de avaliação, importantes não só para os estudos acadêmicos, mas também para as empresas. Um exemplo a partir disso? Um site de busca de imóveis pode ser modelado de forma a mostrar as informações mais relevantes primeiro e de maneira mais clara para “facilitar” a decisão do comprador/internauta. Outro exemplo? Cientistas estão tentando criar um modelo que consiga identificar a razão por trás de um padrão de comportamento: ao levantar dados sobre busca de termos racistas é difícil saber se a procura ocorreu porque o usuário quer apenas saber o significado do termo ou porque o usuário é mesmo racista. Por meio do desenvolvimento de modelos sequenciais de busca, os cientistas pretendem desenhar um método que resolva essa questão. Boa sorte para eles!
São Paulo “adota” startups para enfrentar o trânsito
Leia a matéria completa4. Dados e instituições
Quem vai levantar dados? Quem vai fiscalizar e garantir a segurança durante este processo? E quem vai desenvolver as ferramentas necessárias para facilitar o acesso às informações para os cientistas? As cidades têm deixado a janela de oportunidade do big data por uma série de razões. Uma delas é que normalmente não há muita gente dentro de uma administração pública de olho nos dados. Essa questão só ganha importância quando é preciso melhorar ou mesmo resolver uma anomalia em um sistema. Outro ponto é que o que as cidades têm buscado em seus dados não é necessariamente a mesma coisa que motiva os cientistas a olharem para os mesmos dados. E é muito difícil que uma cidade, por inúmeras razões, siga uma agenda pré-determinada nesse sentido. Uma das soluções levantadas no encontro de Harvard para isso é a possibilidade de as cidades confiarem nas universidades locais para traçar um caminho. É algo que muitas cidades, incluindo Curitiba, já estão fazendo.
As quatro principais universidades da capital paranaense (UP, UTFPR, UFPR e PUCPR) são parcerias da prefeitura em convênios com os governos da Holanda e da Suécia para projetos de ciclomobilidade e eletromobilidade, respectivamente. É na parceria com as instituições de ensino que também é possível investir mais e melhor em dados, por meio de convênios e financiamentos com empresas e instituições financeiras interessadas na área. Por outro lado, algumas cidades têm optado por fazer parcerias diretamente com empresas, normalmente gigantes multinacionais de tecnologia.
Curitiba quer juntar cadastros e criar um cidadão único para novo 156
Leia a matéria completaEm meio a toda essa “parceria”, caberá a alguém o papel de fiscalização e controle. O que garante que as pesquisas acadêmica seguirão propósitos genuínos e não a vontade política de um prefeito? E o que garante que as cidades não atenderão aos propósitos de uma empresa? Como os pesquisadores manterão sua independência durante todo o processo? Tudo isso precisa ser pensado, e logo.
5. Privacidade e segurança
Cientistas estão na linha de frente da coleta e análise de dados, mas isso quer dizer que eles também precisam ficar atentos a vulnerabilidades e investir em proteção. Essa foi uma das conclusões do encontro em Harvard. Mas e o restante dos mortais? As cidades e os cidadãos?
Nos últimos dias, a notícia da prisão de suspeitos de terrorismo no Brasil, às vésperas da Olimpíada, e em razão do monitoramento de mensagens de WhatsApp colocou o dedo nessa ferida. As mensagens mandadas pelo aplicativos são criptografadas, ou seja, têm informações embaralhadas para que não possam ser compreendidas caso alguém esteja “espiando” a transmissão delas. Mas a segurança é limitada, frágil na origem e no destino da mensagem (leia mais sobre isso). De qualquer forma, o exemplo levanta várias questões polêmicas típicas dos novos tempos: as grandes multinacionais de tecnologia têm direito de oferecer serviços fechados ou até mesmo “indecifráveis” para as autoridades, mesmo que em nome da privacidade dos usuários? Qual o papel das cidades na fiscalização dessas empresas, que muitas vezes atuam ser nem estarem dentro da legislação municipal e do país? E que segurança o próprio usuário tem de que seus dados e mensagens não estão atendendo algum objetivo obscuro, não transparente, dessa mesma empresa?
6. Interdisciplinaridade
Como mencionado na abertura dessa reportagem, o uso do big data também tem colaborado (e muito) para um movimento de interdisciplinaridade nos ambientes de pesquisa. Mas isso também causa conflitos: enquanto um cientista da área de computação pode estar mais interessados no desenvolvimento de um método, o sociólogo está mais interessado na precisão dos dados finais, que o ajudarão na formulação de um hipótese. Essa parceria só terá um ambiente bom para crescer se as instituições de ensino superior enxergarem a necessidade de incentivar a interdisciplinaridade – e nem todas já entenderam a necessidade e os benefícios disso.
Leia o artigo completo de Robert J.Sampson e Mario Small, Bringing Social Science Back In: The “Big Data” Revolution and Urban Theory, publicado em setembro de 2015, como parte da coleção de artigos The Cities Papers, disponível no site do Conselho de Pesquisa em Ciências Sociais dos EUA.