O Office of Creative Research, um laboratório de dados de Nova York, tem muito a ensinar aos jornalistas

Tecnologia E Ferramentas

'And That's The Way It Is' é uma colaboração entre o programa de arte pública Landmarks da Universidade do Texas, Ben Rubin e o Office for Creative Research. (Crédito da foto: OCR)

Se você estivesse andando no campus da Universidade do Texas em Austin em uma noite de primavera em 2012, você teria visto várias pessoas recebendo suas notícias do lado de um prédio de cinco andares.

Frases das transmissões lendárias de Walter Cronkite, bem como feeds de notícias ao vivo de todo o país, foram projetada para o lado do Jesse H. Jones Communication Center, dando a qualquer um que passasse uma olhada nas notícias noturnas do passado e do presente.

O projeto foi criado por membros da O Escritório de Pesquisa Criativa , um grupo de pesquisa com sede em Nova York que geralmente cria visualizações de dados, performances em espaços públicos e protótipos para ajudar as pessoas a entender as informações.

Nos últimos meses, eles criou uma visualização sobre a teoria da relatividade geral de Einstein para a Scientific American, fiz uma extensão do Chrome que ajuda as pessoas a entender a segmentação de anúncios e trabalhou com a National Geographic para rastrear a vida selvagem, em tempo real, no Delta do Okavango em Botsuana.

Seu trabalho combina jornalismo, pesquisa de usuários, desempenho público e digitalizações em larga escala que fazem as pessoas entenderem ou processarem informações de novas maneiras (vários membros do grupo de pesquisa migraram do The New York Times recentemente fechado Laboratório de P&D).

Entrei em contato com o Office of Creative Research para saber mais sobre a abordagem do grupo para engajamento e informação em larga escala, que vai muito além dos limites de uma tela e tem muitas aplicações para redações.

Eu amo que você projetou o noticiário noturno em um prédio de cinco andares no Texas. É o oposto de um dispositivo móvel. Todos estão compartilhando uma experiência comunitária juntos. Você poderia falar um pouco sobre como você vê o espaço público e como as redações podem ver o espaço público ao pensar em como transmitir a notícia?

Em primeiro lugar, a maior parte do crédito por essa peça maravilhosa vai para Ben Rubin, cofundador de OCR, que agora é diretor do Parsons’ Institute for Information Mapping.

Ben conta uma ótima história sobre andar de bicicleta para casa à noite quando era criança e ver todas as janelas da rua piscarem em sincronia – porque todos estavam sintonizados no mesmo noticiário ao mesmo tempo. Isso toca no que Teju Cole chama de “tempo público” e acho que é um conceito realmente valioso para se pensar quando examinamos a relação entre os dados e o público.

O espaço público mudou devido à prevalência de dispositivos móveis. As pessoas parecem estar menos conscientes de seus arredores e menos propensas a se comunicar umas com as outras, mas muito mais propensas a se comunicar com alguém distante daquele espaço.

Como você decide quais projetos assumir? O que faz um bom projeto? Uma continuação: O que faz um bom evento ao vivo versus um projeto digital?

Recusamos a maioria dos trabalhos que surgem em nosso caminho, seja porque é um trabalho de publicidade, ou porque não se encaixa em nosso caminho de pesquisa ou porque há algo que não combina com nossa ética central. Ou, mais frequentemente, porque podemos fechar os olhos imediatamente e imaginar como resolveríamos o problema. Para melhor ou para pior, somos atraídos por problemas novos e difíceis. Felizmente, construímos uma reputação de fazer coisas estranhas, então cada vez mais as pessoas vêm até nós porque têm uma ideia estranha e têm um palpite de que entenderemos o que estão pensando.

Pragmaticamente, também procuramos garantir que haja dados reais por trás do projeto. Muitas vezes as pessoas nos procuram com ideias realmente interessantes, mas por causa de políticas organizacionais ou barreiras técnicas ou restrições orçamentárias, elas não conseguem nos fornecer os dados. Como nossa abordagem é “primeiro os dados”, tentamos obter alguma garantia do cliente de que os dados existem ou que podemos colaborar para construir um sistema para coletá-los.

No que diz respeito à divisão entre ao vivo e digital, isso é algo que está se esvaindo para nós projeto por projeto. Temos tentado conceber maneiras de que cada projeto nosso possa existir tanto física quanto digitalmente e possa ser experimentado ao vivo e em arquivo. Temos dois projetos no momento que são empreendimentos de dados baseados na web e, para ambos, estamos criando experiências físicas como parte de nossa abordagem - uma escultura em grande escala na frente de uma prefeitura, o segundo uma performance de uma corda quarteto.

Muito do seu trabalho diz respeito a tornar assuntos difíceis muito mais fáceis de entender. Você criou um jogo interativo e uma narrativa para explicar as descobertas de um artigo recente da Nature. Eu adoraria saber mais sobre como esse projeto foi desenvolvido e como você testou o que construiu para garantir que o público entendesse a animação.

Fomos abordados pelo (professor) Simon J. Anthony para que ele comunicasse visualmente as ideias em seu artigo para um público maior além dos colegas pesquisadores. Decidimos focar nos diferentes tipos de relacionamentos entre vírus em hospedeiros, especialmente quando eles não causam nenhuma doença aparente. Para fazer previsões, primeiro você precisa determinar que tipos de padrões existem, então grande parte do aspecto educacional do jogo é tentar mostrar a diferença entre aleatoriedade e padrões determinísticos. O que também nos interessou em sua pesquisa foi quando você examina as interações entre vírus em diferentes escalas. Os padrões podem ser muito diferentes, por isso tornou-se importante pensar em nível de vírus para vírus, nível de vírus para host e nível de comunidade de muitos hosts. O fato de que todos esses tipos de relacionamentos estão acontecendo simultaneamente e que existem padrões potencialmente previsíveis conduzindo sua existência foi o maior atrativo para nós.

Quando as pessoas chegam ao OCR com um projeto, tentamos entender o que os dados ou a pesquisa estão tentando transmitir e fazemos o melhor para interpretá-los e traduzi-los para um público mais amplo. Nesse caso, queríamos expandir o alcance da pesquisa de Simon para além da comunidade científica ou acadêmica. Criamos uma narrativa simplificada que explicaria alguns dos conceitos centrais do artigo. Adicionar um elemento de jogo parecia a maneira natural de consolidar alguns dos conceitos abstratos que estávamos tentando mostrar e ter um apelo mais amplo. Para tornar o assunto mais acessível, queríamos que a linguagem visual do site fosse colorida, amigável e lembrasse os invasores do espaço. O emoji de cocô revelou-se uma ferramenta muito importante que faz referência ao método de coleta das amostras de vírus e também adiciona alguma leveza ao site.

Vejo o trabalho que você faz como jornalismo, mas fora da redação tradicional. Você ajuda as pessoas a entender e dar sentido ao seu mundo. Você tem um projeto favorito?

Somos definitivamente “jornalismo adjacente”. Quatro dos nossos 10 membros da equipe têm experiência em notícias e acho que compartilhamos abordagens éticas e técnicas com uma redação. Dito isto, nem sempre estamos interessados ​​em contar uma história de forma organizada. Fundamentalmente, somos um grupo de pesquisa e acho que muito do nosso melhor trabalho é inerentemente incompleto. Nós educadamente nos recusamos a escolher um projeto favorito.

Grande parte do seu trabalho envolve conectar pessoas a informações por meio do desempenho. Um dos meus favoritos é tocar Banco de dados de coleções de 120.000 objetos do MoMA . Você pode falar um pouco sobre como você escolheu realizar um banco de dados e como você pensou em audiências e espaços públicos ao fazê-lo?

Fomos convidados pelo MoMA para participar de sua série Artists Experiment, o que significava colaborar com seu departamento de educação em algo que pudesse ser visto como um programa público.

Nossas ideias iniciais giravam principalmente em torno da criação de APIs conceituais, que permitiriam aos visitantes (tanto no prédio quanto na internet) interagir com os bancos de dados do museu de maneiras interessantes. Como se vê, existem muitas condições políticas em uma instituição como o MoMA, e não conseguimos obter permissão para fazer o trabalho que inicialmente queríamos. Então decidimos reformular o problema e ver como poderíamos apresentar os dados que já eram públicos de maneiras novas e interessantes. Mark Hansen e Ben Rubin tinha um histórico de dados e performance, então eles realmente lideraram o desenvolvimento da peça com [o grupo de teatro] Serviço de conserto de elevador e estruturou a performance nas galerias.

Trazer dados para o espaço público muda a maneira como as pessoas esperam interagir com eles. Também torna a experiência de dados um pouco menos voluntária – principalmente, “lemos” dados quando clicamos em um link ou viramos uma página ou participamos de uma palestra. Ao colocar uma escultura de dados em um parque ou encenar uma performance de um banco de dados em uma galeria de arte, de certa forma, forçamos os dados nas pessoas, o que muda a dinâmica da conversa.

Nas redações, uma peça é frequentemente publicada e, em seguida, os editores, repórteres e a equipe de visualização de dados passam para o próximo projeto. Vocês escrever que quando os museus “incentivam o fazer artístico com os dados de suas coleções, os museus também se encontram envolvidos em um belo tipo de recursão: eles produzem dados que produzem arte que produz dados, e assim por diante”.

Isso me lembra quando as organizações de notícias estão realmente no topo de suas seções de comentários, porque obtêm novas ideias de histórias das pessoas que responderam à primeira matéria. Estou curioso sobre como as redações podem incentivar seu público a remixar seu conteúdo ou criar algo novo a partir do que produzem. Eu vejo tantos projetos que levaram tanto tempo para serem feitos – e então a equipe passa para o próximo projeto. Existem maneiras de estender além da publicação?

Desde o início do OCR, somos fascinados pela ideia de feedback. Constantemente tentamos engajar nosso público além da mera saída das ferramentas que criamos. Da coleta de dados à visualização de dados, muitas etapas e atores estão envolvidos, muitas vezes moldando e influenciando os dados inicialmente coletados. Por uma questão de transparência e abertura, é, portanto, fundamental para nós envolver as pessoas ao longo do processo de transformação de dados, desde bits brutos até saídas sensoriais.

Vemos isso como uma tentativa de empurrar contra o gradiente de poder que impulsiona a maioria dos sistemas de dados, nos quais as pessoas de quem os dados vêm têm menos poder e governos e corporações têm mais.

Alguns de nossos projetos, como o “Floodwatch”, envolvem o público no processo de coleta de dados. Outros como “Into The Okavango” fornecem às pessoas ferramentas para consultar dados brutos por meio de APIs públicas. Em breve, lançaremos um projeto de ciência cidadã, “Cloudy With A Chance of Pain”, que incentiva os participantes a explorar dados de saúde pública e enviar suas próprias hipóteses à equipe de pesquisa do projeto na Universidade de Manchester, Reino Unido. Existem muitos caminhos para envolver o público que ainda não foram explorados, e acreditamos fortemente que eles não devem se limitar ao final do processo criativo.

Ultimamente, estamos interessados ​​em como as comunidades podem criticar diretamente os dados. Estamos criando algumas APIs que permitem que os usuários anotem objetos de dados com perguntas sobre procedência, comentários sobre veracidade ou críticas de metodologia.

Quando me deparei com a página do seu projeto, pensei em tantas maneiras pelas quais as redações poderiam pensar sobre espaço, desempenho e coleta de dados. Mas eles geralmente precisam de recursos e tempo. Que pequenas coisas as organizações podem fazer para ajudar as pessoas a fazer conexões e entender melhor o mundo ao seu redor, mesmo que não tenham uma equipe de visualização de dados?

Acho que as redações precisam pensar em maneiras de inserir habilidades criativas de dados em suas equipes existentes, em vez de lamentar a falta de uma “equipe de visualização de dados”. Duas de nossas pessoas favoritas no mundo fizeram um projeto incrível recentemente chamado “ Prezados Dados ” em que trocaram cartões postais de dados desenhados à mão entre si ao longo de um ano. Sem código, apenas lápis de cor. É um bom lembrete de que a tecnologia (e o orçamento relacionado) não é o verdadeiro fator limitante.

Falando em inspiração, Equipe de John Keefe na WNYC está sempre nos surpreendendo com as maneiras deliciosas e engenhosas de trabalhar com dados com uma equipe pequena e um orçamento pequeno. Estamos particularmente encantados com os projetos WNYC que combinam coleta de dados com representação de dados. Eles estão borrando as fronteiras entre jornalismo e ciência cidadã e o movimento maker de maneiras realmente inspiradoras.

(Relacionado: No Stream Lab, jornalistas de radiodifusão se unem aos alunos para examinar a água da Virgínia Ocidental)

Faço muitos relatórios sobre tecnologia de anúncios e fiquei muito curioso sobre seus projetos “ Atrás da Bandeira ' e ' Relógio de inundação .” Qual é o status do Floodwatch? As pessoas participaram? O que você aprendeu com esse experimento?

Em 2013, construímos um explicador de sistemas de tecnologia de anúncios para (empresário e jornalista) John Battelle. Foi fascinante aprender sobre esse grande sistema sem cabeça, que é sem dúvida o sistema computacional mais complexo já criado. Por meio de nosso trabalho nesse projeto, começamos a pensar em como os indivíduos não conseguem ver muito se algum desse sistema e começamos a pensar em maneiras de educar e capacitar os consumidores (ou, como os chamamos, as pessoas). O resultado foi o Floodwatch, uma ferramenta que permite que as pessoas vejam os perfis que os anunciantes estão construindo sobre elas e permite a coleta de um banco de dados de lances que pode ser compartilhado com pesquisadores de publicidade.

Floodwatch está atualmente em alfa, e devemos lançar um beta neste verão. Depois de ganhar uma base de usuários significativa (cerca de 12.000 se inscreveram para usar a extensão, embora haja menos usuários ativos atualmente), criamos um grande conjunto de dados de anúncios que as pessoas foram veiculadas. Trabalhando com um especialista em aprendizado de máquina, conseguimos classificar os anúncios com base apenas nas imagens que eles contêm. Estamos planejando lançar um novo recurso na versão beta, onde os usuários terão visualizações explicando os tipos de anúncios que são veiculados e como eles se comparam a outros.

Como você consegue novas ideias? Como você compartilha o que aprende?

Há um equilíbrio entre as ideias geradas pelo Escritório e as ideias que chegam à nossa porta por meio de nossos parceiros. Em estúdio, tentamos nos expor ao maior número possível de outros criadores e pesquisadores. A serviço disso, realizamos um evento mensal chamado OCR Friday onde convidamos alguém, junto com 30 convidados, para passar algumas horas falando sobre prática baseada em pesquisa. Tivemos cineastas, advogados, pesquisadores de privacidade, artistas de vigilância, mestres cervejeiros, designers, escultores...

Não somos tão bons quanto deveríamos em compartilhar o que aprendemos. Nós publicamos uma revista anual que contém coisas efêmeras de nossos projetos: notas, ensaios, código e outras pequenas coisas. Estamos tentando melhorar a hospedagem de repositórios públicos ativos do GitHub e também gostaríamos de realizar workshops públicos e discussões informais sobre tópicos de pesquisa que podemos estar seguindo.

Muitas redações hoje estão preocupadas com algoritmos em plataformas que controlam quem pode ver o conteúdo. Você poderia falar um pouco sobre o papel dos algoritmos em seu próprio trabalho? Qual é a relação entre algoritmos e julgamento editorial?

Cara, algoritmos.

As águas em torno de algoritmos e julgamento editorial são incrivelmente turvas. Como (ex-guru de dados do Kickstarter) Fred Benenson disse recentemente, os algoritmos são frequentemente usados ​​para “ funcionalidade mathwash que de outra forma seria considerada arbitrária com objetividade .”

Há alguns anos, fomos solicitados a projetar um algoritmo e uma instalação de mídia para o Museu do 11 de setembro, que criaria dinamicamente linhas do tempo conectando os eventos atuais aos eventos de 11 de setembro. Por exemplo, um tópico pode ser construído sobre como as leis de controle de armas mudaram e não mudaram entre esta semana e 2001. Fomos muito claros em nosso processo ao dizer que o “algoritmo” da peça não removeu a subjetividade; de certa forma, amplificou-o. No entanto, quando a peça foi revelada, ela foi descrita como objetiva, graças à computação. Foi uma maneira elegante de o museu contornar a política de curadoria.

Usamos algoritmos como meio de processar dados, gerar formas visuais, criar roteiros para performers, criar paisagens sonoras. Alguns desses algoritmos estão “prontos para uso”, e nesse caso há um julgamento editorial sobre qual algoritmo faz sentido usar. Outros algoritmos nós mesmos criamos, e nesse caso tentamos estar atentos a como nossa subjetividade é incorporada ao código. Uma definição de duas palavras para um algoritmo é “fazer até” – e é isso até que isso nos cause problemas, pois qualquer comunicação silenciosa pode ser amplificada em uma alta.