Vamos falar de compartilhamento de dados científicos? (parte 1)
- batepapocomnetuno
- 10 de abr.
- 6 min de leitura
Por Valéria M. Lemos & Marianna Lanari
Olá pessoal! Que tal falarmos de um tema que não é tão novinho assim, mas que para muitos pode ser uma novidade?!

Todas as pessoas envolvidas no mundo da pesquisa geram dados científicos! Mas afinal, o que é um conjunto de dados? Um conjunto de dados é uma coleção de dados referentes a um tema específico, inter-relacionados e organizados. Uma lista telefônica, um cadastro dos clientes de uma loja, etc Mas, quando falamos de dados científicos, estamos falando em dados gerados através de uma metodologia científica, seguindo um protocolo já estabelecido, conhecido e que pode ser reproduzido por outros cientistas. Isso é o que fazem os pesquisadores e estudantes da área das Ciências Naturais durante sua formação e carreira acadêmica: geram dados brutos com o propósito de analisá-los, testar hipóteses e assim, gerar conhecimento que contribui para o avanço da ciência e resolução de problemas. Este conhecimento, consequentemente, contribui de alguma forma para a melhoria das relações do ser humano com o ambiente.
Mas o que fazer com esses dados depois de concluídas as pesquisas?
Usualmente, quando uma pesquisa é concluída, os resultados são publicados em revistas científicas para serem divulgados para a sociedade (processo que daria assunto para outro post!). E os dados brutos que compõem o conjunto de dados? O que é feito deles depois das pesquisas concluídas e publicadas? Salvo algumas exceções, os dados brutos acabam esquecidos, guardados na “gaveta” (ou no HD, no computador do laboratório da universidade ou sabe-se lá onde)! Um artigo científico publicado em 2013 (Gibney & Van Noorden 2013) demonstrou que, em média, dentro de um período de 20 anos após a publicação dos resultados das pesquisas na forma de artigos científicos, 80% dos dados que geraram esses resultados não estão mais disponíveis para reuso! Se perdem, pessoal! Se perdem!

Open Science - Como surgiu o movimento?
Em uma iniciativa da comunidade científica, ancorada a toda revolução e evolução tecnológica e científica do último século, e, motivada pela demanda em entender e tentar buscar soluções para os problemas ambientais da era antropogênica (perda de biodiversidade, efeito das alterações climáticas, etc.), surge nos anos 2000 o movimento Open Science (ciência aberta, em português). Este movimento é basicamente um grande guarda-chuva, que abriga um conjunto de práticas que buscam uma ciência democrática e transparente, inclusive com uma maior participação da sociedade (via ciência cidadã), disponibilização e divulgação do conhecimento gerado pela comunidade científica. E, debaixo do grande guarda-chuva do Open Science, está o Open Data (ou dados abertos), que tem como objetivo o compartilhamento de dados científicos gerados pelas atividades de pesquisa.
Qual a importância e quais são as vantagens de compartilhar dados de pesquisa?
Poderíamos falar aqui de inúmeras vantagens do compartilhamento de dados científicos, mas vamos usar um exemplo bem atual. Todos lembram a corrida frenética por pesquisas e geração de informações sobre o vírus causador da Covid-19, quando foram noticiados os primeiros casos da doença. Universidades e cientistas do mundo inteiro montaram uma força-tarefa para obter informações que pudessem auxiliar órgãos governamentais diante da situação. Foi através de uma rede de colaboração científica mundial que foi possível obter informações em tempo recorde sobre o vírus! Este é um ótimo exemplo de como o compartilhamento de dados e de informação podem culminar em avanços científicos mais rápidos! Mais do que isso, ele é essencial para ajudar governos e administradores a tomarem decisões importantes, sejam no dia a dia, por exemplo, em projetos de manejo e conservação do ambiente ou em momentos críticos como em pandemias. Em todos os casos, gerando retornos positivos para a sociedade!
Na esfera acadêmica, outra vantagem reside no fato do compartilhamento ser uma via de duas mãos: você compartilha e você usa! Ou seja, o Open Data permite uma maior acessibilidade a dados que antes eram de difícil acesso, ou em algumas vezes, impossíveis de serem acessados por pesquisadores. Estudos de modelagem de distribuição de espécies, por exemplo, eram praticamente impossíveis de serem realizados em espécies com ampla distribuição! Além disso, quando você usa os dados de outro pesquisador, ou quando os seus dados compartilhados são usados por alguém que estuda o mesmo assunto que você, pode ocorrer uma comunicação entre as partes, e quiçá, a formação de uma parceria científica! Ou seja, todos ganham!
Outro aspecto importante, que vale o destaque são as análises de séries de dados temporais. Entender como funciona o ambiente, quais fenômenos e alterações afetam o meio ambiente e quais as perspectivas futuras, dependem na maioria das vezes, do conhecimento pretérito, que só é possível através da análise de dados brutos obtidos ao longo do tempo. Por exemplo, a aquisição de dados de monitoramento de longo prazo, são impossíveis de se obter sem um projeto de pesquisa consolidado. Uma vez que estes dados estejam compartilhados, potencializamos a capacidade de gerar informação para o auxílio das questões ambientais atuais e futuras.

É importante lembrar ainda, que todo o processo de pesquisa, inevitavelmente, envolve esforços e custos. Estamos falando aqui não só de tempo, mas também de dinheiro! E quando os estudos são na área das ciências do mar, todos sabem que são, geralmente, bem onerosos! Assim, quando compartilhamos nossos dados brutos, estamos de certa forma otimizando os recursos gastos na sua obtenção!
Por que o compartilhamento de dados ainda não está totalmente difundido no meio acadêmico?
Esta é, de certa forma, uma questão complexa, onde fatores pessoais, mas também profissionais e logísticos influenciam a tomada de decisão do pesquisador em compartilhar ou não os dados brutos da sua pesquisa. Mas podemos indicar algumas razões que acreditamos gerar essa resistência: a falta de conhecimento e informação sobre a existência de boas práticas de compartilhamento e a falta de treinamento (e de tempo!) na gestão dos dados. É importante conhecermos e difundirmos que, atualmente, há condutas que asseguram o compartilhamento de dados. Não se trata de sair divulgando suas planilhas de qualquer jeito e em qualquer meio digital. Há repositórios de dados, que são ambientes digitais certificados e seguros, há um sistema de revisão e controle de qualidade e de manutenção dos controles e direitos autorais que garantem a segurança do processo.
A outra questão é que gerir e depositar dados nestes repositórios é uma tarefa que demanda tempo, principalmente dependendo de quão “prontos” estão os dados para o compartilhamento. Isto é, esses dados estão bem organizados? Eles podem ser entendidos por qualquer pessoa? Há algum padrão de formatação de dados a ser utilizado? Neste sentido, o treinamento na gestão de dados por parte dos pesquisadores, ou mesmo a inclusão de um gestor de dados em um projeto, é importante para a viabilidade do processo de compartilhamento de dados. Todos nós sabemos que isso custa dinheiro e que o cobertor é curto para cobrir todas as necessidades de um projeto de pesquisa. Então por que não investirmos no treinamento do gerenciamento e compartilhamento de dados desde a pós-graduação para consolidarmos essa nova mentalidade na pesquisa científica no país?

Considerando as inúmeras vantagens do compartilhamento de dados, e sabendo como fazer isso de forma segura, é importante que aconteça uma mudança no paradigma atual. Esta é uma oportunidade de somar esforços para avançarmos no conhecimento, na busca de alternativas para os problemas ambientais e progresso da sociedade. Como disse Albert Einstein: “Há uma força motriz mais poderosa que o vapor, a eletricidade e a energia atômica: a vontade”. As ferramentas já estão disponíveis, vamos embarcar nessa?
Referências
Gibney, E., & Van Noorden, R. (2013). Scientists losing data at a rapid rate. Nature, 10. doi:10.1038/nature.2013.14416
Sobre as autoras

Valéria Marques Lemos é bióloga, mestre e doutora em Oceanografia Biológica pela Universidade Federal do Rio Grande – FURG. Sua área de pesquisa é a ictiologia, desenvolvendo e participando de pesquisas sobre bioecologia e pesca de teleósteos marinhos e estuarinos. Atua como gestora de dados de pesquisa do projeto Pesquisa Ecológica de Longa Duração sitio 8- Estuário da Lagoa dos Patos e Costa Marinha Adjacente PELD-ELPA, do Instituto de Oceanografia da FURG. E, assim como todas, todes e todos leitores do Bate-papo com Netuno... ama o mar!

Marianna de Oliveira Lanari é oceanóloga, mestre em Ecologia pela Universidade Federal do Rio de Janeiro – UFRJ e doutora em Oceanografia Biológica pela Universidade Federal do Rio Grande – FURG. Sua linha de pesquisa é focada em comunidades vegetais costeiras e como estas contribuem para o funcionamento e serviços ecossistêmicos em estuários e costões rochosos. Tem grande interesse em gestão de dados e no seu compartilhamento em repositórios digitais. Mergulhou pela primeira vez aos cinco anos de idade e, a partir daí, decidiu que nunca mais queria ficar longe do mar.
Comments