INPO estrutura banco de dados oceânicos para fortalecer a ciência marinha no Brasil
O Instituto Nacional de Pesquisas Oceânicas (INPO) está finalizando a primeira etapa do seu projeto estruturante de infraestrutura de dados: a criação do Sistema de Aquisição e Distribuição de Dados (SADD), um sistema integrado de dados que vai organizar, qualificar e disponibilizar informações oceanográficas do Atlântico Sul em um ecossistema interoperável.
A iniciativa faz parte do Sistema de Infraestrutura de Dados Oceânicos e Costeiros (SID-Oceano), um projeto do INPO que reunirá armazenamento, previsão e predição em uma única arquitetura de informação, abrindo caminho para o planejamento do Gêmeo Digital do Atlântico Sul e Tropical. A coordenação do projeto está a cargo da Dra. Carla Lage, analista de tecnologia do INPO, que explica por que o país precisa urgentemente desta infraestrutura alicerçada em dados nacionais que possam apoiar a pesquisa oceânica, ações regionais e projetos globais.

O que é o SADD e em que fase de desenvolvimento se encontra?
Carla Lage: O SADD é um ecossistema integrado de dados oceânicos que estamos construindo para reunir, qualificar e facilitar o acesso a conteúdos que hoje estão dispersos em diferentes instituições. Concluímos a Fase 1, que foi testar a viabilidade técnica e o armazenamento inicial dessa primeira carga de informações. Agora entramos na Fase 2, dedicada à curadoria desses dados. A etapa seguinte, Fase 3, será dedicada ao aumento da interoperabilidade e liberação do acesso externo em ambiente de testes. Na Fase 4 vamos aprofundar o uso de Inteligência Artificial e criar as condições para a criação do Gêmeo Digital do Atlântico Sul.
Por que um sistema de dados como esse é tão necessário para o Atlântico Sul?
Carla Lage: Ainda temos poucos dados sobre o Atlântico Sul, e muitos dos que existem não estão acessíveis. A pesquisa depende de dados, e essa carência é antiga na comunidade científica. O SADD está sendo estruturado justamente para suprir essa falta, reunindo informações que já existem e integrando dados novos. Além disso, o compartilhamento de informações com sistemas, como o Sistema de Informações sobre a Biodiversidade Brasileira (SIBBr), o Sistema de Monitoramento da Costa Brasileira (SiMCosta), o Banco Nacional de Dados Oceanográficos (BNDO), o Global Ocean Observing System (GOOS), dentre outros, aumentará a disponibilidade de dados para pesquisa oceânica e costeira no Brasil.
Como vocês estão lidando com dados que já existem, mas não são compartilhados?
Carla Lage: Só compartilhar o que já existe, e que se encontra guardado em uma gaveta, já seria um ganho enorme. Hoje não há um sistema nacional que armazene e consolide diferentes fontes de pesquisa oceânica. A coleta de dados novos é muito cara, então compartilhar o que já existe faz toda a diferença.
Que tipo de fontes podem alimentar esse ecossistema?
Carla Lage: Podemos trabalhar com dois tipos de conteúdo: links para dados hospedados em outros bancos e dados armazenados diretamente no SADD. No caso dos links, tudo fica na nuvem; já o armazenamento direto pode ser híbrido, misturando infraestrutura física e nuvem. Estamos avaliando as melhores soluções, priorizando a disponibilidade de infraestrutura nacional.
Há um problema de dispersão ou dificuldade de acesso aos dados?
Carla Lage: Sim. A inexistência prévia de um sistema nacional, tipo SID-Oceano, contribuiu para o status quo. Por isso, muitos dados coletados estão guardados com os pesquisadores, inviabilizando a consulta externa. São os chamados “dados de gaveta”. Além disso, mais de 60% dos dados brasileiros estão armazenados fora do país, o que gera questões de segurança e dificulta o acesso. Por isso, existe o Redata, um esforço do governo para instalar data centers e repatriar dados e reforçar a soberania digital. Isso também vai contribuir para termos mais controle sobre esses dados.
O SADD se inspira em iniciativas internacionais?
Carla Lage: De certa forma, sim. Além de sistematizar dados nacionais, o SADD aplica as recomendações do IODE (International Oceanographic Data and Information Exchange), da UNESCO. Ele vai funcionar como um ODIS (Ocean Data and Information System), que é a infraestrutura digital global da Década da Ciência Oceânica das Nações Unidas, que integra e torna acessíveis e reutilizáveis dados e informações sobre o Atlântico Sul, interligando informações de diferentes fontes para facilitar o acesso a dados de qualidade e utilizando inteligência artificial para apoio aos pesquisadores.
O INPO fechou recentemente um acordo com a Mercator. O que isso representa?
Carla Lage: Foi o nosso primeiro acordo internacional, firmado durante a UNOC3. O Mercator é reconhecido por manter um dos bancos de dados oceânicos mais robustos e acessíveis do mundo, com excelente usabilidade e arquitetura de informação. Esse memorando de entendimento que assinamos será fundamental para elevar o padrão de uso e organização do nosso ecossistema. O Mercator tem uma qualidade excelente em usabilidade e taxonomia de dados, o que é essencial para o projeto.
E as parcerias com empresas privadas? Como funcionam?
Carla Lage: Muitas empresas têm dados que já cumpriram seu ciclo de vida interno, mas continuam valiosos para a pesquisa científica. O dado está lá, válido, só não é mais necessário para a empresa, já está entrando em fase de descarte. Podemos firmar acordos para ter acesso a esse material. O ciclo de vida corporativo é diferente do científico, e isso abre oportunidades.
Como funciona a curadoria dos dados que entram no SADD?
Carla Lage: O dado é submetido pelo pesquisador. Aplicamos os princípios FAIR, que garantem dados localizáveis, acessíveis, interoperáveis e reutilizáveis. Para isso, estamos trabalhando nos diferentes tipos de metadados a serem inseridos, como de coleta, de procedimento, de equipamentos e calibração. Tudo isso influencia sua qualidade. Sendo aprovados, os dados recebem um Identificador de Objeto Digital (DOI) que atribui identificação única à base de dados, facilitando sua localização, citação correta, rastreamento de uso e aumentando a visibilidade do pesquisador.
Como o SADD se conecta ao projeto de previsão e ao Gêmeo Digital?
Carla Lage: Quando chegarmos à Fase 3, vamos garantir a interoperabilidade passo a passo com as necessidades de dados para modelagem utilizadas na predição, que é o processo de estimar comportamentos futuros, com base em dados e modelos. A sistematização de disponibilização dos dados de forma estruturada possibilitará que o INPO avance na criação do Gêmeo Digital do Atlântico Sul e Tropical.
Quem compõe a equipe do projeto?
Carla Lage: Além da equipe contratada para o desenvolvimento tecnológico, o projeto utiliza metodologias ágeis e conta com a participação ativa de integrantes da Diretoria de Infraestrutura e Operações e da Diretoria de Pesquisa e Inovação, que atuam na especificação, avaliação e verificação dos requisitos ao longo de todo o processo. Esses analistas internos também desempenham o papel de usuários-teste, garantindo a aderência às necessidades reais e alinhado às demandas científicas.
Como está sendo financiado o projeto até aqui?
Carla Lage: O projeto foi financiado e gerenciado pelo INPO, com a contratação da Fundação COPPETEC para o desenvolvimento. O investimento é muito menor do que seria se tivéssemos que contratar uma empresa externa. A próxima fase exigirá ampliar a equipe para acelerar o processo de desenvolvimento do sistema.