Ontology Challenge ONTOBRAS 2022

Premiação Submissões Desafio FAQ

O ONTOBRAS 2022 está oferecendo um desafio ontológico, o Ontology Challenge, no contexto da iniciativa GO FAIR Brasil (https://www.go-fair-brasil.org/), que visa aproimorar as abordagens de gestão de dados através da adoção dos princípios de dados Findable, Accessible, Interoperable and Reusable (FAIR), onde ontologias são elementos fundamentais para endereçar esses princípios e em particular para a interoperabilidade semântica.

O domínio de aplicação do Ontology Challenge são os Sistemas de Informação de Pesquisa Atual (CRIS de Current Research Information Systems). CRIS visam agregar informações sobre pesquisas científicas de diferentes bases de dados para fornecer relatórios e informações consolidadas e possibilitar a avaliação de impacto de pesquisadores e seus projetos de pesquisa. O Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT) está executando o projeto BrCris [1], onde uma plataforma CRIS está sendo desenvolvida para fornecer ferramentas para a comunidade acadêmica brasileira com dados consolidados da produção científica nacional, abrangendo agregação de dados para análise de importantes conjuntos de dados científicos, especialmente sobre a produção científica brasileira. Os princípios de dados FAIR são fundamentais para a plataforma BrCris, que possui um modelo semântico (uma “ontologia”) para endereçar a interoperabilidade semântica entre diversos repositórios de dados de pesquisa, a ontologia VIVO [2] e sua extensão com termos específicos do contexto brasileiro [3].

O Ontology Challenge tem como objetivo oferecer à comunidade científica uma oportunidade para contribuir ao projeto BrCris e fomentar o estabelecimento de novas colaborações em atividades de pesquisa e inovação com ontologias. O desafio é aprimorar as descrições semânticas da solução BrCris e enriquecer os dados disponíveis na plataforma através de uma solução, que pode ser por exemplo, a aplicação de uma ferramenta ou uma pesquisa em andamento.

Premiação

O vencedor do desafio além de colaborar com o projeto BrCris, ainda receberá uma inscrição gratuita para o ONTOBRAS 2023, e poderá receber uma bolsa para a continuação do desenvolvimento da solução dentro do projeto BrCris.

Submissões

A audiência do Ontology Challenge é aberta, ou seja, qualquer um pode participar, incluindo os autores de artigos no ONTOBRAS 2022. Os participantes deverão submeter um breve resumo (200-300 palavras) sobre a solução proposta até 16 de novembro para se inscrever no Ontology Challenge. Durante o ONTOBRAS haverá momentos de interação com os responsáveis pelo BrCris (consultar programa para mais detalhes) incluindo uma apresentação sobre o projeto BrCris e pitches (apresentação sumária de 3-5 minutos) dos participantes sobre suas propostas. O vencedor será escolhido pelo comitê do Ontology Challenge e anunciado no evento de encerramento do ONTOBRAS.

  • Prazo para submissões: 16 de novembro, 2022
  • E-mail de dúvidas e submissões: j.luizrebelomoreira@utwente.nl
  • Conteúdo da submissão:
    • resumo (200-300 palavras)
    • nome, instituição, e e-mail de contato do participante
    • assunto do e-mail: “[ONTOBRAS 2022] Participate in Ontology Challenge”.

Desafio

Um CRIS deve implementar os princípios da Ciência Aberta, proporcionando transparência sobre os resultados da pesquisa entre as instituições. A solução BrCris é capaz de armazenar, gerenciar e trocar metadados contextuais para atividades de pesquisa financiadas por diversas fontes de fomento. A solução BrCris é um ecossistema de sistemas que aborda a interoperabilidade semântica de dados científicos. Esse sistema integra a troca de dados de diversos atores, como agências de fomento, bancos de dados científicos e técnicos, repositórios institucionais, plataformas governamentais, infraestrutura de pesquisa e bancos de dados de teses e dissertações.

Os dados atualmente disponíveis (em https://brcris.ibict.br/vivo/) são um conjunto de dados piloto que descreve os perfis e atividades dos Pesquisadores Sênior do CNPq, compondo uma Comunidade de cerca de 14.000 pessoas (cerca de 200 pesquisadores sênior e seus co-autores) que produziram cerca de 40.000 artigos de periódicos, teses e dissertações (outros tipos de publicação serão tratados posteriormente). Os dados foram coletados dos currículos da Plataforma Lattes, Oasisbr e Diretório de Instituições do CNPq. Como um banco de testes, os dados podem conter inconsistências e erros ocasionais, que não devem afetar seu uso nas atividades deste hackathon.

https://wiki.lyrasis.org/display/VIVODOC113x/VIVO+Ontology+Domain+Definition

A Figura acima ilustra um trecho do modelo semântico por trás da solução BrCris, que é composto por um subconjunto da ontologia VIVO mais uma extensão local, projetada para representar classes e propriedades específicas do contexto da pesquisa acadêmica brasileira. O modelo da VIVO Ontology utiliza as classes: Person; Organization; Service; Journal; Document; Course; Patent; Project; Grant; Event; Bibliographic Reference; Member Role; Authorship; Advising Relationship; Editorship and Concept (used to represent Knowledge Areas). Além disso, Graduate Program, Referee Role, and Community são criados como extensão local da Ontologia VIVO para o contexto brasileiro. Este modelo semântico permite a visualização e exploração de dados em formato gráfico na plataforma VIVO, que outros CRISs utilizam amplamente.

Sugestões de direções para solução proposta 

Como descrito anteriormente, o Ontology Challenge não restringe as soluções propostas à requisitos específicos, apenas com o objetivo de aprimorar as descrições semânticas do BrCris. Portanto, as propostas podem ir desde a extensão da ontologia VIVO até o uso de ferramentas e abordagens arquiteturais. Exemplos de direção para a solução:

  • Melhorar a descrição da Ontologia VIVO para conjuntos de dados, explorando vocabulários externos (por exemplo, W3C DCAT) e enfatizando seus relacionamentos com outras entidades, como pessoas e publicações;
  • Melhorar a descrição da Ontologia VIVO através do enriquecimento dos relacionamentos entre pessoas, na forma como colaboram (por meio de projetos, grupos de pesquisa, etc.) com organizações e seus produtos de pesquisa (publicações, conjuntos de dados, patentes, software, etc.), e possibilitar a representação de Grupos de Pesquisa;
  • Identificar falta de metadados para produtos de pesquisa para domínios específicos (por exemplo, Bioinformática, Processos de Negócios, Pesquisa Médica, etc.) e propor enriquecimentos para suas descrições de Ontologias VIVO;

Enriquecer a descrição das publicações para melhor representar a proveniência da publicação e seus relacionamentos com fluxos de trabalhos (workflows) científicos, explorando vocabulários externos (por exemplo, W3C PROV e OPMW-PROV).

Comitê de organização

  • João Moreira (University of Twente, Países Baixos)
  • Washington Segundo (Instituto Brasileiro de Informação em Ciência e Tecnologia, Brasil)
  • Vivian Santos Silva (Instituto Brasileiro de Informação em Ciência e Tecnologia, Brasil)
  • Patricio de Alencar Silva (Universidade Federal Rural do Semi-Árido, Brasil)

Referências

[1] Pinto, A. L.; Segundo, W. L. R. C.; Dias, T. M. R.; Silva, V. S.; Gomes, J. C.; & Quomiam, L. (2022). Brazil Developing Current Research Information Systems (BrCRIS) as data sources for studies of research. Iberoamerican Journal of Science Measurement and Communication; 2(1), 1-12. DOI: 10.47909/ijsmc.135

[2] Corson-Rikert, J., Mitchell, S., Lowe, B., Rejack, N., Ding, Y., & Guo, C. (2012). The VIVO ontology. In VIVO (pp. 15-33). Springer, Cham.

[3] Silva, V. S., Moreira, T., Dias, T. M., Gomes, J., & Segundo, W. C. (2021). Um Modelo Semântico Baseado em Ontologia para o CRIS Brasileiro. Colecção CA–Ciência Aberta, 361.

VIVO original: https://bioportal.bioontology.org/ontology/VIVO

VIVO original (GitHub): https://github.com/vivo-ontology/vivo-ontology

Extensão BrCris: http://brcris.ibict.br/ontology/documentation

F.A.Q.

1 – Como mandar uma solução só em 300 palavras?

A intenção é que a descrição da solução seja resumida e objetiva, deixando claro como ela contribuirá para a solução BRCris. A lista de referências não será considerada nesse limite de 300 e não seremos estritos na avaliação das propostas quanto à essa limitação.

2 – Como entregar a solução final?

A forma de entrega da solução final dependerá do tipo de solução proposto. Por exemplo, se for uma extensão da ontologia VIVO ou uma aplicação ou uma análise ontológica, a entrega pode ser feita através de algum repositório aberto como o GitHub. Durante o ONTOBRAS haverá momentos de interação com o comitê do Ontology Challenge onde os participantes poderão combinar a forma mais apropriada para a entrega da solução final.

3 – O que exatamente eu posso fazer?

As opções listadas na seção ‘Sugestões de direções para solução proposta’ são orientadas à extensão da ontologia VIVO para alguns requisitos específicos (questões de competência), porém nós não limitamos o desafio para somente esse tipo de solução. O desafio está propositalmente definido de forma abrangente para estimular a criatividade dos participantes em como aprimorar as descrições semânticas da solução BrCris e enriquecer os dados disponíveis na plataforma. Por exemplo, outros tipos de direção para a solução podem ser:

  • Análise ontológica bem fundamentada da ontologia VIVO através da abordagem de modelagem conceitual orientada à ontologias (ex. com OntoUML/gUFO);
  • Análise comparativa da VIVO com outras ontologias de domínio semelhante, como a série de ontologias SPAR, FABIO e Research Objects;
  • O desenvolvimento de um FAIR Data Point para armazenar os metadados da plataforma BRCris;
  • Sistemas de recomendação no contexto de publicação científica utilizando os dados da solução BRCris. Por exemplo, dada uma série de tópicos de pesquisa, quais os congressos mais apropriados para participação/submissão de uma pesquisa;
  • Uma aplicação para identificar automaticamente os principais tópicos de pesquisa de uma publicação;
  • Sistema analítico que utiliza a plataforma BRcris para prover análises como: quais autores mais publicam por conferência/revista/jornal, qual a similaridade das conferências em termos de tópicos abordados.