logo-ri

Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)

Use este identificador para citar ou linkar para este item: https://www.repositorio.mar.mil.br/handle/ripcmb/845426
Título: LigADOS: interligação de conjuntos de dados em plataformas de dados abertos na web semântica
Autor(es): Figueiredo, Glaucia Botelho de
Palavras-chave: Interligação de conjunto de dados
Interligação semântica de metadados
Dados abertos conectados
Áreas de conhecimento da DGPM: Tecnologia da Informação
Data do documento: 2020
Editor: Universidade Federal do Rio de Janeiro (UFRJ)
Descrição: O movimento de abertura de dados tem sido pautado na necessidade de atendimento de leis de acesso à informação para reforçar responsabilidade e transparência, que estabelecem a necessidade de disponibilizar dados sobre atividades públicas e privadas aos cidadãos e à sociedade em geral, bem como resultados de pesquisas científicas. A disponibilização de dados ao público pode variar desde um simples site na Internet até aplicativos sofisticados de acesso aos dados. Neste contexto, uma das opções é a construção de um portal de dados abertos utilizando softwares de plataformas de dados abertos, como o CKAN. Nos últimos anos, tem havido uma rápida proliferação desses portais. Nas plataformas de dados abertos, os conjuntos de dados normalmente são descritos por metadados com pouca semântica. Em função disso, os conjuntos de dados muitas vezes permanecem como “silos de dados”, sem conexão explícita ou mecanismo de integração de dados, tornando difícil para os usuários localizar e inter-relacionar fontes de dados relevantes. Em contraste, a Web Semântica apoia-se em uma forma de modelar e representar dados com o intuito de estabelecer inter-relacionamentos entre os dados, acompanhados de descritores mais ricos. Com base neste cenário, esta dissertação apresenta LigADOS, uma abordagem para estabelecer interligações entre conjuntos de dados considerando seu conteúdo e os metadados associados. LigADOS é baseada nos princípios da Web Semântica, associada a soluções de dados conectados e suas tecnologias, para criar interligações entre conjuntos de dados abertos, modelados como dados conectados e publicados em plataformas de dados abertos como o CKAN e outras. A viabilidade da proposta é avaliada através de um protótipo usando conjuntos de dados extraídos de instâncias de portais de dados reais. Sem o uso de LigADOS, são observáveis somente relações geradas entre conjuntos de dados, a partir de elementos de metadados coincidentes, que usualmente não estão associados a vocabulários, ontologias ou tesauros. LigADOS suporta a geração de diversas interligações entre os conjuntos de dados, que se baseiam em significados definidos em vocabulários, ontologias ou tesauros, fornecendo suporte para resultados mais expressivos em resposta a buscas e consultas, além do suporte à navegação pelas interligações de dados. Os resultados do uso de LigADOS sugerem que há interligações entre conjuntos de dados que não estão explícitas ao público em geral; assim como há conjuntos de dados que, inicialmente, parecem ter interrelações, mas ao se aprofundar na semântica dos dados, não se verificam as supostas interligações.
Dissertação de Mestrado submetida ao Programa de Pós-Graduação em Informática do Instituto de Matemática e do Instituto Tércio Pacitti de Aplicações e Pesquisas Computacionais da Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários para obtenção do título de Mestre em Informática.
Abstract: The Open Data movement has been guided by the need to comply with laws to enforce transparency and accountability, which establish the need to make public and private sector activities data available to citizens and the society in general, as well as results of scientific research. The availability of data to the public can vary from a simple website on the Internet to sophisticated data access applications. In this context, one of the options is the construction of an open data portal using open data platforms software, such as CKAN. In recent years, there has been a rapid proliferation of these portals. On open data platforms, datasets are usually described by metadata with little semantics. As a result, datasets often remain as “data silos”, with no explicit connection or data integration mechanism, making it difficult for users to locate and interrelate relevant data sources. In contrast, the Semantic Web focuses on a way of modeling and representing data in an easier manner to establish interrelationships between data, accompanied by richer descriptors. Based on this scenario, this dissertation presents LigADOS, an approach to establish interconnections between datasets considering their content and associated metadata. LigADOS is based on the principles of the Semantic Web and associated linked data solutions and technologies, to create interconnections between open datasets, modeled as linked data and published on data portal platforms such as CKAN and others. The feasibility of the proposal is evaluated through a prototype using datasets extracted from instances of real data portals. Without the use of LigADOS, only relations generated between datasets are observable, from elements of coincident metadata, which are not usually associated with vocabularies, ontologies or thesaurus. LigADOS supports the generation of several interlinkages between datasets, which are based on meanings defined in vocabularies, ontologies or thesaurus, providing support for more expressive results in responses to searches and queries, in addition to support for navigation through data interlinkages. The results of using LigADOS suggest that there are interlinkages between datasets that are not explicit to the public; just as there are datasets that initially seem to have interlinkages, but when going deeper into the semantics of the data, the supposed interlinkages are not verified.
Tipo de Acesso: Acesso aberto
URI: https://www.repositorio.mar.mil.br/handle/ripcmb/845426
Tipo: Dissertação
Aparece nas coleções:Tecnologia da Informação: Coleção de Dissertações

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertacao_Glaucia.pdf4,01 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.