Use este identificador para citar ou linkar para este item:
https://www.repositorio.mar.mil.br/handle/ripcmb/845426
Título: | LigADOS: interligação de conjuntos de dados em plataformas de dados abertos na web semântica |
Autor(es): | Figueiredo, Glaucia Botelho de |
Palavras-chave: | Interligação de conjunto de dados Interligação semântica de metadados Dados abertos conectados |
Áreas de conhecimento da DGPM: | Tecnologia da Informação |
Data do documento: | 2020 |
Editor: | Universidade Federal do Rio de Janeiro (UFRJ) |
Descrição: | O movimento de abertura de dados tem sido pautado na necessidade de atendimento
de leis de acesso à informação para reforçar responsabilidade e transparência, que
estabelecem a necessidade de disponibilizar dados sobre atividades públicas e privadas aos
cidadãos e à sociedade em geral, bem como resultados de pesquisas científicas. A
disponibilização de dados ao público pode variar desde um simples site na Internet até
aplicativos sofisticados de acesso aos dados. Neste contexto, uma das opções é a
construção de um portal de dados abertos utilizando softwares de plataformas de dados
abertos, como o CKAN. Nos últimos anos, tem havido uma rápida proliferação desses portais.
Nas plataformas de dados abertos, os conjuntos de dados normalmente são descritos por
metadados com pouca semântica. Em função disso, os conjuntos de dados muitas vezes
permanecem como “silos de dados”, sem conexão explícita ou mecanismo de integração de
dados, tornando difícil para os usuários localizar e inter-relacionar fontes de dados relevantes.
Em contraste, a Web Semântica apoia-se em uma forma de modelar e representar dados com
o intuito de estabelecer inter-relacionamentos entre os dados, acompanhados de descritores
mais ricos. Com base neste cenário, esta dissertação apresenta LigADOS, uma abordagem
para estabelecer interligações entre conjuntos de dados considerando seu conteúdo e os
metadados associados. LigADOS é baseada nos princípios da Web Semântica, associada a
soluções de dados conectados e suas tecnologias, para criar interligações entre conjuntos de
dados abertos, modelados como dados conectados e publicados em plataformas de dados
abertos como o CKAN e outras. A viabilidade da proposta é avaliada através de um protótipo
usando conjuntos de dados extraídos de instâncias de portais de dados reais. Sem o uso de
LigADOS, são observáveis somente relações geradas entre conjuntos de dados, a partir de
elementos de metadados coincidentes, que usualmente não estão associados a vocabulários,
ontologias ou tesauros. LigADOS suporta a geração de diversas interligações entre os
conjuntos de dados, que se baseiam em significados definidos em vocabulários, ontologias
ou tesauros, fornecendo suporte para resultados mais expressivos em resposta a buscas e
consultas, além do suporte à navegação pelas interligações de dados. Os resultados do uso
de LigADOS sugerem que há interligações entre conjuntos de dados que não estão explícitas
ao público em geral; assim como há conjuntos de dados que, inicialmente, parecem ter interrelações, mas ao se aprofundar na semântica dos dados, não se verificam as supostas
interligações. Dissertação de Mestrado submetida ao Programa de Pós-Graduação em Informática do Instituto de Matemática e do Instituto Tércio Pacitti de Aplicações e Pesquisas Computacionais da Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários para obtenção do título de Mestre em Informática. |
Abstract: | The Open Data movement has been guided by the need to comply with laws to enforce transparency and accountability, which establish the need to make public and private sector activities data available to citizens and the society in general, as well as results of scientific research. The availability of data to the public can vary from a simple website on the Internet to sophisticated data access applications. In this context, one of the options is the construction of an open data portal using open data platforms software, such as CKAN. In recent years, there has been a rapid proliferation of these portals. On open data platforms, datasets are usually described by metadata with little semantics. As a result, datasets often remain as “data silos”, with no explicit connection or data integration mechanism, making it difficult for users to locate and interrelate relevant data sources. In contrast, the Semantic Web focuses on a way of modeling and representing data in an easier manner to establish interrelationships between data, accompanied by richer descriptors. Based on this scenario, this dissertation presents LigADOS, an approach to establish interconnections between datasets considering their content and associated metadata. LigADOS is based on the principles of the Semantic Web and associated linked data solutions and technologies, to create interconnections between open datasets, modeled as linked data and published on data portal platforms such as CKAN and others. The feasibility of the proposal is evaluated through a prototype using datasets extracted from instances of real data portals. Without the use of LigADOS, only relations generated between datasets are observable, from elements of coincident metadata, which are not usually associated with vocabularies, ontologies or thesaurus. LigADOS supports the generation of several interlinkages between datasets, which are based on meanings defined in vocabularies, ontologies or thesaurus, providing support for more expressive results in responses to searches and queries, in addition to support for navigation through data interlinkages. The results of using LigADOS suggest that there are interlinkages between datasets that are not explicit to the public; just as there are datasets that initially seem to have interlinkages, but when going deeper into the semantics of the data, the supposed interlinkages are not verified. |
Tipo de Acesso: | Acesso aberto |
URI: | https://www.repositorio.mar.mil.br/handle/ripcmb/845426 |
Tipo: | Dissertação |
Aparece nas coleções: | Tecnologia da Informação: Coleção de Dissertações |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Dissertacao_Glaucia.pdf | 4,01 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.