Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos

Soransso, Raphael Augusto da Silva Nunes

Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)

Use este identificador para citar ou linkar para este item: https://www.repositorio.mar.mil.br/handle/ripcmb/844352

Título:	Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos
Autor(es):	Cavalcanti, Maria Cláudia Reis
Autor(es):	Soransso, Raphael Augusto da Silva Nunes
Orientador(es):	Cavalcanti, Maria Cláudia Reis
Palavras-chave:	Benchmark NoSQL Modelagem de Dados
Data do documento:	2017
Editor:	Instituto Militar de Engenharia (IME)
Descrição:	Os SGBD NoSQL surgiram como solução alternativa às limitações dos SGBD Relacionais, com relação ao gerenciamento do crescente volume de dados, e ao seu tratamento distribuído. Esses sistemas além de possuir uma maior facilidade em distribuir os seus dados, permitem uma maior ﬂexibilidade de esquema e são mais tolerantes à inconsistência. Da mesma forma que nos SGBD relacionais, a modelagem lógica dos dados pode inﬂuenciar signiﬁcativamente o desempenho neste tipo de SGBD. Em especial, quando o objetivo é atender aplicações analíticas. Apesar de existir em alguns trabalhos que buscam orientar a modelagem de dados nos SGBD NoSQL e trabalhos que realizam a avaliação da performance desses sistemas, até onde foi possível investigar, não foram encontrados na literatura trabalhos que demonstrem o quanto as diferentes formas de modelagem dos dados, e mais especiﬁcamente da modelagem dos agregados nos SGBD orientados a documentos, podem inﬂuenciar no desempenho das consultas neste tipo de sistema. Sem tais estudos,torna-se difícil identiﬁcar a melhor alternativa de modelagem de agregados, de forma a melhorar o desempenho das consultas. Assim, o presente trabalho tem como objetivo preencher esta lacuna e fornecer aos administradores de bancos de dados, orientações de como os dados podem ser modelados de forma a obter melhor desempenho em SGBD orientados a documentos, para consultas analíticas. Para tanto, foram realizados experimentos em cinco SGBD orientados a documentos, utilizando um conjunto de dados, oriundo de um conhecido benchmark voltado para aplicações de suporte à decisão. A partir dos resultados dos experimentos foi possível propor heurísticas de modelagem de dados, em algumas das implementações de SGBD estudadas, que foram validadas em outro conjunto de dados oriundo de outro benchmark com objetivos similares ao primeiro. No ﬁnal do trabalho, foram realizados ainda, um estudo complementar sobre o impacto da modelagem dos agregados na performance das consultas, ao utilizar o recurso de índices, e uma comparação de desempenho entre as implementações estudadas. Dissertação de Mestrado apresentada ao Curso de Mestrado em Sistemas e Computação do Instituto Militar de Engenharia, como requisito parcial para a obtenção do título de Mestre em Ciências em Sistemas e Computação.
Abstract:	NoSQL DBMS emerged to address the Relational DBMS limitations with respect to the management of large volumes of data in distributed environments. Similarly to the Relational DBMS,thelogical modellingonthiskindofdatabasesystem, cansigniﬁcantly inﬂuence its performance, especially when its focus is on answering analytical queries. Whereas there are some works that provide guidance to the data modelling or that focus on measuring the performance of NoSQL DBMS, there is a lack of works that demonstrate how much the diﬀerent ways of data modelling,mainly the aggregate modelling, inﬂuence the query performance on this kind of document-store database system. Due to this absence, it becomes diﬃcult to identify the best data modelling alternative, i.e., that would improve query performance. Thus, the present work aims to fulﬁll this gapand provide data modelling orientation to the database administrators, to increase the performance of document store databases on analytical queries. For this to happen, experiments on ﬁve document oriented NoSQL DBMS were performed, using a dataset originated from a well known benchmark for decision support applications. From the experiments results it was possible to propose data modelling heuristics for some of the studied databases. These heuristics were then validated on another dataset, originated from another benchmark with similar objectives of the ﬁrst one. At the end of the work, two complementary studies were done: on the aggregate modelling impact on query perfomance, when indexes are used, and a performance comparison among some of the studied DBMS implementations.
Tipo de Acesso:	Acesso aberto
URI:	http://www.repositorio.mar.mil.br/handle/ripcmb/844352
Tipo:	Dissertação
Aparece nas coleções:	Tecnologia da Informação: Coleção de Dissertações

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Dissertacao_Soransso.pdf		4 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas