Use este identificador para citar ou linkar para este item:
https://www.repositorio.mar.mil.br/handle/ripcmb/845541
Título: | Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos |
Autor(es): | Vaqueiro, Ramon Dantas Escovedo, Tatiana |
Palavras-chave: | Compras públicas Mineração de texto Aprendizado de máquina |
Áreas de conhecimento da DGPM: | Banco de dados |
Data do documento: | 2022 |
Editor: | Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio) |
Descrição: | O elevado poder de compra do Estado e a necessidade de se zelar pela correta aplicação dos recursos públicos suscita no cidadão grande preocupação.À luz dessa realidade, o legislador conferiu um tratamento diferenciado para as compras públicas e as submeteu a maiores níveis de transparência, determinando que seus dados passassem a ser disponibilizados abertamente. Em face da demanda popular e da disponibilidade de acesso a esse recurso, torna-se imperiosa as utilização pelos órgãos competentes.Todavia, parte significativa desses dados são textuais, ou seja, não estruturados, o que requer um diligente específico pré-processamento por parte de quem os utilize. Este artigo se debruça sobre uma base de dados correspondente aos materiais comprados pelo Governo Federal na modalidade pregão ao longo do ano de 2021.Objetivou-se agrupar as descrições textuais de compras semelhantes, permitindo sua comparação.Dentre as aplicações possíveis a partir do correto agrupamento, encontra-se a identificação de outliers nos preços das aquisições, sinalizando um indício de eventual impropriedade. Como resultado, obteve-se uma clusterização considerada satisfatória em 72% dos casos. Trabalho de Conclusão de Curso referente à Pós-Graduação Lato Sensu em Ciência de Dados realizada na PUC-Rio. |
Abstract: | The high purchasing power of the State and the need to ensure the correct application of public resources raises great concern amongcitizens.In light of this reality,the legislator granted a differentiated treatment to public purchases and submitted them to greater level softransparency,determining that their data would be made available openly. In view of popular demand and the availability of access to this resource, it suse by Public Bodies that a reem poweredisimperative.However, a significant part of this data is textual, which requires diligent and specific preprocessingby those who use it.This article focuses on a data base corresponding to materials purchased by the Federal Govern mentthroughout the year 2021. The objective was to group the textual descriptions of similar purchases, allowing their comparison.Among the possible applications from the correct grouping, there is the identification of outliers in the prices of acquisitions, signalingan indication of possible impropriety.As aresult,aclustering considered satisfactory was obtained in 72% of the cases. |
Tipo de Acesso: | Acesso aberto |
URI: | https://www.repositorio.mar.mil.br/handle/ripcmb/845541 |
Tipo: | Trabalho de fim de curso |
Aparece nas coleções: | Tecnologia da Informação: Coleção de Trabalhos de Conclusão de Curso |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TCC_CT_IM_VAQUEIRO.pdf | 335,48 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.