Atenção: Todas as denúncias são sigilosas e sua identidade será preservada.
Os campos nome e e-mail são de preenchimento opcional
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Murta, Vanessa Braganholo | - |
Autor(es): dc.contributor | Almeida, Victor Teixeira de | - |
Autor(es): dc.contributor | Oliveira, Daniel de | - |
Autor(es): dc.contributor | Plastino, Alexandre | - |
Autor(es): dc.creator | Fonseca Filho, Marcelo Vieitas da | - |
Data de aceite: dc.date.accessioned | 2024-07-11T18:15:01Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T18:15:01Z | - |
Data de envio: dc.date.issued | 2023-10-16 | - |
Data de envio: dc.date.issued | 2023-10-16 | - |
Fonte completa do material: dc.identifier | http://app.uff.br/riuff/handle/1/30822 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/766702 | - |
Descrição: dc.description | Quando se trata de consultas SQL com grande volume de dados, o custo de processamento é muitas vezes muito grande. Em consultas complexas, às vezes é necessária a ordenação em disco, devido à quantidade de dados envolvida na consulta que não cabem em memória principal. Um problema adicional é que a ordenação de um grande volume de dados em disco, além de muito custosa, é bloqueante. Isso significa que o próximo operador da consulta fica esperando o término da ordenação para poder começar a trabalhar. Com relação a esses problemas o algoritmo proposto por esse trabalho, o Semisort, é capaz de ordenar tuplas em memória principal sem necessidade de uso de ordenação em disco, e de forma não bloqueante. Supondo uma relação com atributos A e B, que está ordenada por A, o Semisort aproveita essa ordenação parcial para ordenar a relação por A e B em memória principal, sem bloquear o pipeline da consulta. Para o desenvolvimento do algoritmo foi utilizada a ferramenta Secondo (GÜTING, 1992), que é um sistema de banco de dados extensível. Ela permite a implementação de operadores algébricos e sua utilização no processamento de consultas. Para avaliar o desempenho do operador proposto, foram realizados experimentos comparando o desempenho de uma consulta de cálculo de triângulos com e sem o uso do operador proposto. Além disso, o desempenho da consulta com o operador proposto foi comparado com o desempenho obtido pelos SGBDs SQLite e PostgreSQL. Os resultados mostram que o operador proposto traz benefícios, mas que os SGBDs comerciais são mais eficientes, muito provavelmente devido a mecanismos de otimização que o Secondo não possui. No entanto, os ganhos obtidos no Secondo mostram que há espaço para melhorias nos SGBDs convencionais, caso um operador desse tipo seja implementado neles | - |
Descrição: dc.description | SQL queries with large amounts of data usually have a large processing cost. Sometimes in complex queries when there are a lot of data involved that does not fit in memory, the sort operation needs to be executed on disk. Sorting large amounts of data in disk is costly, and, added to that, the sort operation blocks the query processing pipeline. This means that the next query operator needs to wait for the sort to finish before it can start to operate. With respect to these problems, the algorithm proposed by this work, Semisort, is able to sort tuples in main memory without the need to use the disk, and in a non-blocking form. Supposing a relation with attributes A and B that is sorted by A, Semisort takes advantage of this partial to sort the relation by A and B in main memory, without blocking the query pipeline. For the development of the algorithm, the tool Secondo was used, which is an extensible database system. It allows the implementation of algebraic operators and use them to process queries. To evaluate the performance of the proposed operator, experiments were performed comparing the performance of a query to calculate triangles with and without the use of the proposed operator. In addition, the performance of the query with the proposed operator was compared to the performance obtained by the SQLite and PostgreSQL DBMSs. The results show that the proposed operator has benefits, but that commercial DBMSs are more efficient, most probably because of optimization mechanisms that Secondo does not have. However, the gains obtained in Secondo show that there is room for improvement in the conventional DBMDs if such an operator is implemented in them | - |
Descrição: dc.description | 37 p. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Direitos: dc.rights | Open Access | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | Secondo | - |
Palavras-chave: dc.subject | Semisort | - |
Palavras-chave: dc.subject | Ordenação | - |
Palavras-chave: dc.subject | SQL (Linguagem de programação de computador) | - |
Palavras-chave: dc.subject | Algoritmo computacional | - |
Palavras-chave: dc.subject | Operador algébrico | - |
Palavras-chave: dc.subject | Sorting | - |
Palavras-chave: dc.subject | Secondo | - |
Palavras-chave: dc.subject | Operator | - |
Título: dc.title | Um novo operador de ordenação para dados parcialmente ordenados | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: