Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.creator | Siqueira, Gustavo Oliveira de | - |
Autor(es): dc.creator | Assis, Guilherme Tavares de | - |
Autor(es): dc.creator | Ferreira, Anderson Almeida | - |
Autor(es): dc.creator | Mangaravite, Vítor | - |
Autor(es): dc.creator | Pádua, Flávio Luis Cardeal | - |
Data de aceite: dc.date.accessioned | 2025-08-21T15:55:16Z | - |
Data de disponibilização: dc.date.available | 2025-08-21T15:55:16Z | - |
Data de envio: dc.date.issued | 2018-10-15 | - |
Data de envio: dc.date.issued | 2018-10-15 | - |
Data de envio: dc.date.issued | 2017 | - |
Fonte completa do material: dc.identifier | http://www.repositorio.ufop.br/handle/123456789/10363 | - |
Fonte completa do material: dc.identifier | http://www.iadisportal.org/ijwi/papers/2017151102.pdf | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/1027494 | - |
Descrição: dc.description | The great popularity and, specially, the fast Web growth have led to the proposal and analysis of new techniques for helping users to locate effectively the needed information in a satisfactory time, without much difficulty. Traditional crawlers are not capable to identify relevant sub-spaces on Web related to a specific theme; however, focused crawlers are capable to solve, effectively and efficiently, the mentioned problem. Usually, a focused crawler process requires a specific value, called similarity threshold value, for determining whether a crawled Web page is relevant or not according to a topic of interest; such value is distinct for each specific topic. In order to determine automatically such a value for focused crawlers related to a genre-aware approach, we propose three strategies in this work. Our experimental evaluation achieved, as the best result, 100% of precision and 98% of F1, considering a specific crawling process for which it was determined automatically a similarity threshold value: a great result compared with the baseline. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | en | - |
Direitos: dc.rights | restrito | - |
Palavras-chave: dc.subject | Similarity threshold | - |
Palavras-chave: dc.subject | Web crawling | - |
Palavras-chave: dc.subject | Focused crawling | - |
Título: dc.title | Strategies for automatic determination of similarity threshold for genre-aware focused crawling processes. | - |
Aparece nas coleções: | Repositório Institucional - UFOP |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: