Estatística das letras, palavras e períodos

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorUniversidade Estadual Paulista (UNESP)-
Autor(es): dc.creatorUniversidade Federal Fluminense, UFF - Matemática-
Autor(es): dc.creatorProjeto Condigital MEC – MCT-
Autor(es): dc.creatorPereira, Thiago Gomes-
Autor(es): dc.creatorBortolossi, Humberto José-
Data de aceite: dc.date.accessioned2019-08-21T18:42:15Z-
Data de disponibilização: dc.date.available2019-08-21T18:42:15Z-
Data de envio: dc.date.issued2016-10-26-
Data de envio: dc.date.issued2016-10-26-
Fonte completa do material: dc.identifierhttp://acervodigital.unesp.br/handle/unesp/372642-
Fonte completa do material: dc.identifierhttp://objetoseducacionais2.mec.gov.br/handle/mec/16520-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/478849-
Descrição: dc.descriptionEnsino Médio::Matemática-
Descrição: dc.descriptionCom o advento da internet, o avanço da ciência e a interação entre povos de línguas diferentes, mais e mais dados são gerados em forma de texto. Extrair informações relevantes e identificar padrões nesta massa de dados constituem desafios tecnológicos atuais. Problemas desta natureza são estudados em campos de pesquisa como mineração de texto (text mining) e linguística computacional. Neste contexto, a estatística se estabelece como uma ferramenta fundamental e indispensável. Nesta atividade, você poderá experimentar o uso de conceitos básicos de estatística na análise de sequências de caracteres (a “ponta do iceberg” das técnicas e ideias que são empregadas). O primeiro aplicativo conta o número de letras, dígitos, acentos, sinais de pontuação, palavras e períodos de um texto (que pode estar em português, inglês, espanhol, francês ou alemão). Ele também calcula o número de letras por palavra e o número de palavras por período (apresentando média, mediana, moda, variância e desvio padrão destas variáveis quantitativas), os períodos mais longos, os períodos mais curtos, as palavras mais longas e as palavras mais curtas. O segundo aplicativo apresenta um recurso gráfico (usado principalmente na internet) para descrever os termos mais frequentes de um determinado texto. O tamanho da fonte em que a palavra é apresentada é uma função da frequência da palavra no texto: palavras mais frequentes são desenhadas em fontes de tamanho maior, palavras menos frequentes são desenhadas em fontes de tamanho menor-
Relação: dc.relationlpp-testar-sistema-e-iniciar.html-
Direitos: dc.rightsTermo de cessão dado pelo autor ou seu representante diretamente ao Ministério da Educação - MEC que permite o uso do recurso para distribuição, tradução, edição, excetuando-se o uso comercial-
Palavras-chave: dc.subjectmoda-
Palavras-chave: dc.subjectmediana-
Palavras-chave: dc.subjectlinguística computacional-
Palavras-chave: dc.subjectmineração de textos-
Palavras-chave: dc.subjectdesvio padrão-
Palavras-chave: dc.subjectvariância-
Palavras-chave: dc.subjectmédia-
Palavras-chave: dc.subjecthistogramas-
Palavras-chave: dc.subjectvariáveis quantitativas-
Palavras-chave: dc.subjectvariáveis qualitativas-
Palavras-chave: dc.subjectDistribuições de frequências-
Palavras-chave: dc.subjectEducação Básica::Ensino Médio::Matemática::Análise de dados e probabilidade-
Título: dc.titleEstatística das letras, palavras e períodos-
Tipo de arquivo: dc.typetexto-
Aparece nas coleções:Repositório Institucional - Acervo Digital Unesp

Não existem arquivos associados a este item.