Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Universidade de São Paulo (USP) | - |
Autor(es): dc.creator | Carneiro, A.L. Cavalcante | - |
Autor(es): dc.creator | Silva, L. Brito | - |
Autor(es): dc.creator | Salvadeo, D.H. Pinheiro | - |
Data de aceite: dc.date.accessioned | 2022-08-04T22:10:15Z | - |
Data de disponibilização: dc.date.available | 2022-08-04T22:10:15Z | - |
Data de envio: dc.date.issued | 2022-04-28 | - |
Data de envio: dc.date.issued | 2022-04-28 | - |
Data de envio: dc.date.issued | 2020-12-31 | - |
Fonte completa do material: dc.identifier | http://dx.doi.org/10.1117/12.2601018 | - |
Fonte completa do material: dc.identifier | http://hdl.handle.net/11449/221916 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/11449/221916 | - |
Descrição: dc.description | New deep-learning architectures are created every year, achieving state-of-the-art results in image recognition and leading to the belief that, in a few years, complex tasks such as sign language translation will be considerably easier, serving as a communication tool for the hearing-impaired community. On the other hand, these algorithms still need a lot of data to be trained and the dataset creation process is expensive, time-consuming, and slow. Thereby, this work aims to investigate techniques of digital image processing and machine learning that can be used to create a sign language dataset effectively. We argue about data acquisition, such as the frames per second rate to capture or subsample the videos, the background type, preprocessing, and data augmentation, using convolutional neural networks and object detection to create an image classifier and comparing the results based on statistical tests. Different datasets were created to test the hypotheses, containing 14 words used daily and recorded by different smartphones in the RGB color system. We achieved an accuracy of 96.38% on the test set and 81.36% on the validation set containing more challenging conditions, showing that 30 FPS is the best frame rate subsample to train the classifier, geometric transformations work better than intensity transformations, and artificial background creation is not effective to model generalization. These trade-offs should be considered in future work as a cost-benefit guideline between computational cost and accuracy gain when creating a dataset and training a sign recognition model. | - |
Descrição: dc.description | Dept. of statistics applied mathematics and computation State Univ. of São Paulo, Av. 24 A, 1515, SP | - |
Idioma: dc.language | en | - |
Relação: dc.relation | Proceedings of SPIE - The International Society for Optical Engineering | - |
???dc.source???: dc.source | Scopus | - |
Palavras-chave: dc.subject | Convolutional neural networks | - |
Palavras-chave: dc.subject | Deep learning | - |
Palavras-chave: dc.subject | Image classification | - |
Palavras-chave: dc.subject | Object detection | - |
Palavras-chave: dc.subject | Sign language recognition | - |
Título: dc.title | Efficient sign language recognition system and dataset creation method based on deep learning and image processing | - |
Aparece nas coleções: | Repositório Institucional - Unesp |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: