Reft: sistema integrado de reconhecimento de emoções na fala e no texto para o idioma brasileiro

dc.contributor.advisorSimões, Marco Antônio Costa
dc.contributor.authorGomes, Vanessa Martins
dc.contributor.refereeSouza, Josemar Rodrigues de
dc.contributor.refereeChaves, Débora Alcina Rego
dc.date.accessioned2024-10-29T13:08:48Z
dc.date.available2024-10-29T13:08:48Z
dc.date.issued2023-07-12
dc.description.abstractO reconhecimento de voz desempenha um papel fundamental na comunicação humana e tem sido amplamente estudado na área de processamento de sinais. A voz humana contém informações valiosas que podem ser exploradas para inferir as emoções de um indivíduo. A detecção de emoções através da fala é uma abordagem de Processamento de Linguagem Natural (PLN) que combina análise acústica e linguística para identificar padrões emocionais. A emoção é uma experiência mental subjetiva e consciente, muitas vezes acompanhada por respostas ou mudanças biológicas específicas. Portanto, as palavras que usamos nem sempre refletem exatamente o que estamos sentindo. Nesse contexto, este trabalho propõe explorar a utilização concomitante de características sonoras e léxicas da voz em língua portuguesa do Brasil. A metodologia adotada envolveu uma revisão sistemática da literatura para identificar as melhores práticas e abordagens existentes, além de desenvolver um sistema de reconhecimento de emoções em tempo real que combina dados léxicos e prosódicos da fala. Para a classificação das emoções e construção dos modelos, foi utilizada uma Rede Neural Convolucional (CNN) e o Bidirectional Encoder Representations for Transformers (BERT), um modelo de transformador conhecido por sua eficácia em tarefas de linguagem natural. A validação dos resultados foi realizada por meio de testes e avaliação das métricas de acurácia e precisão. Foram obtidos dois resultados, sendo que o resultado ponderado apresentou uma taxa de 15% de acertos a mais que o resultado normal, totalizando 87.5%. A relevância social deste projeto reside na sua capacidade de melhorar a interação entre humanos e computadores, bem como de promover o bem-estar emocional dos indivíduos. Ao permitir o reconhecimento preciso e em tempo real das emoções por meio da voz, abre-se um leque de oportunidades para aplicação em áreas como saúde, marketing emocional e interações sociais. Essa abordagem pode contribuir para o desenvolvimento de tecnologias mais humanizadas, adaptadas às necessidades emocionais dos usuários, e fomentar a criação de ambientes mais empáticos e inclusivos, onde a compreensão e a expressão das emoções são valorizadas e utilizadas de forma construtiva, além de contribuir para a comunidade de PLN no Brasil.
dc.description.abstract2Voice recognition plays a fundamental role in human communication and has been widely studied in the signal processing field. The human voice contains valuable information that can be explored to infer an individual’s emotions. Emotion detection through speech is a Natural Language Processing (NLP) approach that combines acoustic and linguistic analysis to identify emotional patterns. Emotion is a subjective and conscious mental experience, often accompanied by specific biological responses or changes. Therefore, the words we use do not always precisely reflect what we are feeling. In this context, this work proposes exploring the simultaneous use of sound and lexical features of Brazilian Portuguese speech. The adopted methodology involved a systematic literature review to identify best practices and existing approaches, as well as developing a real-time emotion recognition system that combines lexical and prosodic speech data. For emotion classification and model building, a Convolutional Neural Network (CNN) and Bidirectional Encoder Representations for Transformers (BERT), a transformer model known for its effectiveness in natural language tasks, were used. Validation of the results was performed through tests and evaluation of accuracy and precision metrics. Two results were obtained, with the weighted result showing a 15% higher accuracy than the normal result, totaling 87.5%. The social relevance of this project lies in its ability to enhance interaction between humans and computers and promote emotional well-being. By enabling accurate and real-time emotion recognition through voice, it opens up opportunities for applications in areas such as healthcare, emotional marketing, and social interactions. This approach can contribute to the development of more humanized technologies, adapted to users’ emotional needs, and foster the creation of more empathetic and inclusive environments, where understanding and expression of emotions are valued and used constructively. It also contributes to the NLP community in Brazil.
dc.format.mimetypeapplication/pdf
dc.identifier.citationGOMES, Vanessa Martins. Reft: sistema integrado de reconhecimento de emoções na fala e no texto para o idioma brasileiro. 2023. 62 f. Trabalho de conclusão de curso (Bacharelado em Sistemas de Informação) - Departamento de Ciências Exatas e da Terra, Campus I, Universidade do Estado da Bahia. Salvador- BA, 2023.
dc.identifier.urihttps://saberaberto.uneb.br/handle/20.500.11896/6516
dc.language.isopor
dc.publisherUniversidade do Estado da Bahia
dc.publisher.programGraduação
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/
dc.rights2Attribution 3.0 Brazilen
dc.subject.keywordsReconhecimento de voz
dc.subject.keywordsProcessamento de Linguagem Natural (PLN)
dc.subject.keywordsRede Neural Convolucional (CNN)
dc.titleReft: sistema integrado de reconhecimento de emoções na fala e no texto para o idioma brasileiro
dc.title.alternativeReft: an integrated system for recognizing emotions in speech and text for the Brazilian language
dc.typeinfo:eu-repo/semantics/bachelorThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Reft_sistema integrado de reconhecimento_Vanessa Gomes.pdf
Tamanho:
2.27 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
462 B
Formato:
Item-specific license agreed upon to submission
Descrição: