Última alteração: 2025-10-10
Resumo
O reconhecimento de expressões faciais e vocais tem um papel fundamental em áreas como segurança, saúde e interfaces humano-computador. Este trabalho teve como objetivo desenvolver um software em Python capaz de identificar e classificar emoções a partir de imagens e áudios, utilizando ferramentas consolidadas, como OpenCV, SpeechRecognition, Transformers, Torch e TensorFlow. O projeto divide-se em duas etapas principais: a detecção facial, implementada com OpenCV e técnicas de deep learning, e o reconhecimento de emoções em áudios, realizado com SpeechRecognition e modelos pré-treinados da biblioteca Transformers. Ambas as funcionalidades são integradas a uma interface gráfica intuitiva, desenvolvida com TtkBootstrap, que facilita a interação do usuário. A eficácia do sistema foi avaliada com base em um conjunto de dados específicos, comparando seu desempenho com metodologias existentes. Pode-se dizer que o software alcançou alta acurácia na identificação emocional, demonstrando seu potencial para contribuir significativamente com os avanços em diversas aplicações.