Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços
dc.contributor.advisor | Mascarenhas, Ana Patrícia Fontes Magalhães | |
dc.contributor.author | Barbosa, Davi Miguel Brito | |
dc.contributor.referee | Simões, Marco Antônio Costa | |
dc.contributor.referee | Silva Filho, José Grimaldo da | |
dc.date.accessioned | 2025-08-06T12:53:35Z | |
dc.date.available | 2025-08-06T12:53:35Z | |
dc.date.issued | 2025-07-23 | |
dc.description.abstract | Competições de robótica incentivam a criação de soluções inovadoras para problemas complexos, promovendo avanços tecnológicos que podem ser aplicados em vários setores. Uma dessas aplicações é a robótica de serviço, que é um ramo na área da robótica e IA que se concentra no desenvolvimento e implementação de robôs que realizam atividades úteis para dar suporte aos seres humanos. Para que esse suporte seja possível, os robôs são desenvolvidos com algumas habilidades; uma delas é a visão computacional por meio do reconhecimento de objetos, que possibilita que uma máquina enxergue de forma análoga aos seres humanos e classifique objetos em imagens e vídeos. Para garantir o funcionamento eficaz e eficiente do robô de serviço, o nível de desempenho do reconhecimento de objetos é imprescindível para que ele possa realizar as suas tarefas. Baseando-se nisso, este estudo propôs uma solução de integração entre o reconhecimento de objetos com a técnica de reconhecimento óptico de caracteres, visando melhorar a taxa de reconhecimento da visão computacional dos robôs de serviços. A pesquisa foi conduzida com base na metodologia Design Science Research DSR, que orientou as etapas de identificação do problema, definição dos objetivos, desenvolvimento do artefato, demonstração e avaliação. O artefato proposto integrou o algoritmo YOLOv8 com o Tesseract OCR, complementado por técnicas de pré-processamento de imagem e análise de similaridade textual utilizando distância de Levenshtein, além de validação com um modelo de linguagem (LLM). Para isto, foi analisado o resultado atual do reconhecimento de objetos, logo após realizada a integração com a técnica OCR e analisado se a combinação das duas técnicas melhorou os resultados. Este trabalho foi realizado no ACSO, localizado em Salvador - Bahia. Especificamente, o objeto de estudo foi o BILL. Os experimentos demonstraram que a solução integrada apresentou melhor desempenho em relação à confiança, especialmente em cenários com múltiplos objetos ou em condições visuais desfavoráveis. Os resultados obtidos demonstraram que a integração entre o reconhecimento de objetos e o OCR contribuiu para o aumento do desempenho da visão computacional, também na correção de falsos positivos e em casos que não houve identificação do objeto, evidenciando o potencial da solução em contextos reais de robótica de serviço. Conclui-se que a abordagem proposta é eficaz, robusta e viável para robôs autônomos em ambientes dinâmicos. A solução proposta será validada na CBR 2025. | |
dc.description.abstract2 | Robotics competitions encourage the creation of innovative solutions to complex problems, promoting technological advances that can be applied across multiple sectors. One such application is service robotics, a branch of robotics and Artificial Intelligence focused on the development and implementation of robots designed to perform useful tasks that support humans. To make this support viable, robots are developed with several capabilities, one of which is computer vision through object recognition, enabling machines to perceive in a way analogous to human vision and to classify objects in images and videos. To ensure the effective and efficient operation of a service robot, the performance level of object recognition is essential for proper task execution. Based on this need, this study proposed a solution integrating object recognition with Optical Character Recognition OCR techniques to improve the recognition rate in computer vision systems for service robots. The research followed the Design Science Research DSR methodology, guiding the stages of problem identification, objective definition, artifact development, demonstration, and evaluation. The proposed artifact integrated the YOLOv8 algorithm for object detection with the Tesseract OCR engine, supplemented by image preprocessing techniques and textual similarity analysis using Levenshtein distance, along with validation through a language model (LLM. To this end, the current performance of object recognition was analyzed, followed by the integration with OCR, and then the combination of both techniques was evaluated. This work was conducted at the ACSO Research Center, located in Salvador, Bahia, and the object of study was the BILL robot. Experimental results showed that the integrated solution improved overall performance, particularly in scenarios involving multiple objects or poor visibility conditions. The results also demonstrated a reduction in false positives and better identification in previously unrecognized cases, highlighting the potential of the solution in real-world service robotics applications. It is concluded that the proposed approach is effective, robust, and feasible for autonomous robots operating in dynamic environments. The solution will be validated at the CBR 2025. | |
dc.format.mimetype | application/pdf | |
dc.identifier.citation | BARBOSA, Davi Miguel Brito. Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços. Orientadora: Ana Patrícia Fontes Magalhães Mascarenhas. 2025. 92f. Monografia (Bacharel em Sistemas de Informação) - Departamento de Ciências Exatas e da Terra, Campus I, Universidade do Estado da Bahia. Salvador -BA, 2025 | |
dc.identifier.uri | https://saberaberto.uneb.br/handle/20.500.11896/9019 | |
dc.identifier2.Lattes | http://lattes.cnpq.br/6528205999321072 | |
dc.language.iso | por | |
dc.publisher | Universidade do Estado da Bahia | |
dc.publisher.program | Colegiado de Sistema de Informação | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/br/ | |
dc.rights2 | Attribution 3.0 Brazil | en |
dc.subject.keywords | robótica de serviço | |
dc.subject.keywords | inteligência artificial | |
dc.subject.keywords | reconhecimento de objetos | |
dc.subject.keywords | robótica de serviço | |
dc.subject.keywords | roc | |
dc.title | Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços | |
dc.title.alternative | Integration between Object Recognition and OCR to Improve Computer Vision in the Context of Service Robotics | |
dc.type | info:eu-repo/semantics/bachelorThesis |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços.pdf
- Tamanho:
- 5.18 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
- Texto da monografia final para apresentação do trabalho de conclusão de curso no ano de 2025 no semestre 1.
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 462 B
- Formato:
- Item-specific license agreed upon to submission
- Descrição: