Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços

Barbosa, Davi Miguel Brito

Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços

dc.contributor.advisor	Mascarenhas, Ana Patrícia Fontes Magalhães
dc.contributor.author	Barbosa, Davi Miguel Brito
dc.contributor.referee	Simões, Marco Antônio Costa
dc.contributor.referee	Silva Filho, José Grimaldo da
dc.date.accessioned	2025-08-06T12:53:35Z
dc.date.available	2025-08-06T12:53:35Z
dc.date.issued	2025-07-23
dc.description.abstract	Competições de robótica incentivam a criação de soluções inovadoras para problemas complexos, promovendo avanços tecnológicos que podem ser aplicados em vários setores. Uma dessas aplicações é a robótica de serviço, que é um ramo na área da robótica e IA que se concentra no desenvolvimento e implementação de robôs que realizam atividades úteis para dar suporte aos seres humanos. Para que esse suporte seja possível, os robôs são desenvolvidos com algumas habilidades; uma delas é a visão computacional por meio do reconhecimento de objetos, que possibilita que uma máquina enxergue de forma análoga aos seres humanos e classifique objetos em imagens e vídeos. Para garantir o funcionamento eficaz e eficiente do robô de serviço, o nível de desempenho do reconhecimento de objetos é imprescindível para que ele possa realizar as suas tarefas. Baseando-se nisso, este estudo propôs uma solução de integração entre o reconhecimento de objetos com a técnica de reconhecimento óptico de caracteres, visando melhorar a taxa de reconhecimento da visão computacional dos robôs de serviços. A pesquisa foi conduzida com base na metodologia Design Science Research DSR, que orientou as etapas de identificação do problema, definição dos objetivos, desenvolvimento do artefato, demonstração e avaliação. O artefato proposto integrou o algoritmo YOLOv8 com o Tesseract OCR, complementado por técnicas de pré-processamento de imagem e análise de similaridade textual utilizando distância de Levenshtein, além de validação com um modelo de linguagem (LLM). Para isto, foi analisado o resultado atual do reconhecimento de objetos, logo após realizada a integração com a técnica OCR e analisado se a combinação das duas técnicas melhorou os resultados. Este trabalho foi realizado no ACSO, localizado em Salvador - Bahia. Especificamente, o objeto de estudo foi o BILL. Os experimentos demonstraram que a solução integrada apresentou melhor desempenho em relação à confiança, especialmente em cenários com múltiplos objetos ou em condições visuais desfavoráveis. Os resultados obtidos demonstraram que a integração entre o reconhecimento de objetos e o OCR contribuiu para o aumento do desempenho da visão computacional, também na correção de falsos positivos e em casos que não houve identificação do objeto, evidenciando o potencial da solução em contextos reais de robótica de serviço. Conclui-se que a abordagem proposta é eficaz, robusta e viável para robôs autônomos em ambientes dinâmicos. A solução proposta será validada na CBR 2025.
dc.description.abstract2	Robotics competitions encourage the creation of innovative solutions to complex problems, promoting technological advances that can be applied across multiple sectors. One such application is service robotics, a branch of robotics and Artificial Intelligence focused on the development and implementation of robots designed to perform useful tasks that support humans. To make this support viable, robots are developed with several capabilities, one of which is computer vision through object recognition, enabling machines to perceive in a way analogous to human vision and to classify objects in images and videos. To ensure the effective and efficient operation of a service robot, the performance level of object recognition is essential for proper task execution. Based on this need, this study proposed a solution integrating object recognition with Optical Character Recognition OCR techniques to improve the recognition rate in computer vision systems for service robots. The research followed the Design Science Research DSR methodology, guiding the stages of problem identification, objective definition, artifact development, demonstration, and evaluation. The proposed artifact integrated the YOLOv8 algorithm for object detection with the Tesseract OCR engine, supplemented by image preprocessing techniques and textual similarity analysis using Levenshtein distance, along with validation through a language model (LLM. To this end, the current performance of object recognition was analyzed, followed by the integration with OCR, and then the combination of both techniques was evaluated. This work was conducted at the ACSO Research Center, located in Salvador, Bahia, and the object of study was the BILL robot. Experimental results showed that the integrated solution improved overall performance, particularly in scenarios involving multiple objects or poor visibility conditions. The results also demonstrated a reduction in false positives and better identification in previously unrecognized cases, highlighting the potential of the solution in real-world service robotics applications. It is concluded that the proposed approach is effective, robust, and feasible for autonomous robots operating in dynamic environments. The solution will be validated at the CBR 2025.
dc.format.mimetype	application/pdf
dc.identifier.citation	BARBOSA, Davi Miguel Brito. Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços. Orientadora: Ana Patrícia Fontes Magalhães Mascarenhas. 2025. 92f. Monografia (Bacharel em Sistemas de Informação) - Departamento de Ciências Exatas e da Terra, Campus I, Universidade do Estado da Bahia. Salvador -BA, 2025
dc.identifier.uri	https://saberaberto.uneb.br/handle/20.500.11896/9019
dc.identifier2.Lattes	http://lattes.cnpq.br/6528205999321072
dc.language.iso	por
dc.publisher	Universidade do Estado da Bahia
dc.publisher.program	Colegiado de Sistema de Informação
dc.rights	info:eu-repo/semantics/openAccess
dc.rights.uri	http://creativecommons.org/licenses/by/3.0/br/
dc.rights2	Attribution 3.0 Brazil	en
dc.subject.keywords	robótica de serviço
dc.subject.keywords	inteligência artificial
dc.subject.keywords	reconhecimento de objetos
dc.subject.keywords	robótica de serviço
dc.subject.keywords	roc
dc.title	Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços
dc.title.alternative	Integration between Object Recognition and OCR to Improve Computer Vision in the Context of Service Robotics
dc.type	info:eu-repo/semantics/bachelorThesis

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços.pdf
Tamanho:: 5.18 MB
Formato:: Adobe Portable Document Format
Descrição:: Texto da monografia final para apresentação do trabalho de conclusão de curso no ano de 2025 no semestre 1.

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 462 B
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Bacharelado em Sistemas de Informação - DCET1