Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços

dc.contributor.advisorMascarenhas, Ana Patrícia Fontes Magalhães
dc.contributor.authorBarbosa, Davi Miguel Brito
dc.contributor.refereeSimões, Marco Antônio Costa
dc.contributor.refereeSilva Filho, José Grimaldo da
dc.date.accessioned2025-08-06T12:53:35Z
dc.date.available2025-08-06T12:53:35Z
dc.date.issued2025-07-23
dc.description.abstractCompetições de robótica incentivam a criação de soluções inovadoras para problemas complexos, promovendo avanços tecnológicos que podem ser aplicados em vários setores. Uma dessas aplicações é a robótica de serviço, que é um ramo na área da robótica e IA que se concentra no desenvolvimento e implementação de robôs que realizam atividades úteis para dar suporte aos seres humanos. Para que esse suporte seja possível, os robôs são desenvolvidos com algumas habilidades; uma delas é a visão computacional por meio do reconhecimento de objetos, que possibilita que uma máquina enxergue de forma análoga aos seres humanos e classifique objetos em imagens e vídeos. Para garantir o funcionamento eficaz e eficiente do robô de serviço, o nível de desempenho do reconhecimento de objetos é imprescindível para que ele possa realizar as suas tarefas. Baseando-se nisso, este estudo propôs uma solução de integração entre o reconhecimento de objetos com a técnica de reconhecimento óptico de caracteres, visando melhorar a taxa de reconhecimento da visão computacional dos robôs de serviços. A pesquisa foi conduzida com base na metodologia Design Science Research DSR, que orientou as etapas de identificação do problema, definição dos objetivos, desenvolvimento do artefato, demonstração e avaliação. O artefato proposto integrou o algoritmo YOLOv8 com o Tesseract OCR, complementado por técnicas de pré-processamento de imagem e análise de similaridade textual utilizando distância de Levenshtein, além de validação com um modelo de linguagem (LLM). Para isto, foi analisado o resultado atual do reconhecimento de objetos, logo após realizada a integração com a técnica OCR e analisado se a combinação das duas técnicas melhorou os resultados. Este trabalho foi realizado no ACSO, localizado em Salvador - Bahia. Especificamente, o objeto de estudo foi o BILL. Os experimentos demonstraram que a solução integrada apresentou melhor desempenho em relação à confiança, especialmente em cenários com múltiplos objetos ou em condições visuais desfavoráveis. Os resultados obtidos demonstraram que a integração entre o reconhecimento de objetos e o OCR contribuiu para o aumento do desempenho da visão computacional, também na correção de falsos positivos e em casos que não houve identificação do objeto, evidenciando o potencial da solução em contextos reais de robótica de serviço. Conclui-se que a abordagem proposta é eficaz, robusta e viável para robôs autônomos em ambientes dinâmicos. A solução proposta será validada na CBR 2025.
dc.description.abstract2Robotics competitions encourage the creation of innovative solutions to complex problems, promoting technological advances that can be applied across multiple sectors. One such application is service robotics, a branch of robotics and Artificial Intelligence focused on the development and implementation of robots designed to perform useful tasks that support humans. To make this support viable, robots are developed with several capabilities, one of which is computer vision through object recognition, enabling machines to perceive in a way analogous to human vision and to classify objects in images and videos. To ensure the effective and efficient operation of a service robot, the performance level of object recognition is essential for proper task execution. Based on this need, this study proposed a solution integrating object recognition with Optical Character Recognition OCR techniques to improve the recognition rate in computer vision systems for service robots. The research followed the Design Science Research DSR methodology, guiding the stages of problem identification, objective definition, artifact development, demonstration, and evaluation. The proposed artifact integrated the YOLOv8 algorithm for object detection with the Tesseract OCR engine, supplemented by image preprocessing techniques and textual similarity analysis using Levenshtein distance, along with validation through a language model (LLM. To this end, the current performance of object recognition was analyzed, followed by the integration with OCR, and then the combination of both techniques was evaluated. This work was conducted at the ACSO Research Center, located in Salvador, Bahia, and the object of study was the BILL robot. Experimental results showed that the integrated solution improved overall performance, particularly in scenarios involving multiple objects or poor visibility conditions. The results also demonstrated a reduction in false positives and better identification in previously unrecognized cases, highlighting the potential of the solution in real-world service robotics applications. It is concluded that the proposed approach is effective, robust, and feasible for autonomous robots operating in dynamic environments. The solution will be validated at the CBR 2025.
dc.format.mimetypeapplication/pdf
dc.identifier.citationBARBOSA, Davi Miguel Brito. Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços. Orientadora: Ana Patrícia Fontes Magalhães Mascarenhas. 2025. 92f. Monografia (Bacharel em Sistemas de Informação) - Departamento de Ciências Exatas e da Terra, Campus I, Universidade do Estado da Bahia. Salvador -BA, 2025
dc.identifier.urihttps://saberaberto.uneb.br/handle/20.500.11896/9019
dc.identifier2.Latteshttp://lattes.cnpq.br/6528205999321072
dc.language.isopor
dc.publisherUniversidade do Estado da Bahia
dc.publisher.programColegiado de Sistema de Informação
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/
dc.rights2Attribution 3.0 Brazilen
dc.subject.keywordsrobótica de serviço
dc.subject.keywordsinteligência artificial
dc.subject.keywordsreconhecimento de objetos
dc.subject.keywordsrobótica de serviço
dc.subject.keywordsroc
dc.titleIntegração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços
dc.title.alternativeIntegration between Object Recognition and OCR to Improve Computer Vision in the Context of Service Robotics
dc.typeinfo:eu-repo/semantics/bachelorThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Integração entre o Reconhecimento de Objetos e OCR para Melhorar a Visão Computacional no Contexto da Robótica de Serviços.pdf
Tamanho:
5.18 MB
Formato:
Adobe Portable Document Format
Descrição:
Texto da monografia final para apresentação do trabalho de conclusão de curso no ano de 2025 no semestre 1.
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
462 B
Formato:
Item-specific license agreed upon to submission
Descrição: