Resumo
Este trabalho propõe uma solução tecnológica para otimizar o fluxo produtivo na indústria de confecção, visando agilizar o preenchimento do Bill of Materials (BOL) na etapa de prototipagem. O estudo aborda a substituição do registro manual de operações de costura por um sistema automatizado de captura de dados audiovisuais. O objetivo central é desenvolver uma aplicação para registro multimodal das tarefas, integrando ferramentas de visão computacional e processamento de linguagem natural. A metodologia emprega a linguagem Python e Inteligência Artificial, utilizando o modelo Whisper para Reconhecimento Automático de Fala (ASR) e busca semântica para a classificação e estruturação dos comandos operacionais. Os resultados demonstram que o sistema viabiliza o preenchimento automático do BOL e a criação de um acervo audiovisual técnico, promovendo a padronização dos processos e a redução do tempo de revisão. Conclui-se que a automação baseada no reconhecimento de voz e vídeo constitui uma alternativa eficaz aos métodos tradicionais, aumentando a confiabilidade da informação técnica sem depender exclusivamente de processos manuais.
Referências
CLOUDFLARE. O que são embeddings no aprendizado de máquina? Cloudflare Learning, [s.d.]. Disponível em: https://www.cloudflare.com/pt-br/learning/ai/what-are-embeddings/. Acesso em: 13 jan. 2026.
DIDÁTICA TECH. Tudo sobre o framework Kivy para iniciantes! [S. l.], [s.d.]. Disponível em: https://didatica.tech/tudo-sobre-o-framework-kivy-para-iniciantes/. Acesso em: 15 jan. 2026.
FFMPEG. FFmpeg: A complete, cross-platform solution to record, convert and stream audio and video. Disponível em: https://ffmpeg.org/. Acesso em: 29 jan. 2026.
KIVY. Kivy: Open source Python library for rapid development of applications. Disponível em: https://kivy.org/. Acesso em: 29 jan. 2026.
LOPES FILHO, Antonio Alves. Análise comparativa de redes profundas para reconhecimento automático de fala em português. 2022. 51 p. Monografia (MBA em Inteligência Artificial e Big Data) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2022. Disponível em: https://bdta.abcd.usp.br/directbitstream/7716b2eb-7006-4fa2-b06c-a858bd42691d/Antonio%20Alves_TCC_ASR_COMPARISON_OFICIAL%20%287%29_207623.pdf. Acesso em: 16 jan. 2026.
NEWARK. Raspberry Pi 5: Revisão Completa e Análise de Desempenho. Embarcados, 20 jun. 2024. Disponível em: https://embarcados.com.br/raspberry-pi-5-revisao-completa-e-analise-de-desempenho/. Acesso em: 16 jan. 2026.
OPENAI. Introducing Whisper. OpenAI Research, 2022. Disponível em: https://openai.com/research/whisper. Acesso em: 16 jan. 2026.
STRYKER, Cole. O que é LLM (grandes modelos de linguagem)? IBM Think, 8 dez. 2025. Disponível em: https://www.ibm.com/br-pt/think/topics/large-language-models. Acesso em: 15 jan. 2026.
WILBERT, Max. FFmpeg Live Streaming – What Professional Broadcasters Need to Know [2025 Update]. Blog Dacast, 6 jun. 2025. Disponível em: https://www.dacast.com/blog/how-to-broadcast-live-stream-using-ffmpeg/. Acesso em: 15 jan. 2026.

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Copyright (c) 2026 Jose Francisco de Souza Fonseca, Matheus Felipe Duarte Dionísio, Matheus Mathias Rocha Lucio de Moraes, Rafael da Silva Cosme, Rafael Martins da Silva, Robinson Luis de Souza Alves, Ivanilson França Vieira Júnior, Wagner de Oliveira (Autor)