Computer Vision

Computer Vision (Visão Computacional)

Definição:
Visão Computacional é uma área da IA que permite que sistemas interpretem e entendam imagens e vídeos, extraindo informações úteis para análise, decisão ou ação.


Como funciona (visão modular):

  • Captura de imagem/vídeo (câmera/sensor)
  • Pré-processamento (filtro, normalização, ajuste)
  • Extração de características (features)
  • Processamento via modelo (ML/DL)
  • Geração de resultado (classificação, detecção, medição)

✔ Separação clara: captura ≠ processamento ≠ interpretação ≠ decisão


Principais abordagens:

  • Classificação de imagem
    • Define o que está na imagem
  • Detecção de objetos
    • Identifica e localiza objetos
  • Segmentação
    • Divide a imagem em regiões
  • Reconhecimento de padrões
    • Identifica formas, defeitos ou comportamentos visuais

E o que isso tem a ver com IoT/embarcados?

No contexto de IoT e sistemas embarcados, computer vision transforma dispositivos em sensores visuais capazes de interpretar o ambiente físico, indo além de medições simples como temperatura ou corrente. Em vez de apenas coletar dados, o dispositivo captura imagens ou vídeo e os converte em informação acionável — identificando objetos, eventos ou condições diretamente no mundo real . Isso permite que sistemas IoT deixem de ser apenas “leitores de sinais” e passem a atuar com base em percepção visual.

Na prática embarcada, isso ocorre através de sistemas de visão embarcada (embedded vision), onde câmera + processamento estão no próprio dispositivo, permitindo análise local em tempo real, sem depender da nuvem . Isso é crítico em IoT: reduz latência, economiza banda e aumenta a autonomia. Aplicações diretas incluem inspeção industrial, monitoramento de segurança, automação predial e robótica, onde o dispositivo observa → interpreta → decide → atua dentro do próprio hardware. Resultado: o sistema embarcado deixa de apenas “medir o ambiente” e passa a entender visualmente o que está acontecendo e reagir imediatamente.


Exemplos práticos (IoT / automação):

  • Inspeção industrial
    • Detecta defeitos em peças (trincas, desalinhamentos, falhas visuais)
  • Monitoramento de processos
    • Observa operação de máquinas ou linhas de produção
  • Contagem automática
    • Conta objetos em esteiras ou ambientes
  • Segurança e vigilância
    • Detecta presença, movimento ou comportamento anormal

Boas práticas:

  • Garantir boa qualidade de imagem (iluminação, posição)
  • Usar modelos adequados ao problema
  • Validar resultados com dados reais
  • Separar análise visual de execução física
  • Preferir soluções já disponíveis quando aplicável

Diferença-chave vs sensores tradicionais:

  • Sensores comuns → medem grandezas específicas (temperatura, pressão)
  • Visão computacional → interpreta informação visual complexa

Por que usar:

  • Permite análise não invasiva
  • Detecta padrões complexos
  • Automatiza inspeções visuais
  • Substitui tarefas humanas repetitivas

Quando usar:

  • Problemas baseados em imagem/vídeo
  • Inspeção, detecção ou monitoramento visual
  • Situações onde sensores tradicionais não são suficientes

Quando NÃO usar:

  • Quando um sensor simples resolve (evitar overengineering)
  • Ambientes com condições visuais ruins não controláveis
  • Sistemas que exigem latência extremamente baixa sem suporte adequado

Resumo direto:

Visão Computacional = interpretar imagens para extrair informação útil.