Computação Gráfica e Visão Computacional
Data de publicação: 05/05/2023
Descrição da playlist (código no Youtube: PLp_gqlAGZ3I102GMIytJn7fxeus1sflBi):
Computação Gráfica e Visão Computacional#Computação gráfica , Reconhecimento de Padrões em Imagens , DETR , detecção de objetos , object detection , Transformers , OpenGl, Attention is All you needEscorpioes Computacao Grafica OpenGL C++
Descrição:
Trabalho realizado já há algum tempo (2019) - trabalho final da disciplina de Computação Gráfica. Detalhes, e código fonte, no meu perfil do Github. github.com /robertocsa/Escorpioes-Trab-Computacao-Grafica-UERJ
Palavras-chave:
Nenhuma palavra-chave disponível
Estatísticas:
DETR Object Detection With Transformers
Descrição:
Você sabia que a detecção de objetos, uma das tarefas mais desafiadoras da visão computacional, está sendo revolucionada por uma nova tecnologia? Hoje, vamos explorar como o DETR – Detection Transformer – está redefinindo os padrões com inteligência artificial e Transformers. Se você se interessa por aprendizado profundo, fique até o final! O DETR, criado por Carion e sua equipe em 2020, trouxe uma abordagem radical. Ele usa Transformers, originalmente projetados para linguagem natural, para detectar objetos. Enquanto métodos tradicionais, como Faster R-CNN e YOLO, dependem de redes convolucionais e âncoras, o DETR utiliza atenção global para entender relações entre todos os elementos de uma imagem. No coração do DETR estão os mecanismos de atenção: Autoatenção: Cada parte da imagem entende como ela se relaciona com as outras. Atenção Cruzada: Embeddings de consulta aprendem a localizar e classificar objetos O DETR apresenta várias vantagens: Modelo unificado: Treinamento de ponta a ponta. Detecção global: Melhor compreensão do contexto. Robustez: Adaptável a diferentes escalas e posições de objetos. Apesar do impacto, o DETR tem desafios: Convergência lenta – o treinamento é demorado. Complexidade computacional – requer muitos recursos. Pesquisas como o Deformable DETR estão otimizando esses aspectos, tornando o modelo mais eficiente. O DETR não apenas trouxe uma nova forma de detecção de objetos, mas também abriu caminho para a aplicação dos Transformers em visão computacional. Se você gostou desse conteúdo, inscreva-se no canal e deixe seu like para mais vídeos sobre IA e aprendizado profundo!
Palavras-chave:
IA, AI, Detecção de Objetos, Transformers, Reconhecimento de padrões gráficos, mecanismo de auto-atenção, Self-attention
Estatísticas:
DeepLearning Deformable DETR
Descrição:
Exploring Deformable DETR – a game-changing approach to object detection and image understanding. In 2020, DETR, or Detection Transformer, introduced a revolutionary idea – using Transformers for object detection. While it brought unprecedented accuracy, it struggled with speed and scalability for high-resolution images. This is where Deformable DETR steps in. By rethinking how features are extracted and processed, it bridges the gap between precision and performance. The key? A deformable attention mechanism. Traditional DETR processes global attention across the entire image, which can be computationally expensive. Deformable DETR, however, focuses on specific, relevant regions, mimicking how humans naturally pay attention to key areas in a scene. From self-driving cars to medical imaging and advanced surveillance systems, the potential applications of Deformable DETR are endless.
Palavras-chave:
IA, AI, programação, Deep Learning, Pattern Recognition, DETR, Self Attention
Estatísticas:
Visão computacional : conversão de tabuleiro colorido em matriz numérica
Descrição:
Continuação da série de vídeos sobre o algoritmo de FloodFill. Neste vídeo, apresento a conversão automatizada do tabuleiro colorido, do jogo de FloodFill apresentado em outro vídeo desta série (https://www.advanced-ict.info/interactive/flood_fill.html), em uma representação matricial numérica. Essa matriz foi utilizada na implementação de um algoritmo de BFS com fila (Bread First Search ou busca em largura com fila) para a resolução de uma instância do jogo com tabuleiro de 17x17 células. Os códigos para esses algoritmos estão disponíveis no perfil do Github: https://github.com/robertocsa/VisaoComputacional
Palavras-chave:
programação, IA, AI, tutoriais, Python, FloodFill, Visão Computacional, Conversão de tabela de cores em matriz, tabuleiro de cores para matriz numérica, BFS com fila, busca em largura, algoritmo BFS
Estatísticas:
Análise de imagens coloridas: extração automatizada de tabela CSV
Descrição:
Visão computacional aplicada: Análise de imagens coloridas: apresento aplicativo que lê uma imagem com grade de cores e converte em arquivo CSV com a informação das cores encontradas. Os meandros da análise de imagens coloridas são explorados, revelando como essa poderosa técnica pode ser usada para extrair dados e insights valiosos. Já se perguntou como desvendar os segredos ocultos de uma imagem colorida? Descubra o poder da análise de imagens coloridas e aprenda a extrair dados de modo automático.
Palavras-chave:
programação, tutoriais, Python, pyodide, conversao de tabuleiro colorido, visão computacional