Analisando a viabilidade de deep learning para reconhecimento de ações em datasets pequenos

Santos Junior, Juarez Monteiro dos

Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/12313

Type:	masterThesis
Title:	Analisando a viabilidade de deep learning para reconhecimento de ações em datasets pequenos
Author(s):	Santos Junior, Juarez Monteiro dos
Advisor:	Barros, Rodrigo Coelho
Publisher:	Pontifícia Universidade Católica do Rio Grande do Sul
Graduate Program:	Programa de Pós-Graduação em Ciência da Computação
Issue Date:	2018
Keywords:	REDES NEURAIS (COMPUTAÇÃO) APRENDIZADO DO COMPUTADOR
Abstract:	Reconhecimento de ação é a tarefa de visão computacional que identifica qual ação esta ocorrendo em dada sequência de frames. Abordagens tradicionais dependem de características extraídas dessas imagens e algoritmos específicos de domínio, muitas vezes resultando em uma precisão limitada. Os avanços substanciais na aprendizagem profunda e a disponibilidade de conjuntos de dados maiores permitiram que técnicas produzam um desempenho sem conhecimento específico do domínio para reconhecer as ações que estão sendo realizadas, tendo como base apenas sequências de vídeo. No entanto, os algoritmos de aprendizagem profunda geralmente requerem conjuntos de dados rotulados muito grandes para o treinamento. Devido à sua maior capacidade, tais algoritmos geralmente sofrem com overfitting em conjunto de dados pequenos, proporcionando assim um menor poder de generalização. Este trabalho tem como objetivo explorar a aprendizagem profunda no contexto de conjuntos de dados pequenos para reconhecimento de ações. Nosso objetivo é alcançar resultados, mesmo nos casos em que os dados rotulados não sejam abundantes. Para isso, investigamos diferentes arquiteturas profundas, diferentes métodos de processamento, e diferentes métodos de fusão, fornecendo diretrizes e boas práticas para o aprendizado profundo em conjuntos de dados de tamanho pequeno. Action recognition is the computer vision task of identifying which action is happening in a given sequence of frames. Traditional approaches rely on handcrafted features and domain specific algorithms, often resulting in limited accuracy. The substantial advances in deep learning and the availability of larger datasets have allowed techniques that yield better performance without domain-specific knowledge to recognize actions being performed based on the raw information from video sequences. However, deep learning algorithms usually require very large labeled datasets for training, and due to their increased capacity their often overfit small data, hence providing lower generalization power. This work aims to explore deep learning in the context of small-sized action recognition datasets. Our goal is to achieve significant performance even in cases in which labeled data is not abundant. In order to do so, we investigate distinct network architectures, data pre-processing, and fusion methods, providing guidelines and good practices for using deep learning in small-sized datasets.
URI:	http://hdl.handle.net/10923/12313
Appears in Collections:	Dissertação e Tese

Files in This Item:

File	Description	Size	Format
000489459-Texto+Completo-0.pdf	Texto Completo	4,7 MB	Adobe PDF	Open View

Show full item record See statistics Search for other versions of fulltext via SFX