Detecção de disparo de arma de fogo utilizando redes neurais convolucionais

Ribeiro, Lucas Medeiros

Utilize este identificador para citar ou criar um atalho para este documento: https://hdl.handle.net/10923/26399

Tipo:	Monografia
Título:	Detecção de disparo de arma de fogo utilizando redes neurais convolucionais
Autor(es):	Ribeiro, Lucas Medeiros
Orientador:	Fernandes, Dênis
Data de Publicação:	2022
Palavras-chave:	PROCESSAMENTO DE ÁUDIO LIBROSA ESPECTROGRAMA REDES NEURAIS CONVOLUCIONAIS KERAS TENSORFLOW AUDIO PROCESSING SPECTROGRAM CONVOLUTIONAL NEURAL NETWORKS
Resumo:	Sistemas para detecção de disparo de arma de fogo estão se tornando cada dia mais sofisticados e eficazes no combate à violência. Todavia, esta tecnologia é importada e possui um custo elevado, o que a torna pouco aderida pelas autoridades de segurança. Neste contexto, o presente trabalho pretende apresentar uma solução para auxiliar na detecção de disparos de armas de fogo utilizando redes neurais convolucionais (CNNs). Assim, serão apresentados conceitos sobre a classificação de áudios, meios de representar visualmente um áudio, o que são redes neurais convolucionais, uso do Keras e Tensorflow para geração e treinamento de redes neurais convolucionais. Posteriormente é descrita a solução proposta desde o processamento das amostras de áudio, o uso da biblioteca Librosa para geração dos espectrogramas, o uso dos modelos InceptionV3, ResNet50 e VGG16 para classificar espectrogramas e a geração de modelos refinados. As métricas para avaliação de resultado consideram acurácia, loss, precisão, recall, f-score e tabela de confusão. Os resultados adquiridos mostram uma acurácia acima dos 96,15% durante o treinamento no pior dos casos. No entanto, a validação do modelo pelo do dataset de teste resultou em uma precisão de 84% e recall de 73% no melhor dos casos. Percebe-se então, que para a classificação de áudio a solução proposta há pontos de melhoria no processamento das amostras para atingir um resultado melhor nos modelos usados. Systems to detect gunfire are becoming increasingly sophisticated and effective in combating violence. However, this technology is imported and has a high cost, which makes it little adhered to by security authorities. In this context, the present work intends to present a solution to assist in the detection of firearm shootings using convolutional neural networks (CNNs). Thus, concepts about áudio classification, means of visually representing audio, what convolutional neural networks are, the use of Keras and Tensorflow for generating and training convolutional neural networks will be presented. Subsequently the proposed solution is described from the processing of the audio samples, the use of the library Librosa for spectrogram generation, the use of the InceptionV3, ResNet50 and VGG16 models to classify spectrograms, and the generation of refined models. The metrics for result evaluation consider accuracy, loss, precision, recall, f-score, and confusion table. The acquired results show an accuracy above 96.15% during worst case training. However, validation of the model by the test dataset resulted in a best-case accuracy of 84% and recall of 73%. It can be seen then, that for audio classification the proposed solution has points for improvement in the processing of the samples to achieve a better result in the models used.
URI:	https://hdl.handle.net/10923/26399
Aparece nas Coleções:	TCC Engenharia de Computação

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
2022_2_LUCAS_MEDEIROS_RIBEIRO_TCC.pdf	Texto completo	1 MB	Adobe PDF	Abrir Exibir

Ver em formato completo Ver estatísticas Busque outras versões desse texto via SFX

Todos os itens no Repositório da PUCRS estão protegidos por copyright, com todos os direitos reservados, e estão licenciados com uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional. Saiba mais.