Utilize este identificador para citar ou criar um atalho para este documento: https://hdl.handle.net/10923/24363
Tipo: masterThesis
Título: Exploring the radiomics approach for covid-19 identification in lung computed tomography
Autor(es): Oliveira, Christian Mattjie de
Orientador: Silva, Ana Maria Marques da
Editora: Pontifícia Universidade Católica do Rio Grande do Sul
Programa: Programa de Pós-Graduação em Gerontologia Biomédica
Data de Publicação: 2022
Palavras-chave: TOMOGRAFIA COMPUTADORIZADA
DOENÇA POR COVID-19
GERONTOLOGIA BIOMÉDICA
MEDICINA
Resumo: O surto de pneumonia de COVID-19 causou transtornos globais e foi declarado uma pandemia pela Organização Mundial da Saúde em 13 de março de 2020. Os exames radiológicos do tórax, como radiografias do tórax ou tomografias computadorizadas, têm um papel vital no diagnóstico da COVID-19. Vários estudos propuseram o uso de modelos de classificação utilizando características radiômicas extraídas dos pulmões em imagens radiológicas, principalmente para o diagnóstico e avaliação da gravidade da COVID-19. Entretanto, poucos desses estudos exploram como os parâmetros de extração de características, como a discretização, impactam as características extraídas. Portanto, este estudo visa implementar modelos para identificar a COVID-19 através da assinatura radiômica enquanto investiga diferentes parâmetros de pré-processamento e discretização.O conjunto de dados utilizado foi de 180 (128 COVID e 52 não COVID) tomografias de tórax realizadas no Hospital São Lucas da PUCRS que foram divididas em conjuntos de treinamento (50\%), validação (25\%) e teste (25\%). Realizamos segmentação dos pulmões, aplicamos diversos filtros e discretizamos a imagem com 6 tamanhos diferentes de bin: 1, 5, 10, 25, 50, e 75. As características foram extraídas de todos os filtros aplicados e tamanhos de bin. Os atributos Wavelet e não-wavelet foram fundidos em 36 combinações de tamanhos de bin com 1774 atributos para cada pulmão. Um modelo de classificação foi treinado com cada combinação de características e os três melhores modelos foram escolhidos para a otimização. Identificamos algumas de nossas limitações e utilizamos quatro estratégias alternativas para tentar superá-las: SMOTE, subamostragem, seleção de atributos e somente utilizar atributos da imagem original.O melhor desempenho foi alcançado pelo modelo SMOTE NW25-1 com um AUC de 0,800. Os três melhores modelos para cada uma destas estratégias alternativas também foram otimizados. Dos 15 modelos otimizados, os seis melhores foram selecionados para análise da importância dos atributos. Os filtros laplaciano da gaussiana e wavelet foram os que geraram os atributos mais relevantes. Nossos resultados indicam que os tamanhos menores de bin, em uma faixa de 1 a 25, podem ser mais investigados para extração de características na imagem original e na maior parte dos filtros. Os filtros laplaciano da gaussiana e wavelet podem ter melhor desempenho com bins ainda menores, em uma faixa de 1 a 10.
The COVID-19 pneumonia outbreak has caused global turmoil and was declared a pandemic by the World Health Organization on March 13, 2020. Chest radiological examinations, such as chest X-rays or CT scans, play a vital role in the diagnosis of COVID-19. Several studies have proposed the use of classification models using radiomic features extracted from the lungs in radiological images, mainly for COVID-19 diagnosis and severity assessment. However, few of these studies explore how feature extraction parameters, such as discretization, impact the extracted features. Therefore, this study aims to implement models for identifying COVID-19 through the radiomic signature while investigating different preprocessing and discretization parameters. Our dataset was composed by 180 (128 COVID and 52 non-COVID) chest CT scans performed at Hospital São Lucas da PUCRS which were divided into training (50\%), validation (25\%), and test (25\%) sets.We performed lung segmentation, applied several filters, and discretized the image with 6 different bin sizes: 1, 5, 10, 25, 50, and 75. Features were extracted from all applied filters and bin sizes. Wavelet and non-wavelet features were merged into 36 combinations of bin sizes with 1774 features for each lung. A classification model was trained with each combination of features and the best three models were chosen for the optimization. We identified some of our limitations and used four alternative strategies to try to overcome them: SMOTE, undersampling, feature selection, and only using features from the original image. The best performance was achieved by SMOTE NW25-1 model with an AUC of 0.800. The best three models for each of these alternative strategies were also optimized. Of the 15 optimized models, the six best were selected for feature importance analysis. The laplacian of gaussian and wavelet filters were the ones that generated the most relevant features. Our results indicate that smaller bin sizes, in a range from 1 to 25 may be further investigated for feature extraction in the original image and most filters. Laplacian of gaussian and wavelet filters may perform better with even smaller bin sizes, with a range from 1 to 10.
URI: https://hdl.handle.net/10923/24363
Aparece nas Coleções:Dissertação e Tese

Arquivos neste item:
Arquivo Descrição TamanhoFormato 
000502853-Texto+completo-0.pdfTexto completo13,99 MBAdobe PDFAbrir
Exibir


Todos os itens no Repositório da PUCRS estão protegidos por copyright, com todos os direitos reservados, e estão licenciados com uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional. Saiba mais.