Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/24606
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorBordini, Rafael Heitor
dc.contributor.authorBettoni, Giovani Nícolas
dc.date.accessioned2023-04-18T12:14:46Z-
dc.date.available2023-04-18T12:14:46Z-
dc.date.issued2022pt_BR
dc.identifier.urihttps://hdl.handle.net/10923/24606-
dc.description.abstractA Extração de Informação (EI) abrange uma série de tarefas de Processamento de Linguagem Natural (PLN). Entre elas, o Reconhecimento de Entidades Nomeadas (REN) é uma tarefa que busca identificar as Entidades Nomeadas de um texto, tais como nomes de pessoas, locais e organizações, classificado-as em um conjunto pré-definido de categorias. Nesta dissertação pretendemos utilizar técnicas e ferramentas de PLN para a tarefa de REN no domínio Biomédico em Português. Portanto, realizamos a construção de um corpus específico e propomos dois modelos baseados em redes neurais capazes de processar o texto incluído em evoluções clínicas: BERT e uma rede neural convolucional (CNN). Além disso, foi introduzido um novo mecanismo para incorporar conhecimento farmacogenômico que sirva como base para auxiliar na decisão clínica. Os resultados mostram uma melhoria das medidas do modelo BERT em comparação à CNN e demonstram que os modelos baseados em Transformers são promissores para o avanço do desempenho de métodos de extração de informação para entidades no domínio Farmacológico em Português. O Reconhecimento de Entidades Nomeadas em evoluções clínicas está ganhando popularidade por melhorar os projetos de extração clínica. Este estudo permitiu à comunidade que trabalha com PLN, no contexto clínico, obter uma análise formal dessa tarefa, incluindo as formas mais bem-sucedidas de realizá-la.pt_BR
dc.description.abstractInformation Extraction (IE) covers a number of Natural Language Processing (NLP) tasks. Named Entity Recognition (NER) is a task that seeks to identify the Named Entities of a text, such as names of people, places, and organizations, classifying them in a predefined set of categories. This dissertation intends to use NLP techniques and tools for the REN task in the Biomedical domain in Portuguese. Thus, we build a specific corpus and propose two models defined in neural networks able to process the text included in clinical evolutions: BERT and a convolutional neural network (CNN). In addition, a new mechanism has been introduced to incorporate pharmacogenomic knowledge that serves as a basis for aiding clinical decisions. The results show an improvement in the measures of the BERT model compared to CNN and demonstrate that Transformers-based models are promising for advancing the performance of information extraction methods for entities in the Pharmacologic domain in Portuguese. Recognition of Named Entities in clinical evolutions is gaining popularity for improving clinical extraction projects. This study allowed the community working with NLP, in the clinical context, to obtain a formal analysis of this task, including the most successful ways of performing it.en_US
dc.language.isoPortuguêspt_BR
dc.publisherPontifícia Universidade Católica do Rio Grande do Sulpt_BR
dc.rightsopenAccessen_US
dc.subjectPROCESSAMENTO DA LINGUAGEM NATURALpt_BR
dc.subjectLINGUÍSTICA COMPUTACIONALpt_BR
dc.subjectRECUPERAÇÃO DA INFORMAÇÃOpt_BR
dc.subjectINFORMÁTICApt_BR
dc.titleExtração de informação em evoluções clínicas e integração com dados farmacogenômicospt_BR
dc.typemasterThesispt_BR
dc.degree.grantorPontifícia Universidade Católica do Rio Grande do Sulpt_BR
dc.degree.departmentFaculdade de Informáticapt_BR
dc.degree.programPrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.degree.levelMestradopt_BR
dc.degree.date2022pt_BR
dc.publisher.placePorto Alegrept_BR
Appears in Collections:Dissertação e Tese

Files in This Item:
File Description SizeFormat 
000503320-Texto+completo-0.pdfTexto completo1,98 MBAdobe PDFOpen
View


All Items in PUCRS Repository are protected by copyright, with all rights reserved, and are licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. Read more.