Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/1537
Type: masterThesis
Title: SiSe: medida de similaridade semântica entre ontologias em português
Author(s): Freitas, Juliano Baldez de
Advisor: Lima, Vera Lúcia Strube de
Publisher: Pontifícia Universidade Católica do Rio Grande do Sul
Graduate Program: Programa de Pós-Graduação em Ciência da Computação
Issue Date: 2007
Keywords: INFORMÁTICA
PROCESSAMENTO DA LINGUAGEM NATURAL
ONTOLOGIA
SEMÂNTICA
Abstract: This work concerns the development of a semantic similarity measure for mapping between Portuguese ontologies. The SiSe (Similaridade Semântica) measure presented in this work is an extension of the proposal known as Taxonomic Overlap proposed by Maedche and Staab [Maedche e Staab 2002]. SiSe makes a comparison on the similarity between terms of distinct ontologies through the analysis of their hierarchies. We use the concepts of Semantic Cotopy and Common Semantic Cotopy, which build a set for each term in question. This set is composed by the term and the subconcepts and superconcepts of this term, all represented by their stems, through the stemmer PortugueseStemmer by Orengo and Huyck [Orengo e Huyck 2001]. Our measure adopts a mapping that considers the languages used in the description of the ontologies (for example, OWL, RFDS, etc), and normalizes them in XML keeping the hierarchic relations of hyponym and hypernym in the ontologies. The SiSe measure compares the similarity between the ontologies through the hierarchic relations that are common among them, and the result is a semantic-structural similarity value. The evaluation of the SiSe measure is carried out through a Golden mapping that consists of the similarity between two ontologies according to human analysis. The SiSe results are compared to this Golden Mapping. This measure helps the mapping between ontologies aiming at the reuse and the information integration.
Este trabalho consiste na adaptação de uma medida de similaridade semântica para o mapeamento entre ontologias em português. A medida SiSe (Similaridade Semântica) apresentada neste trabalho adapta a proposta Mapeamento Taxonômico, de Maedche e Staab [Maedche e Staab 2002]. A medida SiSe faz uma comparação da similaridade entre termos de ontologias distintas através da análise da hierarquia dos mesmos. Utilizamos o conceito de "Semantic Cotopy" e "Common Semantic Cotopy", os quais formam um conjunto para cada um dos termos comparados. Cada conjunto é composto pelo termo, pelos subconceitos e superconceitos deste termo, todos representados por seus stems, através de um recurso de Processamento da Linguagem Natural, o stemmer PortugueseStemmer desenvolvido por Orengo e Huyck [Orengo e Huyck 2001]. Nossa medida adota uma estratégia para o mapeamento entre ontologias que envolve a análise das linguagens utilizadas na descrição das ontologias (OWL, RFDS, etc), abstraindo as sintaxes e normalizando em uma linguagem XML com as relações hierárquicas de hiponímia e hiperonímia das ontologias. A medida de similaridade SiSe compara as ontologias através das relações hierárquicas que as mesmas possuem, desta forma o coeficiente resultante é a similaridade semântico-estrutural entre os termos das ontologias. A avaliação da medida SiSe é realizada através de um "Golden mapping", ou mapeamento dourado, que consiste na avaliação da similaridade de algumas ontologias por humanos confrontando com os resultados da medida SiSe. Esta medida é utilizada para auxiliar no mapeamento entre ontologias visando o reuso e a integração de informação.
URI: http://hdl.handle.net/10923/1537
Appears in Collections:Dissertação e Tese

Files in This Item:
File Description SizeFormat 
000393159-Texto+Completo-0.pdfTexto Completo2,62 MBAdobe PDFOpen
View


All Items in PUCRS Repository are protected by copyright, with all rights reserved, and are licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. Read more.