Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/16462
Type: masterThesis
Title: Análise multimodal em blogs brasileiros
Author(s): Dal Molin, Greice Pinho
Advisor: Musse, Soraia Raupp
Publisher: Pontifícia Universidade Católica do Rio Grande do Sul
Graduate Program: Programa de Pós-Graduação em Ciência da Computação
Issue Date: 2019
Keywords: ANÁLISE DO DISCURSO - COMPUTAÇÃO
BANCO DE DADOS
MÍDIA SOCIAL
INFORMÁTICA
Abstract: O uso de mídias sociais está cada vez mais presente em nossas vidas. É através de imagens, textos e vídeos que os seres humanos tentam se comunicar nas redes sociais e expor suas opiniões diante dos acontecimentos cotidianos. Devido ao aumento do volume de dados transmitidos pela internet, torna-se difícil realizar uma análise humana da mídia sem o uso de recursos computacionais. As comunidades científicas, com diversas motivações, tais como: analisar sentimentos em texto, em imagens, detectar opiniões em blogs, dentre outras, sentem-se desafiadas a descobrirem características a serem extraídas desses conteúdos, sendo um exemplo a análise de emoções em blogs. Embora a área de classificação de sentimentos através de textos e imagens esteja em desenvolvimento, ainda existem vários desafios. O principal desafio é construir algoritmos e métodos que possam inferir sentimentos sutis e subjetivos como os humanos os percebem. Neste trabalho é apresentado o corpus Cross-media Brazilian Blog, um conjunto de dados que foi construído com base no BlogSet-BR. Além disso, construiu-se o Ground Truth desses dados (com base nas opiniões de sujeitos) sobre os sentimentos percebidos nos textos e nas imagens destes blogs, que neste trabalho se tornam disponíveis para uso. Algumas tecnologias utilizadas para prever o sentimento em textos e em imagens foram testadas no corpus Cross-media Brazilian Blog e comparadas com o Ground Truth e são apresentadas e discutidas neste trabalho.Em adição às análises realizadas sobre os textos, realizou-se uma pesquisa especificamente sobre posts contraditórios, ou seja, quando a imagem é positiva e o texto é negativo, ou vice-versa, quando presentes no mesmo blog. Resultados indicam que metodologias para detecção de sentimentos em blogs podem ser customizadas para detectar postagens contraditórias e serem capazes de melhor identificar sentimentos nas postagens de mídia social.
The use of social media is increasingly present in our lives. It is through images, texts and videos that humans try to communicate on social networks and expose their opinions in the face of everyday events. Due to the increased volume of data transmitted over the Internet, it is difficult to perform a human analysis of the media without the use of computer resources. Scientific communities, with various motivations, such as: analyzing feelings in text, in images, detecting opinions in blogs, among others, feel challenged to discover characteristics to be extracted from these contents, being an example of the analysis of emotions in blogs. Although the area of classification of feelings through texts and images is under development, there are still several challenges. The main challenge is to build algorithms and methods that can infer subtle and subjective feelings as humans perceive them. This paper presents the corpus Cross-media Brazilian Blog, a dataset that was built based on BlogSet-BR. In addition, it was built the Ground Truth of these data (based on the opinions of subjects) about the feelings perceived in the texts and images of these blogs, which in this work become available for use. Some technologies used to predict sentiment in text and images have been tested in the Cross-Media Brazilian Blog corpus and compared with Ground Truth. In addition to the analyzes performed on the texts, a research was conducted specifically on contradictory posts, i.e. when the image is positive and the text is negative, or vice versa, when present on the same blog. Results indicate that methodologies for detecting feelings in blogs can be customized to detect conflicting posts and be able to better identify feelings in social media posts.
URI: http://hdl.handle.net/10923/16462
Appears in Collections:Dissertação e Tese

Files in This Item:
File Description SizeFormat 
000497191-Texto+completo-0.pdfTexto completo6,35 MBAdobe PDFOpen
View


All Items in PUCRS Repository are protected by copyright, with all rights reserved, and are licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. Read more.