視覺中國網站正式恢復上線,情感分析概述

麥丁網 2019-08-28 16:41 閱讀70次

從自然語言處理技術的角度來看,情感分析的任務是從評論的文本中提取出評論的實體,以及評論者對該實體所表達的情感傾向,自然語言所有的核心技術問題。因此,情感分析被認為是一個自然語言處理的子任務。

視覺中國網站正式恢復上線,情感分析概述

情感分析概述

與其他的人工智能技術相比,情感分析(Sentiment Analysis)顯得有些特殊,因為其他的領域都是根據客觀的數據來進行分析和預測,但情感分析則帶有強烈的個人主觀因素。情感分析的目標是從文本中分析出人們對于實體及其屬性所表達的情感傾向以及觀點,這項技術最早的研究始于2003年Nasukawa和Yi兩位學者的關于商品評論的論文。

隨著推特等社交媒體以及電商平臺的發展而產生大量帶有觀點的內容,給情感分析提供了所需的數據基礎。時至今日,情感識別已經在多個領域被廣泛的應用。

例如:

在商品零售領域,用戶的評價對于零售商和生產商都是非常重要的反饋信息,通過對海量用戶的評價進行情感分析,可以量化用戶對產品及其競品的褒貶程度,從而了解用戶對于產品的訴求以及自己產品與競品的對比優劣。

在社會輿情領域,通過分析大眾對于社會熱點事件的點評可以有效的掌握輿論的走向。

在企業輿情方面,利用情感分析可以快速了解社會對企業的評價,為企業的戰略規劃提供決策依據,提升企業在市場中的競爭力。

在金融交易領域,分析交易者對于股票及其他金融衍生品的態度,為行情交易提供輔助依據。

目前,絕大多數的人工智能開放平臺都具備情感分析的能力,如圖所示:是玻森中文語義開放平臺的情感分析功能演示,可以看出除了通用領域的情感分析外,還有汽車、廚具、餐飲、新聞和微博幾個特定領域的分析。

人工智能技術應用:情感分析概述

玻森中文語義開放平臺的情感分析示例

那么到底什么是情感分析呢?

從自然語言處理技術的角度來看,情感分析的任務是從評論的文本中提取出評論的實體,以及評論者對該實體所表達的情感傾向,自然語言所有的核心技術問題,例如:詞匯語義,指代消解,此役小氣,信息抽取,語義分析等都會在情感分析中用到。

因此,情感分析被認為是一個自然語言處理的子任務,我們可以將人們對于某個實體目標的情感統一用一個五元組的格式來表示:(e,a,s,h,t)

e表示情感分析的目標實體,可以是一個具體的實例,也可以是一個類,但必須是唯一的對象。

a表示實體e中一個觀點具體評價的屬性。

s表示對實體e的a屬性的觀點中所包含的情感,通常來講會分為正向褒義、負向貶義和中性三種分類。也可以通過回歸算法轉化為1星到5星的評價等級。

h是情感觀點的持有者,有可能是評價者本人,也有可能是其他人。

t是觀點發布的時間。

以圖為例,e是指某餐廳,a為該餐廳的性價比屬性,s是對該餐廳的性價比表示了褒義的評價,h為發表評論者本人,t是19年7月27日。所以這條評論的情感分析可以表示為五元組(某餐廳,性價比,正向褒義,評論者,19年7月27日)。

人工智能技術應用:情感分析概述

用戶對某餐廳的評價

情感分析根據處理文本顆粒度的不同,大致可以分為三個級別的任務,分別是篇章級、句子級和屬性級。

我們分別來看一下:

1. 篇章級情感分析

篇章級情感分析的目標是判斷整篇文檔表達的是褒義還是貶義的情感,例如一篇書評,或者對某一個熱點時事新聞發表的評論,只要待分析的文本超過了一句話的范疇,即可視為是篇章級的情感分析。

對于篇章級的情感分析而言有一個前提假設,那就是全篇章所表達的觀點僅針對一個單獨的實體e,且只包含一個觀點持有者h的觀點。

這種做法將整個文檔視為一個整體,不對篇章中包含的具體實體和實體屬性進行研究,使得篇章級的情感分析在實際應用中比較局限,無法對一段文本中的多個實體進行單獨分析,對于文本中多個觀點持有者的觀點也無法辨別。

例如評價的文本是:“我覺得這款手機很棒。”

評價者表達的是對手機整體的褒義評價,但如果是:“我覺得這款手機拍照功能很不錯,但信號不是很好”這樣的句子,在同一個評論中出現了褒義詞又出現了貶義詞,篇章級的分析是無法分辨出來的,只能將其作為一個整體進行分析。

上一篇:江蘇發展大會,電商、科普、社交......“短視頻+”未來將成為常
下一篇:谷歌終止與華為合作,誓言樹情感:深耕情感咨詢領域 砥礪前行