综述:方面级情感分析(三)Aspect
发布时间:2021-11-18 21:17:56
基于方面的情感分析AspectBasedSentimentAnalysis,ABSA[1]是一種細粒度的情感分析任務,旨在識别一條句子中一個指定方面Aspect的情感極性。一個句子中可能含有多個不同的方面,每個方面的情感極性可能不同。基于方面的情感分析有很多實際應用價值,如針對商品評論的基于方面的情感分析可以提取用戶對一個商品不同部分方面的評價,爲廠商進一步改進商品提供更細粒度的參考。
基于方面的情感分析ABSA中的方面Aspect可以指顯式出現在句子中的一個實體Target,Aspectterm或者隐式表達的一個描述事物的角度Aspectcategory。
圖1-ABSA實例一個Aspectterm是句子中的一個詞或詞組,如上圖中的decor和food。句子中針對decor和food這兩個Aspectterm的情感是不同的,AspectTermSentimentAnalysisATSA作爲ABSA的一個子任務,目的是識别句子中一個指定Aspectterm的情感極性,可以建模爲一個分類問題。
一個Aspectcategory是句子中隐式表達的描述事物的一個預先定義的角度。如上圖中的句子從ambience和food這兩個角度來描述一個餐館。Aspectcategory來自一個預先定義好的集合,其不必顯式地出現在句子中。AspectCategorySentimentAnalysisACSA作爲ABSA的另一個子任務,目的是識别句子中一個指定Aspectcategory的情感極性,也可以建模爲一個分類問題。
另外兩個ABSA的子任務分别是AspectTermExtraction和AspectCategoryExtraction。
AspectTermExtraction旨在抽取出一個句子中的Aspectterm,可以建模爲一個序列标注問題。
AspectCategoryExtraction旨在識别出一個句子中從哪些預先定義好的Aspectcategory角度描述事物,可以建模爲一個多标簽分類問題multi-labelclassification。
基于方面的情感分析ABSA主要包括以上四個子任務。
數據集。
目前絕大多數發表在ACL,EMNLP和NAACL上的ABSA相關論文實驗中使用的數據集是SemEval14RestaurantLaptopReview數據集和Twitter數據集。此外,最近公開的MAMS數據集也可以用來做ABSA任務。
SemEval14RestaurantReview數據集中包含ATSA和ACSA兩種版本,共有四千多條數據,分爲訓練集和測試集。ATSA的數據集也可以用來做AspectTermExtraction,ACSA的數據集也可以用來做AspectCategoryExtraction。
SemEval14LaptopReview數據集中隻有ATSA版本,共有三千多條數據,也分爲訓練集和測試集。Laptop數據集相比Restaurant數據集有更多隐式表達情感的樣本,數據量更少,難度更大。
Twitter數據集[2]中隻有ATSA版本,共有六千多條數據,分爲訓練集和測試集。Twitter數據集相比Restaurant數據集和Laptop數據集質量較低。
MAMS數據集中包含ATSA和ACSA兩種版本,共有一萬多條數據。MAMS的特點是,一個句子中一定包含至少兩個Aspect,并且同一個句子中至少有兩個Aspect情感極性是不同的。而Restaurant,Laptop和Twitter這三個數據集中,大多數句子隻包含一個Aspect或者包含多個相同情感的Aspect,這樣會造成基于方面的情感分析任務退化成句子級别的情感分析任務。
基于方面的情感分析的變種。
基于方面的情感分析除了4個子任務外還有兩個變種。
一個是TargetedAspectBasedSentimentAnalysis,結合了ATSA和ACSA,旨在識别句子中針對一個指定實體Target,Aspectterm的一個指定方面Aspectcategory的情感。數據集使用的是SentiHood數據集[3]。
另一個是抽取句子中和一個指定實體相關的情感詞Target-orientedOpinionWordsExtraction,使用的是TOWE數據集[4]。
參考文獻。
[1]TaskDescription:AspectBasedSentimentAnalysisABSA.。
[2]AdaptiveRecursiveNeuralNetworkforTarget-dependentTwitterSentimentClassification.ACL2014.。
[3]Sentihood:Targetedaspectbasedsentimentanalysisdatasetforurbanneighbourhoods.COLING2016.。
[4]Target-orientedOpinionWordsExtractionwithTarget-fusedNeuralSequenceLabeling.NACCL2019.。
基于方面的情感分析ABSA中的方面Aspect可以指顯式出現在句子中的一個實體Target,Aspectterm或者隐式表達的一個描述事物的角度Aspectcategory。
圖1-ABSA實例一個Aspectterm是句子中的一個詞或詞組,如上圖中的decor和food。句子中針對decor和food這兩個Aspectterm的情感是不同的,AspectTermSentimentAnalysisATSA作爲ABSA的一個子任務,目的是識别句子中一個指定Aspectterm的情感極性,可以建模爲一個分類問題。
一個Aspectcategory是句子中隐式表達的描述事物的一個預先定義的角度。如上圖中的句子從ambience和food這兩個角度來描述一個餐館。Aspectcategory來自一個預先定義好的集合,其不必顯式地出現在句子中。AspectCategorySentimentAnalysisACSA作爲ABSA的另一個子任務,目的是識别句子中一個指定Aspectcategory的情感極性,也可以建模爲一個分類問題。
另外兩個ABSA的子任務分别是AspectTermExtraction和AspectCategoryExtraction。
AspectTermExtraction旨在抽取出一個句子中的Aspectterm,可以建模爲一個序列标注問題。
AspectCategoryExtraction旨在識别出一個句子中從哪些預先定義好的Aspectcategory角度描述事物,可以建模爲一個多标簽分類問題multi-labelclassification。
基于方面的情感分析ABSA主要包括以上四個子任務。
數據集。
目前絕大多數發表在ACL,EMNLP和NAACL上的ABSA相關論文實驗中使用的數據集是SemEval14RestaurantLaptopReview數據集和Twitter數據集。此外,最近公開的MAMS數據集也可以用來做ABSA任務。
SemEval14RestaurantReview數據集中包含ATSA和ACSA兩種版本,共有四千多條數據,分爲訓練集和測試集。ATSA的數據集也可以用來做AspectTermExtraction,ACSA的數據集也可以用來做AspectCategoryExtraction。
SemEval14LaptopReview數據集中隻有ATSA版本,共有三千多條數據,也分爲訓練集和測試集。Laptop數據集相比Restaurant數據集有更多隐式表達情感的樣本,數據量更少,難度更大。
Twitter數據集[2]中隻有ATSA版本,共有六千多條數據,分爲訓練集和測試集。Twitter數據集相比Restaurant數據集和Laptop數據集質量較低。
MAMS數據集中包含ATSA和ACSA兩種版本,共有一萬多條數據。MAMS的特點是,一個句子中一定包含至少兩個Aspect,并且同一個句子中至少有兩個Aspect情感極性是不同的。而Restaurant,Laptop和Twitter這三個數據集中,大多數句子隻包含一個Aspect或者包含多個相同情感的Aspect,這樣會造成基于方面的情感分析任務退化成句子級别的情感分析任務。
基于方面的情感分析的變種。
基于方面的情感分析除了4個子任務外還有兩個變種。
一個是TargetedAspectBasedSentimentAnalysis,結合了ATSA和ACSA,旨在識别句子中針對一個指定實體Target,Aspectterm的一個指定方面Aspectcategory的情感。數據集使用的是SentiHood數據集[3]。
另一個是抽取句子中和一個指定實體相關的情感詞Target-orientedOpinionWordsExtraction,使用的是TOWE數據集[4]。
參考文獻。
[1]TaskDescription:AspectBasedSentimentAnalysisABSA.。
[2]AdaptiveRecursiveNeuralNetworkforTarget-dependentTwitterSentimentClassification.ACL2014.。
[3]Sentihood:Targetedaspectbasedsentimentanalysisdatasetforurbanneighbourhoods.COLING2016.。
[4]Target-orientedOpinionWordsExtractionwithTarget-fusedNeuralSequenceLabeling.NACCL2019.。
以上就是綜述:方面級情感分析(三)Aspect的介紹,希望大家喜歡!
基于方面的情感分析AspectBasedSentimentAnalysis,ABSA[1]是一种细粒度的情感分析任务,旨在识别一条句子中一个指定方面Aspect的情感极性。一个句子中可能含有多个不同的方面,每个方面的情感极性可能不同。基于方面的情感分析有很多实际应用价值,如针对商品评论的基于方面的情感分析可以提取用户对一个商品不同部分方面的评价,为厂商进一步改进商品提供更细粒度的参考。
基于方面的情感分析ABSA中的方面Aspect可以指显式出现在句子中的一个实体Target,Aspectterm或者隐式表达的一个描述事物的角度Aspectcategory。
图1-ABSA实例一个Aspectterm是句子中的一个词或词组,如上图中的decor和food。句子中针对decor和food这两个Aspectterm的情感是不同的,AspectTermSentimentAnalysisATSA作为ABSA的一个子任务,目的是识别句子中一个指定Aspectterm的情感极性,可以建模为一个分类问题。
一个Aspectcategory是句子中隐式表达的描述事物的一个预先定义的角度。如上图中的句子从ambience和food这两个角度来描述一个餐馆。Aspectcategory来自一个预先定义好的集合,其不必显式地出现在句子中。AspectCategorySentimentAnalysisACSA作为ABSA的另一个子任务,目的是识别句子中一个指定Aspectcategory的情感极性,也可以建模为一个分类问题。
另外两个ABSA的子任务分别是AspectTermExtraction和AspectCategoryExtraction。
AspectTermExtraction旨在抽取出一个句子中的Aspectterm,可以建模为一个序列标注问题。
AspectCategoryExtraction旨在识别出一个句子中从哪些预先定义好的Aspectcategory角度描述事物,可以建模为一个多标签分类问题multi-labelclassification。
基于方面的情感分析ABSA主要包括以上四个子任务。
数据集。
目前绝大多数发表在ACL,EMNLP和NAACL上的ABSA相关论文实验中使用的数据集是SemEval14RestaurantLaptopReview数据集和Twitter数据集。此外,最近公开的MAMS数据集也可以用来做ABSA任务。
SemEval14RestaurantReview数据集中包含ATSA和ACSA两种版本,共有四千多条数据,分为训练集和测试集。ATSA的数据集也可以用来做AspectTermExtraction,ACSA的数据集也可以用来做AspectCategoryExtraction。
SemEval14LaptopReview数据集中只有ATSA版本,共有三千多条数据,也分为训练集和测试集。Laptop数据集相比Restaurant数据集有更多隐式表达情感的样本,数据量更少,难度更大。
Twitter数据集[2]中只有ATSA版本,共有六千多条数据,分为训练集和测试集。Twitter数据集相比Restaurant数据集和Laptop数据集质量较低。
MAMS数据集中包含ATSA和ACSA两种版本,共有一万多条数据。MAMS的特点是,一个句子中一定包含至少两个Aspect,并且同一个句子中至少有两个Aspect情感极性是不同的。而Restaurant,Laptop和Twitter这三个数据集中,大多数句子只包含一个Aspect或者包含多个相同情感的Aspect,这样会造成基于方面的情感分析任务退化成句子级别的情感分析任务。
基于方面的情感分析的变种。
基于方面的情感分析除了4个子任务外还有两个变种。
一个是TargetedAspectBasedSentimentAnalysis,结合了ATSA和ACSA,旨在识别句子中针对一个指定实体Target,Aspectterm的一个指定方面Aspectcategory的情感。数据集使用的是SentiHood数据集[3]。
另一个是抽取句子中和一个指定实体相关的情感词Target-orientedOpinionWordsExtraction,使用的是TOWE数据集[4]。
参考文献。
[1]TaskDescription:AspectBasedSentimentAnalysisABSA.。
[2]AdaptiveRecursiveNeuralNetworkforTarget-dependentTwitterSentimentClassification.ACL2014.。
[3]Sentihood:Targetedaspectbasedsentimentanalysisdatasetforurbanneighbourhoods.COLING2016.。
[4]Target-orientedOpinionWordsExtractionwithTarget-fusedNeuralSequenceLabeling.NACCL2019.。
基于方面的情感分析ABSA中的方面Aspect可以指显式出现在句子中的一个实体Target,Aspectterm或者隐式表达的一个描述事物的角度Aspectcategory。
图1-ABSA实例一个Aspectterm是句子中的一个词或词组,如上图中的decor和food。句子中针对decor和food这两个Aspectterm的情感是不同的,AspectTermSentimentAnalysisATSA作为ABSA的一个子任务,目的是识别句子中一个指定Aspectterm的情感极性,可以建模为一个分类问题。
一个Aspectcategory是句子中隐式表达的描述事物的一个预先定义的角度。如上图中的句子从ambience和food这两个角度来描述一个餐馆。Aspectcategory来自一个预先定义好的集合,其不必显式地出现在句子中。AspectCategorySentimentAnalysisACSA作为ABSA的另一个子任务,目的是识别句子中一个指定Aspectcategory的情感极性,也可以建模为一个分类问题。
另外两个ABSA的子任务分别是AspectTermExtraction和AspectCategoryExtraction。
AspectTermExtraction旨在抽取出一个句子中的Aspectterm,可以建模为一个序列标注问题。
AspectCategoryExtraction旨在识别出一个句子中从哪些预先定义好的Aspectcategory角度描述事物,可以建模为一个多标签分类问题multi-labelclassification。
基于方面的情感分析ABSA主要包括以上四个子任务。
数据集。
目前绝大多数发表在ACL,EMNLP和NAACL上的ABSA相关论文实验中使用的数据集是SemEval14RestaurantLaptopReview数据集和Twitter数据集。此外,最近公开的MAMS数据集也可以用来做ABSA任务。
SemEval14RestaurantReview数据集中包含ATSA和ACSA两种版本,共有四千多条数据,分为训练集和测试集。ATSA的数据集也可以用来做AspectTermExtraction,ACSA的数据集也可以用来做AspectCategoryExtraction。
SemEval14LaptopReview数据集中只有ATSA版本,共有三千多条数据,也分为训练集和测试集。Laptop数据集相比Restaurant数据集有更多隐式表达情感的样本,数据量更少,难度更大。
Twitter数据集[2]中只有ATSA版本,共有六千多条数据,分为训练集和测试集。Twitter数据集相比Restaurant数据集和Laptop数据集质量较低。
MAMS数据集中包含ATSA和ACSA两种版本,共有一万多条数据。MAMS的特点是,一个句子中一定包含至少两个Aspect,并且同一个句子中至少有两个Aspect情感极性是不同的。而Restaurant,Laptop和Twitter这三个数据集中,大多数句子只包含一个Aspect或者包含多个相同情感的Aspect,这样会造成基于方面的情感分析任务退化成句子级别的情感分析任务。
基于方面的情感分析的变种。
基于方面的情感分析除了4个子任务外还有两个变种。
一个是TargetedAspectBasedSentimentAnalysis,结合了ATSA和ACSA,旨在识别句子中针对一个指定实体Target,Aspectterm的一个指定方面Aspectcategory的情感。数据集使用的是SentiHood数据集[3]。
另一个是抽取句子中和一个指定实体相关的情感词Target-orientedOpinionWordsExtraction,使用的是TOWE数据集[4]。
参考文献。
[1]TaskDescription:AspectBasedSentimentAnalysisABSA.。
[2]AdaptiveRecursiveNeuralNetworkforTarget-dependentTwitterSentimentClassification.ACL2014.。
[3]Sentihood:Targetedaspectbasedsentimentanalysisdatasetforurbanneighbourhoods.COLING2016.。
[4]Target-orientedOpinionWordsExtractionwithTarget-fusedNeuralSequenceLabeling.NACCL2019.。
以上就是综述:方面级情感分析(三)Aspect的介绍,希望大家喜欢!
我在向你倾诉你却依然东流去潺潺的水声是我的悲伤流水能带走什么我应该忘记什么垂柳轻拂流水荡漾吹皱了孤单的身影岸边青翠的春草摇曳着往事是你和我的故事...[全文阅读]
——致我们这样可爱的青春青春就是这样如树叶间的阳光落在脸上微微的痒青春就是这样如午后的太阳雨溢在掌心淡淡的香青春就是这样如夏暮的虫鸣散在苇旁轻轻的响青...[全文阅读]
整理了31句有关回忆过去的句子,喜欢自取。1.当初的誓言太完美,像落花满天飞,让相思变成灰。2.那只是一段浅浅的过往,却不知觉地凝成了悲伤,随着夏末的风,吹痛了我干涸已...[全文阅读]
描写兴趣广泛的,我想写小说,人物描写总觉得不够饱满,然后语言总感觉词不达意,有什么方法吗?
这也是有技巧的。一个人物,你觉得不够饱满,这个很大原因是你过于平铺直叙了,就是你直接就开始正面描写这个人了,这样肯定不饱满。就是你是在写一个简单的产品说明书,过...[全文阅读]
《九月》。——海子。目击众神死亡的草原上野花一片。远在远方的风比远方更远。我的琴声呜咽泪水全无。我把这远方的远归还草原。一个叫木头一个叫马尾。我的琴声...[全文阅读]
1、皇家气派余惊叹,文物古迹旷世鲜。2、金碧辉煌紫禁城,红墙宫里万重门。3、人与春风齐焕发,红墙绿树景长新。4、帝苑豪华造,皇家气派倾。5、人民真伟大,建筑好传...[全文阅读]
本文标题:综述:方面级情感分析(三)Aspect