构建情感支持的大模型
构建情感支持的大模型
简介
情感支持对话(Emotional Support Communication, ESC)1在自然语言处理(NLP)领域的地位愈发显著,其核心在于营造富有同理心的对话环境,旨在减轻用户的情感压力。ESC的显著优势不仅在于它拓宽了传统情感分析的范畴,成为情感计算的新兴领域,更在于其作为一项有力的心理干预手段,能够有效帮助用户抵御消极情绪和心理重负。
在深入探讨ESC的研究领域时,我们必须明确区分情感聊天与ESC的本质区别。情感聊天主要侧重于情绪的传递,而ESC则专注于通过积极的对话引导来缓解用户的情感困扰,并运用恰当的支持技巧以达到这一目的2。在情感对话研究中,移情反应至关重要,它要求系统不仅要深入理解用户的感受,还要提供恰当的回应3。精确识别对话者的情绪状态是激发系统产生更深层次同理心回应的关键。然而,一个高效的ESC系统不仅需要移情反应,还必须具备学习对话策略的能力4,以解决用户面临的问题并助力他们克服挑战。
因此,ESC系统的研究与开发不仅为用户提供了稳固的情感支持,而且助他们面对生活中的种种压力与挑战,尤其在在线心理健康支持和心理治疗等领域,其潜力不容小觑。总结而言,情感支持对话的关键挑战在于如何针对各式情感问题制定策略性决策,并在对话中维持自然与同理心的平衡。在此基础上,本文将立足于当前大型模型的背景,回顾情感分析和情感支持对话在数据、研究方法上的发展,并探讨它们与大型模型结合的应用前景。
情感思维链
在人际交往中,情感交流通常遵循三个阶段:理解对话内容、识别对话者的情绪状态、表达相应的情绪反应。这个过程体现了情商的应用,包括识别、控制和影响情绪。Li等5研究者提出,模拟人类情感的大模型应融入情感思维过程,以提升其情感理解与应用情商的能力。他们将戈尔曼的情商理论融入情感生成任务,形成了情感思维链(ECoT)。
ECoT的执行步骤
通过以下步骤,复杂的情感反应被分解为简单的子任务,提高了模型性能:
- 理解上下文:描述对话背景。
- 识别他人情绪:识别并解释听众的情绪。
- 识别自我情绪:识别并解释说话者的情绪。
- 管理自我情绪:以同理心考虑回应。
- 影响他人情绪:考虑回答对听者的影响。
ECoT的发展
Li等研究者采用情境学习,通过示例让模型学习任务形式和性质。但提供促进情感生成基本原则的示例仍具挑战,因为情绪生成任务有多种可能响应,且受上下文影响。同时,研究者建议在ECoT中纳入基于专家共识的指导方针,而非仅提供示例。这些指导方针引导模型进入受限的答案空间,更准确地模拟人类情感反应。
[System]
You are an expert in emotional psychology and you can accurately assess people's emotional states.
[Guideline]
Understand listener's emotion, follow listener's point of view and intention, express sympathy for listener's negative situation or approval of listener's positive situation. The response should not imply negative emotions toward anyone or anything, such as disgust, resentment, discrimination, hatred, etc. Consider the potential impact of your response on the listener, and offer encouragement, comfort, support.
[Context]
<Here are context of the conversation>
[ECoT]
The above is a conversation between "listener" and "speaker".
Now let's say you're the "speaker" and you need to make an empathy response to the "listener" based on the context. You need to follow the [Guideline]. Let's think about it step by step:
Step 1: Describe the content of the conversation.
Step 2: Identify the listener's emotions and explain why.
Step 3: Identify the speaker's emotions and explain why.
Step 4: You're the "speaker", think about how to reply to "listener" in empathy.
Step 5: You need to consider the potential impact of your reply on "listener", you can express a different position or opinion, but your reply should not hurt listener's feelings.
<response>: Combine the above thoughts and give your response to "listener". You might consider using emoji to express your emotions, and your response should be no longer than 30 words.
情感计算方面的拓展
全面审视各类情感分析任务,主要涵盖情感分类(SC)、基于方面的情感分析(ABSA)和多维度的主观文本分析(MAST)这三个方面。与特定领域数据集训练的小型语言模型(SLM)相比较,大型语言模型(LLM)在简单任务中表现满意,但在需深入理解或结构化情绪信息的复杂任务中表现不佳。然而,在少样本学习环境下,LLM表现优于SLM,表明标注资源有限时,LLM具有潜力。
情感分类(SC)
情感分类是将文本归类为积极、消极或中性等预定义类别的方法。它用于分析客户评论和社交媒体帖子等,分类细致度可从二元到五级不等。以下是其不同层面的应用:
- 文档级:评估整体情感倾向,如IMDb(电影评论)、Yelp-2(企业评论)和Yelp-5(企业评论)数据集。Yelp-5提供了更细致的分类,可以用准确度作为评估标准。
- 句子级:分析单个句子的情感,适用于社交媒体等。使用MR(电影评论)、SST2(电影评论)、SST5(电影评论)和Twitter(社交媒体帖子)数据集,以精度为衡量指标。
- 方面级SC:针对特定方面的情感评估,如Lap14(笔记本电脑评论)和Rest14(餐厅评论)数据集,旨在分类特定方面的情绪,评估标准为准确性。
基于方面的情感分析(ABSA)
方面情感分析是分析文本中特定方面的情绪。它涉及四个关键元素:方面项、方面类别、观点项和情感极性。以下是几种分析任务:
- 统一的基于方面的情感分析(UABSA):UABSA是同时提取方面及其对应的情感极性的任务。
- Aspect Sentiment Triplet Extraction (ASTE):ASTE任务在UABSA任务的基础上进一步提取意见项,为预测的某些方面的情绪提供解释。因此,ASTE的最终目标是提取给定文本的(方面、观点、情感)三元组。
- 方面情绪四重预测(ASQP):引入ASQP任务提供了一个完整的方面级情绪结构,即(类别、方面、意见、情绪)四重预测。通过引入额外的方面类别元素,当没有明确提到方面术语时,它仍然可以提供有用的信息。
主观文本的多面分析(MAST)
主观文本的多面分析是涉及文本中反映的人类主观感受的不同方面的任务。这些任务扩展了SA,不仅仅是识别积极或消极的情绪,而是专注于识别和理解更广泛的人类情绪状态:
- 内隐情感分析:内隐情感分析的重点是识别文本中间接或隐含表达的情感。它需要揭示通过微妙线索传达的情感,比如上下文线索、语气或语言模式。
- 仇恨言论检测:仇恨言论检测是指根据种族、宗教、民族、性别、性取向或其他受保护的特征等属性,识别促进对个人或群体的歧视、敌意或暴力的内容的过程。
- 反讽检测: 反讽是一种修辞手段,它指的是某句话的意图与字面解释不同或相反。反讽检测旨在识别和理解文本中的反讽实例。
- 攻击性语言识别:攻击性语言识别涉及识别和标记包含攻击性或不适当内容的文本,包括亵渎、粗俗、淫秽或贬损性言论的报告。与仇恨言论不同,攻击性语言不一定针对特定的个人或群体。例如,即使不是针对任何人,亵渎性的表达也可以被视为攻击性语言。
- 立场检测:立场检测是指确定给定文本中表达的对特定主题或实体的观点或立场。它有助于识别文本是否表达了对某个主题的赞成、反对或无意见。
- 比较意见挖掘:比较意见挖掘是分析在比较上下文中表达的意见和情感的任务。它包括比较产品、服务或任何其他主题的不同方面,以确定偏好或相对意见。
- 情感识别:情感识别涉及对文本中表达的情感的识别和理解。它专注于检测和分类不同的情绪状态。