利用大模型构建情感支持对话的数据集
利用大模型构建情感支持对话的数据集
在当前的研究中,情感支持对话的数据集大多源自在线平台,如涉及压力管理的Twitter对话、关注心理健康的Reddit论坛,以及各类在线支持小组。这些数据虽易于获取,但通常表现为异步交流,且仅限于单次互动。与此形成对比的是,Liu等研究者1通过问卷调查的方式,推出了ESConv数据集,该数据集侧重于数据的质感和多回合对话的连贯性。尽管ESConv数据集在质量上有所提升,但其局限性亦显而易见,主要体现在数据集的规模适中,以及策略注释和场景多样性的不足,这些问题可能是由于数据编译过程中的高昂成本所造成的。
Zheng等研究者2充分利用了大型语言模型的能力,提出了一种创新的方法,将人类的洞察力与LLMs的计算能力相结合,以策划一个全面的情感支持对话数据集。一系列精心设计的对话,这些对话覆盖了多样化的场景,并作为数据集生成的种子。借助ChatGPT的上下文学习能力们递归地扩展了这个数据集,创建了一个名为ExTES的可扩展情感支持对话数据集。
ExTES的构建为我们提供了宝贵的启示。下面将从以下几个角度探讨ExTES是如何构建一个情感支持对话的数据集:
数据集的广度
ExTES数据集涵盖的所有36个情感支持场景的统计数据,具体如下表:
情景编号 | 情景描述 | 情景编号 | 情景描述 |
---|---|---|---|
1 | 分手或离婚 | 19 | 导航性别认同和过渡 |
2 | 冲突或沟通问题 | 20 | 搬到新的城市或国家 |
3 | 沟通挑战 | 21 | 职业转型 |
4 | 应对所爱之人的死亡 | 22 | 为人父母和育儿挑战 |
5 | 处理宠物死亡 | 23 | 自尊心低或缺乏自信 |
6 | 与工作相关的压力和倦怠 | 24 | 身体形象问题和饮食失调 |
7 | 财务担忧和不确定的未来 | 25 | LGBTQ+身份 |
8 | 失业相关压力 | 26 | 文化认同和归属感 |
9 | 学业压力 | 27 | 学术压力或压力 |
10 | 灵性和信仰 | 28 | 失业或职业挫折 |
11 | 管理双相情感障碍 | 29 | 育儿挑战和父母内疚 |
12 | 焦虑和恐慌 | 30 | 兄弟姐妹间的竞争或家庭冲突 |
13 | 抑郁和低落情绪 | 31 | 从身体或情感虐待中幸存和恢复 |
14 | 适应新工作或角色 | 32 | 从性侵犯或家庭暴力中康复 |
15 | 慢性病或疼痛管理 | 33 | 创伤后应激障碍 |
16 | 应对诊断或医疗治疗 | 34 | 从虐待中康复 |
17 | 照顾者支持 | 35 | 上瘾和康复 |
18 | 寻找生活的意义和目标 | 36 | 对所爱之人或朋友的的支持 |
数据集的深度
有必要区分情感聊天和情感支持(ES)。除了共情响应,情感支持对话还需要对话策略学习能力,解决用户的问题,并提供应对困难的帮助。换句话说,情感支持对话的关键挑战是为处理各种情感问题做出战略决策。ExTES数据集中提供了不同的策略,具体如下表:
策略缩写 | 策略描述 | 策略示例 |
---|---|---|
RS | 反思性陈述(Reflective Statement): 重复或改写用户已经表达的内容,以表明你在积极倾听。 | 用户:“我必须要做的所有工作都让我感到不堪重负。” 助理:“听起来你对自己的工作量感到不堪重负。” |
Cla | 澄清(Clarification): 寻求澄清,以确保清楚地了解用户的情绪和体验。 | 用户:“我就是摆脱不了这种悲伤的感觉。” 助理:“你能帮我理解一下是什么引发了这种悲伤的感觉吗?” |
EV | 情感验证(Emotional Validation): 不加评判地承认并验证用户的情绪。 | 用户:“我对自己再次犯同样的错误感到非常沮丧。” 助理:“感到沮丧是可以理解的,犯错是人之常情。” |
ES | 移情陈述(Empathetic Statement): 表达对用户体验的理解和同理心。 | 用户:“我现在真的在与我的自信作斗争。” 助理:“我可以想象在影响你自信的情况下导航是多么具有挑战性。” |
Aff | 肯定(Affirmation): 提供积极的强化和鼓励,以提升用户的精神。 | 用户:“我觉得自己不够好。” 助理:“你已经取得了很多成就,你的能力不言自明。不要低估你的能力。” |
OH | 提供希望(Offering Hope): 分享乐观的观点或可能性来灌输希望。 | 用户:“我不知道情况是否会好转。” 助理:“记住,变化是不变的,总是有成长和积极变化的机会。” |
AJC | 避免评判和批评(Avoiding Judgment and Criticism): 为用户创造一个非评判性的安全空间来表达他们的情绪,而不必担心批评。 | 用户:“我为请假关注自己的心理健康感到很内疚。” 助理:“照顾好自己的心理健康很重要,这没什么好内疚的。你的健康应该永远是优先考虑的,我很高兴你认识到这一点。在这段时间里,我能做些什么来支持你吗?” |
SO | 建议选项(Suggesting Options): 为解决手头的问题提供切实可行的建议或不同的观点。 | 用户:“我在管理压力方面有困难。” 助理:“你有没有考虑过尝试一些放松技巧,比如深呼吸或正念练习?” |
CP | 协同规划(Collaborative Planning): 与用户一起制定行动计划。 | 用户:“我想提高我的时间管理技能。” 助理:“我们一起集思广益吧。把任务分成更小、更容易处理的部分怎么样?” |
PDP | 提供不同的视角(Providing a Different Perspective): 提供不同的方式来看待情况,以帮助用户获得新的见解。 | 用户:“我的项目没有成功,我很沮丧。” 助理:“有时候挫折会带来意想不到的学习和成长机会。这是一个重新评估和再次尝试的机会。” |
RNT | 重新构建消极思想(Reframing Negative Thoughts): 帮助用户将消极思想重新构建为更积极或更现实的思想。 | 用户:“我真是个失败者。” 助理:“不要那样想,让我们把重点放在你从这次经历中学到了什么,以及你如何把它应用到未来。” |
SI | 分享信息(Sharing Information): 提供有关情绪、应对机制或自我保健实践的教育或事实信息。 | 用户:“我正在努力控制自己的焦虑。” 助理:“你知道深呼吸练习和接地技巧可以帮助减轻焦虑症状吗?你想让我解释一下如何练习吗?” |
NE | 使经验正常化(Normalization of Experience): 解释某些情绪或反应是常见的,是人类经验的一部分。 | 用户:“我为花时间给自己而感到内疚。” 助理:“对自我照顾感到内疚是很常见的,但这对你的健康至关重要。记住,你也应该优先考虑自己的需求。” |
PSP | 促进自我保健实践(Promoting Self-Care Practices): 提倡参与促进健康和自我照顾的活动。 | 助理:“一定要给自己留点时间,做一些能给你带来快乐和放松的事情。” |
SM | 压力管理(Stress Management): 为压力管理技巧提供建议,如锻炼、冥想或花时间在大自然中。 | 助理:“定期参加体育活动可以帮助减轻压力,改善情绪。” |
Other | 其他(Other): 与他人友好地打招呼,采用其他的支持性技巧,这些都不在前面提到的类别中。 | 助理:“你好,我很高兴能在这里帮助你。告诉我,今天我能为你做些什么?” |
数据集的生成
身份: |
参考
- [1] [arxiv](https://arxiv.org/abs/2106.01144) - [2] [arxiv](https://arxiv.org/abs/2308.11584)本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 FanzhBill的计算机学习博客!