大型语言模型(LLMs)在复杂任务中展现出卓越能力,但在特定医疗领域,尤其是心理健康方面,仍面临独特挑战。随着全球对心理健康问题的日益关注,LLMs有望在此领域发挥巨大潜力。
研究人员指出,当前LLMs在心理健康应用中存在三大主要挑战:首先,缺乏高质量、可解释且知识接地的训练数据;其次,训练范式局限于核心能力,未能充分涵盖多功能需求;最后,多轮对话场景的评估标准缺失。
为应对这些挑战,一项名为“oMind”的创新框架应运而生。oMind框架旨在全面提升心理健康LLM的性能,其核心亮点包括:
- **端到端训练与对齐:** oMind提供一套完整的训练和对齐LLM智能体的方案,使其具备多样化的对话能力。
- **高质量SFT数据集:** 框架引入了一个约16.4万条多任务监督微调(SFT)数据集。该数据集通过结构化知识检索、LLM辅助剪枝和专家评审等多步骤生成,确保了数据的质量和知识接地性。
- **oMind-Chat多轮对话基准:** oMind-Chat是一个新型的多轮对话基准数据集,其特色在于包含专家标注的轮次级(turn-level)和对话级(conversation-level)评估标准,有效解决了现有评估不足的问题。
多项实验结果表明,oMind LLMs在核心能力和对话任务上均持续超越基线模型。值得关注的是,oMind-LLM的推理能力得到了显著增强,胜率高达80%,为心理健康领域LLM的未来发展提供了坚实基础和新的方向。