@张逸勤《基于生成式大语言模型的非遗文本嵌套命名实体识别研究》

摘要

摘 要:
[目的/意义] 本研究探索生成式大语言模型在非物质文化遗产文本嵌套命名实体识别中的应用,以提高特定领域复杂文本中多层次实体的识别精度。
[方法/过程] 研究对比了 GPT-4、Claude 3.5Sonnet、ChatGLM2-6b 等多种生成式大语言模型与 BERT+GlobalPointer 基线模型的性能,并设计了思维链与行为推理模式两种提示工程技术以优化模型复杂上下文中的识别能力。
[结果/结论] GPT-4 模型采用行为推理模式时表现最佳,Qwen2-72B 模型达到 91.16%的最高 F1 值,展现出优异的领域适应性。研究验证了生成式大语言模型在非遗文本嵌套实体识别中的应用潜力,然而在处理长文本和复杂嵌套结构时仍存在计算资源需求高、推理速度慢等挑战。未来研究将通过混合模型或多任务学习框架,融合 BERT 模型的稳定性与生成式大语言模型的灵活性以提升识别性能。

1 引言

本文的主要贡献在于:
①探究一种基于生成式大语言模型的有效识别嵌套实体的新方法:利用生成式大语言模型的强大语义理解能力,有效处理复杂的嵌套命名实体识别问题,显著提高了识别的准确性和鲁棒性;
提示工程设计了思维链(Chain of Thought,CoT)与行为推理模式(Reason-Act,ReAct):引入思维链(CoT)和行为推理模式(ReAct),通过逐步推理和行动反馈,增强模型在复杂上下文中的决策能力,使得识别结果更为精确;
③在非物质文化遗产文本数据集上进行实验评估:本文验证了生成式大语言模型应用于非遗文本嵌套实体识别任务的可行性,通过在非遗领域语料库上进行实证研究,验证了模型的优越性能,展示了其在实际应用中的潜力。

2 相关工作

近年来,国内学者针对非遗文本的实体识别问题开展了一系列研究,并取得了一定成果。在方法层面,研究主要集中于深度学习模型的应用:

知识组织层面,范青等运用RDF三元组描述框架,系统化实现非遗知识的识别、抽取与表示,为区域性非遗知识库建设奠定基础。

现有挑战
尽管取得上述进展,现有研究多聚焦于单层实体识别简单关系抽取,在处理非遗文本特有的嵌套实体结构时仍面临困难。传统深度学习方法难以有效捕捉实体间的层次关系,导致在复杂文本中出现信息损失识别偏差

3 方法

4 实验

5 结果与讨论

Pasted image 20250325135301.png

Pasted image 20250325135706.png

实验结果

结果讨论
数据需求与迁移能力

领域适应性

模型稳定性与结果一致性