@向量诗学 古诗对仗检测Vector Poetics:Parallel Couplet Detection

摘要

This paper explores computational approaches for detecting parallelism in classical Chinese poetry, a rhetorical device where two verses mirror each other in syntax, meaning, tone, and rhythm. We experiment with fve classifcation methods: (1) verb position matching, (2) integrated semantic, syntactic, and wordsegmentation analysis, (3) difference-based character embeddings, (4) structured examples (inner/outer couplets), and (5) GPT-guided classifcation. We use a manually annotated dataset, containing 6,125 pentasyllabic couplets, to evaluate performance. The results indicate that parallelism detection poses a signifcant challenge even for powerful LLMs such as GPT-4o, with the highest F1 score below 0.72. Nevertheless, each method contributes valuable insights into the art of parallelism in Chinese poetry, suggesting a new understanding of parallelism as a verbal expression of principal components in a culturally defned vector space.
本研究探讨了使用计算方法来检测古典汉诗中的对仗结构,这是一种修辞手法,两行诗句在语法、意义、语调和节奏上相互呼应。我们实验了五种分类方法:(1) 动词位置匹配,(2) 综合语义、语法和分词分析,(3) 基于字符嵌入的差异,(4) 结构化示例(内外对联),(5) 基于GPT的分类。我们使用了一个包含6,125对五言对联的手动标注数据集来评估性能。结果表明,即使对于强大的大型语言模型如GPT-4o,对仗检测仍然是一个巨大的挑战,最高F1分数低于0.72。尽管如此,每种方法都为理解汉诗中的对仗艺术提供了宝贵的见解,提出了一种将对仗视为文化定义的向量空间中主要成分的言语表达的新理解。

相关工作

研究方法

数据集

实验方法

结果

Pasted image 20250311144803.png

GPT引导的评估不会显著优于更传统的方法
由于模型是非确定性的,在某些情况下,GPT-4o生成了两个矛盾的解释。最常见的错误发生在模型不知道如何解析诗句时。
基于动词的方法在动词不存在或不是对仗结构的核心时难以处理诗句,从而导致了错误分类。
综合方法仍然严重依赖训练数据的可用性和质量,并且来自各个模型的复合错误导致了许多错误分类。
最后,尽管结构化示例方法应该受益于唐代以后格律诗在规定位置包含对仗的这一事实,但我们在现有数据集中发现了许多例外,特别是来自不太为人所知的诗人的诗句,这些诗句不符合严格的正式规则。

讨论

对仗和主观性

在我们对对仗对联的评估中,很明显对仗的概念并不总是二元的——许多对联并不简单地属于“对仗”或“非对仗”类别。相反,对仗经常在一个连续统上表现出来。

向量诗学

Pasted image 20250311145702.png
“向量诗学”的概念代表了这个项目探索的一个有前景的方向,灵感来自自然语言处理的基础工作。我们建议这种类比可以有用地扩展到平行对联中的词组或整行诗句。这将将诗歌对仗重新解释为文化维度的表现,在这些维度中,两件事物被(主观地)感知为相同或相反。

# 以"季节-生命"维度为例的向量运算
spring = model.encode("春")
life = model.encode("生")
death = model.encode("死")
autumn = model.encode("秋")

# 验证向量关系
pred_autumn = spring - life + death
cos_sim = cosine_similarity(pred_autumn, autumn)  # 可达0.87

局限性

尽管本研究取得了进展,但仍存在一些局限性。传统汉诗,特别是古典时期的汉诗,遵循严格的平仄交替模式,这些音调模式对于汉诗的美学和节奏质量至关重要,但我们目前的计算模型无法分析音调特征。此外,我们的方法忽视了汉字的古代发音,这对于理解文本的原始语音环境和押韵方案至关重要。最后,我们研究中使用的预训练SikuBERT模型相对较小;更大的模型可能会产生更好的性能。