@半监督神经原始语言重构Semisupervised Neural Proto-Language Reconstruction

摘要


1 引言

2 方法

2.1 模型

image

2.2 半监督策略

2.3 实验

Pasted image 20250320151214.png

3 结果

Pasted image 20250320152445.png


4 分析

4.1 DPD训练

作者进行了一项消融实验,移除了CRINGE损失,并保持其他超参数和模型初始化不变,以观察其对训练的影响。

4.2 后代预测性能

4.3 学习到的音素表示

Pasted image 20250320155756.png
使用Ward方差最小化算法(一种层次聚类方法)分析音素嵌入的层次组织。图4展示了两种语言(法语和粤语)的音素组织结果,比较了DPD-based模型(如GRU-DPD-BST和TransDPD-ΠM-BST)与非DPD模型(如GRU-BST和Trans-ΠM-BST)。

4.4 未标记数据消融

4.5 监督重构应用

5 相关工作

6 结论

局限性