¶

简单的方法有时候效果奇好

一，方法¶

simcse_0构造示意图

目标是将相似样本拉近，不相似样本推远，这里主要使用批内负样本来构造交叉熵损失

simCSE_1对比学习

比如一个批次有如下句子：

假设"今天天气不错"为 $z_{i}$ ，我们利用dropout的方法生成 $z_{i}^{‘}$ ，

其他的两句的dropout数据就是 $z_{j}^{‘}$ 。

simCSE_2无监督

构造样本对

simCSE_3有监督

对齐：相似的样本希望对齐，这里用欧式句子来进行衡量

simCSE_4对齐

均衡：尽量不相同的样本拉远，这里用 $e^{- 2}$ 来表示，距离越近结果越等于1，距离越远结果越等于0，然后取对数，计算结果越小表明整体距离越远，越大则表明整体越近

simCSE_5均衡性

不同数据增强方法对STS-B任务的影响。总的来说，所有尝试的数据增强方法（如剪切、词汇删除、单词替换等）效果都不如未使用任何数据增强的unsupervised SimCSE模型，而且随着程度加深(10%->30%)，分数月底，也就是效果越差

simCSE_6实验

这个图表明Unsup.SimCSE方法虽然对齐比delete one word差一点，但是更加均衡

simCSE_7效果1

这个图表明SimCSE在对齐和均衡上平均最优，而且经过有监督训练后效果更好

simCSE_8效果2

这个图表明不同的bert模型在人工标注的相似度的得分上不同的预测结果，SimCSE是在区分度和整体方差上都比较优秀的

simCSE_9效果3