ImBD(Imitate Before Detect)是复旦大学、华南理工大学、武汉大学、Fenzi AI等推出的用在检测机器修订文本的方法。首先模仿大型语言模型(LLMs)生成文本的风格,基于风格偏好优化(SPO)调整评分模型,让其更符合机器修订文本的特征。然后,利用风格条件概率曲率(Style-CPC)量化原始文本与条件概率采样生成文本之间的对数概率差异,有效区分人类写作和机器修订内容。ImBD在多种场景下表现出色,包括不同LLMs的文本修订、多个文本领域和多种修订类型,显著提高检测性能,且仅需少量数据和较短的训练时间即可达到优越性能。

ImBD – 复旦联合华南理工等机构推出的通用 AI 内容检测器  第1张
(图片来源网络,侵删)
ImBD – 复旦联合华南理工等机构推出的通用 AI 内容检测器  第2张
(图片来源网络,侵删)