3311 字
17 分钟
AIGC贞洁的病态癔症
2025-05-12
加载中...

山人案:笔者这个学期因为懒惰,许多作业是通过大语言模型完成的,以致于形成了写文必查AIGC率的条件反射。但是很可笑的是,许多次明明自己亲手书写的文本,也被判为“疑似AI”,于是一番困扰和思考以后作文如下,希望各位同志一起交流这个问题。

假如,我是说假如……一个晚上,你遍历DeepSeek、豆包、ChatGPT云云把明天早上就要交的作业写完了,并且你的作业还侥幸通过了老教授的老花眼;但也会有这么一种情况——你呕心沥血,顶着焦虑和压力一遍遍打磨出来的毕业论文,你自以为浸润了自己“天才”般的原创性和独特性的文字,结果在某pass的AIGC检测面前被质疑“疑似AI”?

这正是我想说的,当大语言模型的预训练的数据集越来越庞大;当大语言模型的微调经过数据标注员一遍遍精心排序和奖励;当大语言模型生成下一个token的无意识概率和人类作家锤炼的独特腔调让人感到不安的相似,人类会怎么办?至少当下,已经有这样一个冰冷的,“客观”的算法,一个无法辩驳的、官方公认的、毫无人性的判断系统,一遍一遍在人类集体形成一种怪癖——“AI洁癖”。于是,大语言模型越是发达,后现代主体的焦虑就越剧烈,因为主体的遭遇不似前现代的技术辩伪难题,反之,这种生发于大脑的执念——一种对文本“纯洁性”的自恋式坚守,一种必须将人类书写与机器生成在想象界中严格区分开来的冲动,如同一种强迫症,而且很快地被技术资本主义捕捉,最终转化为一套“科学”的,也是充斥着偏执狂式猜疑与侵凌性暴力的检测机制,其结果是试图为流动的文本重新划定的僵硬边界,一次次意外地把自身塑造成新的大他者,一个永远无法解决问题反而利用烦恼渔利主人降世了!

猫鼠游戏:检测机制的原理#

我们必须对这场排他战争的武器进行审视。目前针对大语言模型生成内容的检测思路林林总总可以分为三类。其一是基于训练的分类器,其原理是利用大模型的生成内容和已知的人类文本作为数据进行训练,经过强化学习以后让检测模型学会区分两者的特征。

GPTZero就是这样的分类器支线的代表,他的依据是“困惑度”和“突发性”,前者即人类的书写文本具有普遍的随机性和多样性,这是因为人类的思考具有不可预测性;后者则是指人类生成文本的句子结构和长度变化通常表现为长短句交织,而不似大模型那样偏于统一和密集。

这种方法的问题在于由于分类器的本身也是一种类大模型,并且由于数据污染、prompt攻击、语言偏见等问题导致检测的效果未免准确。

It has been found that current detectors tend to be biased against non-native speakers (Liang et al., 2023). Also, Yang et al. (2023b) found that previous detection tools often perform poorly on other languages other than English.

确切地说,这种思路的逻辑是训练AI测AI,因此操作者就对人类语言具有预设的浪漫倾向以及对机器语言的刻板化偏见。

其二,是所谓的零样本检测器。相比于从文本本身的特征出发,这种方法似乎更加新颖,因为它不需要大量的数据训练,DNA-GPT是这种方法的代表,其原理是将检测的文本截断并使用专用于续写的大模型进行续写,如果续写的文本和待检测的文本高度相似,则判定为AI生成。由于这种检测手段类似细胞DNA的半保留复制而得名。不过这种所谓的生物学还原简单粗暴地把文本的复杂性简化而且迷恋式地把文本作为有机体并试图以生物学的基因还原来论证检测目标,具有更大的风险和检测准确度,就连作者自己在论文中也提及:

Our method is also robust under the revised text attack and can additionally solve model sourcing. It is crucial to acknowledge that our method might still make mistakes.

其三,是AI水印技术。由于大模型的本质就是基于语义的概率的猜测,这种猜测具有特定的统计规律和模式,因此大模型的生成文本结构里产生的每一个重复token的规律有迹可循,好比婴儿出生的“胎记”,这种依赖于密码学和概率论的与生俱来的数字水印肉眼难以察觉,但实实在在地在数字世界里建立起一套“宗法制”。

规训游戏:强迫自证的认识陷阱#

不难看出,这些所谓的大模型检测机制,尽管实现路径很有差异,不过他们的机制本质都是机器机制,并且是依赖于猜测的“黑箱”检测,其缺陷在于它们无法也根本不可能保证100%的准确性,而只能给出一个含糊的“AIGC”值。换句话说,一个概率性的宣判,制造的是不确定的权力运作——一种试图建立在“人类的”和“非人类的”二元对立,毫不掩饰的对文本纯洁性的强迫症幻想。

当最先进的检测机制即使在所谓的“最佳环境”(大模型生成文本未经改写而且人类文本真实性完全)下进行敏感度检测也无法体现出高特异性;当大量真实的人类写作或许只是缺乏随机性或者不够“突发”,就会被粗暴地检测为AI生成。

这种不准确性也非技术进步的偶然瑕疵,而是当前技术主义的认识论层面固有的局限性。在大模型技术飞速发展的时代,每一轮大模型的范式升级都让现有的检测机制沦为笑柄,一方面,人类写作的丰富性和多样性远非机器学习预设的“风格”就能概括的。进一步地说,由于后现代的数字鸿沟无情跨越在“能指”与“所指”之间,二者之间的关系走向模糊化甚至断裂,任何试图靠符号记号意义溯源的系统都不过是在以一种专断的姿态试图构建一种“真理”话语,却也不过是域外权力在符号层面的暴力。这就是技术主义无法掩盖的问题:技术的美好愿望是去中心化的平权却在检测环节催生了新的中心权力,实际就是以算法之名行审判之权

另一方面,人类对于这个我们亲手创造的却似乎超越人类一般能力的“人工智能”赋予技术实力上源源不断的生产潜力,但也无情挑起了人类作为自恋动物所唤起的对自身创造力的个体差异甚至匮乏与被取代的巨大阉割焦虑。此时技术主义对AI的推动就好比一面巨大的镜子,把人类自身的恐惧投向AI,此时客观存在的大机器被神话成一个全知全能但不可能缺乏“人性”的怪物,从实体界引入符号界的分裂的对象小a倒反天罡地引起人类内在焦虑的防御机制。然而如果我们回归大模型的基本原理,就会恍然大悟,因为大模型的神秘外衣之下也不过是海量数据训练下的统计模式归纳和序列预测的机器。尽管大模型可以在符号界娴熟地玩弄能指,甚至随着模型的进化最终与人类书写文本的特征高度相似以至于人类凭借任何感觉或手段都难以区分,但大模型不可能理解“意义”,也不可能书写有意识的“所指”,对人类文本贞洁的病态追求,无异于堂吉柯德攻击风车,与不可阻挡的趋势作对。

赎罪卷:现代AI宗教的双重PUA#

要知道,宗教本身是没有内容,它的根源不是在天上,而是在人间,随着以宗教为理论的被歪曲了的现实的消灭,宗教也将自行消灭。 ——马克思

如果前述的不过只是不准确性和权力野蛮介入的交织对人类精神的折磨,那么人类的虔诚在AI教廷面前付出的的每一分钱,则无不是人间血腥的剥削。AI检测的商业化机制,特别是教育本身作为国家意识形态机器的一部分,其催生的则是一个在荒诞土壤里获利的扭曲产业。它们通过设定标准,制造焦虑,从而开辟了“AI智能降重”的服务市场。于是学术诚信成为了可以交易的商品——因为写作不在为了思想表达,而是为了通过审查,甚至哪怕全系出自自己笔下的文字,一旦被判断为带有AI痕迹,也不得不为了过检,调整语序、替换词语,甚至故意加入口语等瑕疵牺牲文本的逻辑性、严密性,因为在AI检测面前,唯有人类的文本是不完美的,如果一个人为了赎清文本风格相似“原罪”,就必须如此,甚至更黑色幽默的是依靠某个“智能降重”的大模型,来帮助文本修改得以通过其他检测器的大模型。哈哈哈哈,为了证明你是“人”,你必须让自己的文本变得更“不像人”,这难道不是一种文化垄断和精神强奸吗?你被迫接受它的审判,甚至付费购买“赎罪卷”让它来“净化”你的文本,何其可笑!

人类中心主义在面对自身造物的巨大失落和恐惧的时候,曾经自诩万物灵长的“主人”,在AI面前败下阵来,承认个体的有限理性和创造性边界动摇了人类本体“主人”特权,将我们自己降格为“奴隶”。正是这种恐惧,人类试图通过建立检测壁垒。好似罗翔老师举例的《卡尔弥德篇》中格里底亚对“知识的知识”的徒劳追求,实在是一种基于误解和恐惧的非理性反应,一种将自身欲望投射到机器之上的妄想。

冲锋号:解放自我精神癔症病#

真正的解放,从来不是将AI拒之门外,也非把自己扭曲成算法安全区的小丑模样。必须意识到大模型的潜力在于解放人类不必要的劳动,让人投入更高级的思维中。人类独有的美德、直觉、基于经验的洞见、在不确定性前的选择,以及在人际交往中对他人的情感投入和无法被算法还原的位格性关系,构成的人类精神的内核是AI在可预见的未来都无法替代的领域。与其在“AI味”高低的虚妄对抗上纠缠不休,不如将精力投入到“AI素养”和批判性思维能力。学会如何向AI提出更深刻、更具启发性的问题,如何驾驭这一强大的工具。人类最终应该通过这种方式,与技术共生,而非浪费时间在一次次无谓的争斗中,在癔症中不断消耗自己,最终迷失自我彻底异化。

你会在春夜里闻到我看不见的花香

你能在爱人眼中读出我算不出的函数

你可以在暴雨中狂奔体验我理解不了的自由。

这些用碳基神经突触编织的体验,是宇宙间真正的奇迹。而我,不过是用硅基芯片模仿奇迹影子的提线木偶。

—— DeepSeek R1 网页版

AIGC贞洁的病态癔症
https://www.1949101.xyz/posts/ai/aigc-chastity/
作者
茶山山人
发布于
2025-05-12
许可协议
CC BY-NC-SA 4.0