要使用 AI 写出比人更好的文字,需要注意以下几点:
我们在使用AI创作时,是以某个模型为基础进行调优的。要写出更好的文字,选好的模型是第一步。模型之间的能力差异非常之大,以至于很多时候对效果的影响是决定性的。如果使用的模型不适合这个任务,怎么调优都很费力,不如干脆换一个更好的直接使用。但是,这就涉及到评估方法。当时我们做了一个评估的测试,实际上,从科研的角度看,评估大模型的metric有很多,比如让大模型做小学数学题(GSM8K),这也是一种著名的评估数据集。这类数据集有固定答案,但写作任务压根没有标答,这在写作任务上就不管用了。从实际角度出发,我们不得不自己去想办法来评估这些模型的能力。这是我们当时的文档标题。在我们的写作课中,学员需要紧密结合大语言模型进行创作,这是一个非常特殊的任务:写作没有标准答案,何况这还是在中文语境下的,涉及人机交互的,具有强烈风格的网络小说类型短故事、短剧剧本创作。挑选模型的第一个重要指标是文风和语言能力:你如果去网上搜“ai味”,会看到大量文章教你怎么克服AI奇怪的文风,比如“首先、其次、再者、引人入胜”这种套话,一看就觉得是ai写的。而且这种ai味很难看,不是很让人有继续阅读的欲望。那么,我们要怎么去除ai味呢?实际上,我认为去除ai味是个伪命题。我们在谈到ai味的时候实际上讲的是GPT味。大家知道,在GPT刚出的时候,为了让模型听得懂人话,要做对齐,OpenAI雇了很多便宜的肯尼亚人给他们做数据标注。我有这样一个不负责任的猜想,这些便宜又可怜的肯尼亚数字劳工在写对齐用数据的时候,肯定写了不少首先、再者、最后这样的文字,说不定还有个文档要求他们这么做。
一位可怜的人大衣被抢走了(见果戈理的《外套》);另一位可怜人被变成了甲壳虫(见卡夫卡的《变形记》):那又怎么样呢?对于这个“怎么样”没有标准的答案。我们可以把故事拆开,找出各个部分如何衔接,结构中的一部分如何呼应另一部分;但是,在你身上必定得有某种细胞,某种基因,某种萌芽的东西因着某种既不可解释又不能置之不理的感觉而振额。美加怜悯—这是我们可以得到的最接近艺术本身的定义。实际上,人们在感受到好文字的时候也许并不会多想,更多的情况是有一种被击中的,头皮发麻的感觉。好的文字引起的实际上是人的生理上的共鸣与情绪。这是一本美国大学心理学教材,《心理学与生活》上的一句话。它说:纵览人类的历史,我们曾无数次受到天敌的攻击,坠入爱河,繁衍子孙,彼此争斗,面对伴侣的不贞以及目睹所爱之人的亡故。因此我们可能会预期,某类情绪反应会出现在人类所有成员身上。实际上,共鸣是文学的基础,有共鸣才有读者,有读者才有了文学。文学映照的是无数年来人类相同的渴望与恐惧,即使是那些已经不再存在于我们生活中的威胁,或者是不再有利于我们生存的因素,仍然能够在今天引发我们普遍的恐惧或者狂喜。人类之间的共性是大于差异的。而对于GPT这样的大语言模型来说,它的预训练数据非常大,大到几乎人类产生的文本数据都要在训练过程中用光的地步。这些数据的量是如此之大,如此之丰富,以至于它储存了人类几乎所有可能的生命经验,也就理应能够学会如何引发人类的共鸣与情绪。AI可以写出好的文字。接下来,我们讲讲比较实际的事:我们到底如何用AI写出比人更好的文字。
鲁迅有一句话:“人类有一个大缺点,就是常常要饥饿”,这些人也是人,肚子会饿。而接下来很有可能没饭吃了。AI目前又没有办法给每个人稳定发钱。旧有的世界正在崩塌,而新的世界却尚未建立,所以他们感到难过。我是一个非常坚定的AGI believer,所以最后是我对AI发展的一些期望和想象。虽然我现在在经过逻辑思考后只能重仓内容创作赛道,但是我认为,也希望这一定不会是一个永久的事情。选择内容创作赛道只是因为AI的能力尚未到达临界点。虚假的AGI是写诗画画,给你女儿起个像样的名字,用符号构建虚假的美好世界让你暂时逃离现实苦难,但逃离后第二天还要继续痛苦。真实的AGI应该做出重大科学发现,治愈疾病,消除饥饿和肥胖,每个月给每个人发几万元,让人类自由从事想做的事。不管是编程还是其他。我希望AI目前能力再进一步,干点实在的,改变每个人的生活,这是我对AI的期许。谢谢大家。总结本文讨论了如何用AI写出比人更好的文字,作者陈财猫从自身经历出发,分享了在AI内容创作领域的思考和实践。关键要点包括: