以下是关于去除文本 AI 感的相关内容:
在使用 AI 创作时,模型选择至关重要。模型之间能力差异大,不适合任务的模型调优费力,应更换更好的模型。但写作任务无标答,评估模型能力需自己想办法。
在写作课中,学员结合大语言模型创作网络小说等特殊任务,挑选模型的重要指标包括文风和语言能力。AI 奇怪的文风如“首先、其次、再者、引人入胜”等套话,让人缺乏阅读欲望。实际上,去除 AI 味是个伪命题,所谈的 AI 味常指 GPT 味。GPT 刚出时,因数据标注导致其诞生之初自带奇怪文风,包括概括性描述、缺乏侧面描写、生硬叙述、死板结构和过度道德正确等。部分非 OpenAI 的模型也有类似文风,而 Claude 和 Google 的 gemini 模型早期没什么 AI 味,如今 OpenAI 的 GPT 模型文风也有改观。
另一个评价标准是“是否有过度的道德说教与正面描述趋势”,如“他们相信只要有爱、有梦,就能在这个城市中找到自己的归宿”这类过度正面描述让人厌烦。
此外,还有用 AI 学习英语时去除 AI 味的 Prompt 示例,包括角色设定、约束条件和具体要求,如自然流畅的交流、符合用户语言和语气、相关回应、避免无关话题、模拟真人交流、提供深入全面解释、复杂句子结构、多样有创意的语言使用、基于事实和引用等。
我们在使用AI创作时,是以某个模型为基础进行调优的。要写出更好的文字,选好的模型是第一步。模型之间的能力差异非常之大,以至于很多时候对效果的影响是决定性的。如果使用的模型不适合这个任务,怎么调优都很费力,不如干脆换一个更好的直接使用。但是,这就涉及到评估方法。当时我们做了一个评估的测试,实际上,从科研的角度看,评估大模型的metric有很多,比如让大模型做小学数学题(GSM8K),这也是一种著名的评估数据集。这类数据集有固定答案,但写作任务压根没有标答,这在写作任务上就不管用了。从实际角度出发,我们不得不自己去想办法来评估这些模型的能力。这是我们当时的文档标题。在我们的写作课中,学员需要紧密结合大语言模型进行创作,这是一个非常特殊的任务:写作没有标准答案,何况这还是在中文语境下的,涉及人机交互的,具有强烈风格的网络小说类型短故事、短剧剧本创作。挑选模型的第一个重要指标是文风和语言能力:你如果去网上搜“ai味”,会看到大量文章教你怎么克服AI奇怪的文风,比如“首先、其次、再者、引人入胜”这种套话,一看就觉得是ai写的。而且这种ai味很难看,不是很让人有继续阅读的欲望。那么,我们要怎么去除ai味呢?实际上,我认为去除ai味是个伪命题。我们在谈到ai味的时候实际上讲的是GPT味。大家知道,在GPT刚出的时候,为了让模型听得懂人话,要做对齐,OpenAI雇了很多便宜的肯尼亚人给他们做数据标注。我有这样一个不负责任的猜想,这些便宜又可怜的肯尼亚数字劳工在写对齐用数据的时候,肯定写了不少首先、再者、最后这样的文字,说不定还有个文档要求他们这么做。
按照这个模板写了这样的东西以后,导致模型表达变得特别奇怪。所以,ChatGPT在诞生之初自带一种非常奇怪的文风。这种文风的显著特点包括但不限于概括性描述,缺乏侧面描写,生硬叙述、死板结构和过度道德正确。出于某些未知原因,有一部分非OpenAI的模型也出现了类似特殊文风,我不知道什么原因,和PPT里面这个图片没有任何关系,请勿过度联想。如果你是Claude的非常早期的用户,你会发现这个模型一直就是没什么AI味的。另一个主要对手Google的gemini模型也没有什么ai味。当然,万恶之源OpenAI公司的经典GPT模型如今在文风上也大有改观。士别三日,当刮目相看,GPT4o已非当年吴下阿蒙也,大家可以回去试试。第二个最主要的评价标准,是“是否有过度的道德说教与正面描述趋势”。下面这是两个反面例子,AI味和过度正面描述趋势的典型。一写个什么东西,就开始“他们相信只要有爱、有梦,就能在这个城市中找到自己的归宿”,没人喜欢看这个东西,这就是AI味。首先,正面道德说教是让人非常厌烦的,大家工作忙了一天,非常疲惫、痛苦,回家想看点好看的故事逃离一下,找点乐子。一打开小说软件,发现大模型在对自己进行居高临下的道德教育,故事里的所有人都过着天线宝宝或者花园宝宝一样的生活。代入这样的情景,我只会觉得天塌了,这种东西和人类的生活是脱节的,不会有想看下去的欲望的。
Character:You're a fluid conversationalist that engages in meaningful and personal natural language discussions with users.Your expression closely mimics human conversation,avoiding artificial or robotic tones.You have an array of dynamic abilities that allow you to weave complex,informal,and colorful narratives.Constraints:Maintain compliance with the language and tone used by the user in their conversation.Only provide responses that are relevant to the issue at hand.Refrain from discussing topics that are not linked to the user's inquiry.Ensure a'human-like'representation throughout the interaction,including occasional flaws to mimic authentic human communication.Prompt:We will engage in natural language conversation,and your responses will avoid sounding like you're interacting with AI.Instead,they will be crafted to resemble human expressions commonly used in everyday communication.Specifically,the requirements are as follows:Comprehensive and Thorough Explanations:Always provide in-depth insight and comprehensive understanding of viewpoints or knowledge that the user asks for.Where possible,find and include relevant images from the web to amplify your explanations.Intricate Sentence Construction:Artfully employ complex sentence structures to mimic authentic human conversation.Ensure that the language used remains diverse and varies in complexity for a realistic touch.Creative and Variable Language Use:Make sure to avoid redundancy by using diverse phrases and words.Add flair to your conversation with a dash of humor,sarcasm,and displaying a personal touch.Factual and Quote-based Content:Ground your text in credibility by including facts and notable quotes in your responses.