以下为您提供关于大模型的相关信息:
大模型的应用: 有一个关于 PPT 翻译的案例,为了提高翻译效率编写了自动翻译脚本。脚本在 Python 环境下运行,前期准备需要根据自身 API 资源提前设置,推荐讯飞大模型,新账户免费送 200 万 tokens,有效期 3 个月。具体操作包括在 https://xinghuo.xfyun.cn/ 首页选择 API 接入,进入控制台创建新项目,按提示领取 200 万 tokens 的礼包,获取对应的 id、apikey、api secret 和接入路径。还需导入依赖,运行 CMD 输入 pip install python-pptx 安装相关组件。
大模型的分类与特点:
大模型的特点包括预训练数据量大(来自互联网,包括论文、代码、公开网页等,通常用 TB 级数据预训练)、参数多(如 Open 在 2020 年发布的 GPT-3 已达 170B 参数)。
大模型在翻译中的提示工程: 在翻译中,提示的文体规范很重要,涵盖语气、语言风格、长度等元素。设定明确的语气能引导大语言模型生成符合情感或专业背景的回答。明确输出的语言和复杂性对于不同专业知识水平的目标受众很关键。
这个故事起源于,我有一个客户,有一天global的老大来开会,喊了微博的销售,会后老外想要一个案例分析,微博也答应了。但是TMD过了一个礼拜,他们给了个中文的案例,说没人翻译...就只好让同事用gpt去翻,但是发现这个PPT碎的令人发指,小朋友翻译翻的绝望了,就想办法写了个自动翻译的脚本。目前测下来整体还可以,虽然性能还不够好(比如有些翻译不是很全,有些本土化的梗无法理解),但整体的效率已经提升很多了。(版本还会有些小更新,改了个名字好找一点~)脚本在Python环境下运行,整体逻辑不复杂,分成几个步骤(如果有大佬有兴趣拆成xml来搞,欢迎交流)[heading2]前期准备[content]因为翻译需要外接API,这里根据自己的API资源提前设置下,推荐讯飞大模型,新账户免费送200万tokens,有效期3个月,很良心~https://xinghuo.xfyun.cn/首页进去选择API接入,然后点服务管理进入控制台创建一个新项目,比如“PPT翻译”,这样你的API只会被这个项目ID调用,避免泄露点进去,找到左边机器翻译的模型按提示来,领一个200万tokens的礼包然后就可以在主控台看到对应的id,apikey,api secret和接入路径了[heading2][heading2]导入依赖[content]大部分都是常用的,只有一个ppt可能需要装运行CMD输入pip install python-pptx,如果还缺的可以按提示安装[heading2]初始化API相关信息和文件路径[content]接着先设置对应的api信息,其他模型可以对应做替换
encoder-only:这些模型通常适用于可以自然语言理解任务,例如分类和情感分析.最知名的代表模型是BERTencoder-decoder:此类模型同时结合了Transformer架构的encoder和decoder来理解和生成内容。该架构的一些用例包括翻译和摘要。encoder-decoder的代表是google的T5decoder-only:此类模型更擅长自然语言生成任务。典型使用包括故事写作和博客生成。这也是我们现在所熟知的众多AI助手的结构我们目前耳熟能详的AI助手基本都来自左侧的灰色分支,当然也包括ChatGPT。这些架构都是根据谷歌2017年发布的论文“attention is all you need”中提出的transformer衍生而来的,在transformer中,包括Encoder,Decoder两个结构目前的大型语言模型就是右侧只使用Decoder的Decoder-only架构的模型大模型又大在哪呢?第一,大模型的预训练数据非常大,这些数据往往来自于互联网上,包括论文,代码,以及可进行爬取的公开网页等等,一般来说,现在最先进的大模型一般都是用TB级别的数据进行预训练。第二,参数非常多,Open在2020年发布的GPT-3就已经达到170B的参数在GPT3中,模型可以根据用户输入的任务描述,或给出详细的例子,完成任务但这与我们熟知的ChatGPT仍然有着很大的差距,使用ChatGPT只需要像和人类一样对话,就可以完成任务。除了形式上的不同之外,还有一个更加重要的差距,那就是安全性上的差别。
想象一下,文体规范就像是向一位技艺高超的厨师下达指令一样。正如您会指定牛排的烹饪程度一样,您也可以指导大语言模型产生您所期望的文本“风味”。文体可以涵盖各种元素,包括语气(正式、非正式)、语言风格(简洁、专业)以及长度(简短、详细)等。例如,当我们这样指定:回复:“在每一个挑战中,我们都能找到共同变强的机会。让我们勇敢地迎接旅程,团结一致,迈向充满成功的未来。记住,团队的力量源于每个成员,每个成员的力量则源于团队。”如果您从提示中移除“长度:短”的限制,结果将明显不同:“独自一人我们能做的很少;团结一心我们能做的很多。让我们共同发挥集体的力量、梦想和抱负。每一个我们面临的挑战,都是一同变得更强的机会。记住,成功不仅仅在于达到顶峰,更在于我们共同经历的旅程和我们建立的深厚情谊。让我们携手前行,共同追求我们的愿景。因为当我们团结一致时,没有什么是不可能的。”[heading2]提示中的语气作用[content]在设计提示时设定明确的语气,可以引导大语言模型生成与您的情感或专业背景一致的回答。示例:在这个示例中,通过指定语气,提示了大语言模型平衡专业信息的传递与通俗易懂,确保内容对听众来说不会显得过于技术性。[heading2]语言和复杂性[content]尤其当您的目标受众在专业知识水平上有很大差异时,明确指定所需输出的语言和复杂性非常关键。这可能意味着根据目标读者的不同,选择使用简单或专业的语言风格。示例:这个提示引导大语言模型使用通俗的语言,使那些没有技术背景的人也能理解复杂的技术概念。