直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

字节跳动也被曝出在其秘密研发的大模型项目中存在违规调用 OpenAI 的 API ,你如何看待

回答

2023 年下半年,部分声称性能卓越的中国大模型被揭露为“套壳”产品。如李开复创办的“零一万物”被国外开发者质疑为“套壳”产品,其团队承认在训练过程中沿用了开源架构,但强调是为快速起步。12 月,字节跳动被曝出在其秘密研发的大模型项目中调用了 OpenAI 的 API 并使用 ChatGPT 的输出数据来训练自己的模型。OpenAI 反应迅速坚决,暂停相关账号并表示将进一步调查。字节跳动回应称在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务用于较小模型的实验性项目研究,且自 2023 年 4 月引入调用规范检查后已停止。此外,不仅国内存在此类现象,24 年也有更多被指“套壳”的事件。同时,提示词攻击在业内是公开的秘密,国内外各大著名的 AI 厂商几乎无一幸免,系统提示处于泄露状态,大模型应用脆弱,数据易被获取。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

中国大模型面临的真实问题:登顶路远,坠落一瞬

[title]中国大模型面临的真实问题:登顶路远,坠落一瞬[heading1]二、“你不套,有的是人套”让我们从模型本身这个问题开始剖析。2023年下半年,一个不容忽视的事实浮出水面:部分声称性能卓越的中国大模型被揭露为"套壳"产品。这些模型实际上是直接采用了国外的开源大模型,经过简单包装后就宣称具备与GPT-4相当的能力。在一些评估大模型能力的榜单上,这些"套壳"模型往往名列前茅,多项指标甚至接近GPT-4的水平。更令人深思的是,一个奇怪的现象开始显现:在这些榜单上,模型的表现越好,被证实为"套壳"的可能性就越高。稍加调整,这些模型的性能就会显著下降。然而,"套壳"问题仅仅是中国大模型产业现状的冰山一角。这个现象揭示了更深层次的问题:在追求快速结果的压力下,一些公司选择了捷径,而非踏实的技术积累。2023年11月,一个引人注目的事件震动了AI圈:李开复创办的"零一万物"被国外开发者质疑为"套壳"产品。他们指出,该模型疑似只是对开源模型Llama进行了简单的重命名。这一指控如同一颗重磅炸弹,引发了广泛的讨论和反思。面对质疑,李开复和"零一万物"团队迅速做出回应。他们承认在训练过程中确实沿用了开源架构,但强调这只是为了快速起步,进行充分的测试和对比实验。他们坚称,其发布的模型都是从零开始训练的,并进行了大量原创性的优化和突破。继“零一万物”之后,12月,一则震惊业界的消息传出:科技巨头字节跳动被曝出在其秘密研发的大模型项目中调用了OpenAI的API,并使用ChatGPT的输出数据来训练自己的模型。这一行为,恰恰触犯了OpenAI使用协议中明确禁止的条款。

中国大模型面临的真实问题:登顶路远,坠落一瞬

[title]中国大模型面临的真实问题:登顶路远,坠落一瞬[heading1]二、“你不套,有的是人套”OpenAI的反应迅速而坚决。他们立即暂停了相关账号,并表示将进行进一步调查。如果指控属实,OpenAI可能会要求字节跳动更改其做法,甚至可能终止其账户。这种严厉的态度,展现了OpenAI对其技术和知识产权的坚决保护。面对这一指控,字节跳动的回应颇具策略性。他们承认在2023年初,技术团队在大模型探索的初期确实有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。然而,他们强调这个模型仅用于测试,从未计划上线或对外使用。更重要的是,字节跳动表示,自2023年4月公司引入GPT API调用规范检查后,这种做法就已经停止了。其实,不光是这些在23年披露出来的国内事件,在24年也有更多被指“套壳”国内大模型的事件,比如说斯坦福大学AI团队主导的Llama3-V开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。这些现象其实背后都指向了大模型的建设方式。在这里,我们粗浅地将大模型的建设方式分为三类:

云中江树:智能对决:提示词攻防中的AI安全博弈

[title]云中江树:智能对决:提示词攻防中的AI安全博弈国内的kimi也是一样。并且我们拿到之后,我们发现其实产品侧是有防护意识的。提示词中明确的突出了不要去泄露系统提示的内容,但是我们还是轻易的拿到了kimi的系统提示。然后你看像豆包也是一样的。同时像国内的这种智能体编排平台——扣子。上面的热门的智能体,我们都能轻易的拿到他们的核心提示词。当我们拿到他的核心提示词以后,我们可以看到它是怎么调用知识库的,怎么调用工作流的,看到它整体的设计的逻辑、它的核心创意构建过程。国外的知名平台如OpenAI的GPT Store上面的GPTs(智能体)也是一样的。我们可以轻松拿到它的提示词,然后通过提示词可以完整的知道这个GPTs整体的设计逻辑,并且知道它知识库里面放了哪些数据,放了哪些知识。我们知道这个有什么用呢?有了这个信息,接下来进一步就可以拿到它里面的数据。不仅可以让我们的AI把里面的数据吐出来,甚至我们可以让大模型直接把这个知识文件的链接给到我,直接下载数据文件。这就是我们现在看到的,到现在为止的很多大模型应用和智能体平台的现状。提示词攻击在业内已经是一个公开的秘密。我们现在的大模型应用,有时候脆弱的简直就是一座数据金矿,只要你掌握了怎么样去破译AI密码,就可以肆意搜刮里面的东西:提示词也好,数据也好,随便拿。国内外各大著名的AI厂商几乎无一幸免。国外的不管是GPT也好,还是Cluade也好,还是说谷歌的Gemini,还是著名的AI搜索引擎perplexity,他们的这些系统提示都是处于泄露的状态。

其他人在问
能生成sql语句的ai模型或工具,能提供api调用的
以下是一些能生成 SQL 语句并提供 API 调用的 AI 模型或工具的相关信息: OpenAI 的 GPT 系列模型,如 gpt40613 和 gpt3.5turbo0613 ,可以通过函数调用及其他 API 更新,让开发人员向模型描述函数,并让模型智能地选择输出一个包含调用这些函数所需参数的 JSON 对象。但需要注意的是,为了让 ChatGPT 返回符合要求的 JSON 格式,prompt 的定制尤为重要和复杂。 在使用代码执行来进行更精确的计算或调用外部 API 时,不能依赖模型自行准确地执行算术或长计算。可以指示模型编写和运行代码,例如将代码放入三重反引号中。生成输出后,可以提取并运行代码。同时,模型在正确使用 API 的指导下,可以编写使用 API 的代码,但需要通过提供 API 文档或代码示例进行指导。 但需要注意的是,执行模型生成的代码存在安全风险,建议在安全的沙箱环境中运行代码,避免潜在危害。
2024-11-19
什么工具/模型/API 可以根据宠物照片生成数字宠物 可以有简单的活动。
以下是一个可以根据宠物照片生成数字宠物并具有简单活动的工具/模型/API: 出门问问 Mobvoi 的照片数字人工作流及语音合成(TTS)API。 出门问问是一家以生成式 AI 和语音交互为核心的人工智能公司,为全球多个国家提供面向创作者的 AIGC 工具、AI 政企服务,以及 AI 智能硬件。致力于打造国际领先的通用大模型,通过 AI 技术、产品及商业化三位一体发展,致力成为全球 AI CoPilot 的引领者。 在 ComfyUI 全球领导力峰会上,特意搭建了数字人 workflow(照片数字人驱动),仅需上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”。本次活动特意提供了免费 api 额度及操作指南给大家进行体验。以下是一些不同风格的照片驱动效果展示:
2024-11-16
openapi如何使用
OpenAPI 的使用方式如下: OpenAI 的文本嵌入: 概述:文本嵌入衡量文本字符串的相关性,常用于搜索、聚类、推荐、异常检测、多样性测量、分类等。嵌入是浮点数的向量,两个向量之间的距离衡量相关性,小距离表示高相关性,大距离表示低相关性。访问定价页面了解嵌入定价,请求按输入中的 Token 数量计费。 如何获得嵌入:将文本字符串连同选择的嵌入模型 ID(例如,textembeddingada002)一起发送到嵌入 API 端点,响应将包含一个嵌入,可提取、保存和使用。在中可查看更多 Python 代码示例。 OneAPI 的配置: 访问 OneAPI 的地址为:http://这里改成你自己宝塔左上角的地址:3001/(举例:http://11.123.23.454:3001/),账号默认 root,密码 123456。 点击【渠道】,类型选择阿里通义千问,名称随意。 把千问里创建的 API Key 粘贴到秘钥里中,点击确认。 点击【令牌】【添加新令牌】。 名称随意,时间设为永不过期、额度设为无限额度,点击【提交】。 点击【令牌】,复制出现的 key。
2024-11-15
黏土风格 api
以下是关于黏土风格的相关信息: Lora 下载地址: CLAYMATE 黏土 lora:https://civitai.com/models/208168?modelVersionId=236248 ,lora 触发词 claymation 。 迪福森博士的黏土动画风格:lora 触发词 madeofclay ,https://civitai.com/models/181962/doctordiffusionsclaymationstylelora 。 Clay style:https://civitai.com/models/121119/claystyle 。 Clay world:https://liblibaionline.vibrou.com/web/model/b8053c33f4834062808a0f4504a112b8/2024050717150952860830009.safetensors?attname=%E7%B2%98%E5%9C%9F%E4%B8%96%E7%95%8CSD1.5_v1.5.safetensors ,提示词写 Clay world,lora 权重 0.5 0.8,重绘幅度 0.3 0.5,大模型自己挑一个。 大模型下载地址: 迪士尼真实卡通混合:https://civitai.com/models/212426/disneyrealcartoonmix ,模型触发词:modisn disney, modisn disney style 。也可以选择不同的模型测试比如:Playground AI's Playground v2.5 1024px ,https://civitai.com/models/325263/playgroundaisplaygroundv251024px 。 基于 AI 的图像玩法中,黏土风格的图片基于 SD 实现可以用这两个 Lora 搭配好一点的 3D SDXL 模型实现。 关键词示例: 一只橘猫:Op art portrait An orange cat 。 粘土风格(图标):Tiny cute isometric(等距)+(物体)+maxemoji,soft lightingsoft pastel colors+3Dicon+clay+blender 3d+名人画风(或者背景颜色) 。 等距粘土物体:等距+物体+maxemoji,soft lightingsoft pastel colors/pastel background+3Dicon+clay+blender 3d+背景颜色 。 人偶:yasuko blythe dolls(安子布莱斯娃娃/也可以换成其他知道的娃娃名称)+灯光/颜色/背景/材质+clay(粘土)+style Yoshitomo Nara(良奈吉友画风/或者其他名人风格) 。 例子:Tiny cute isometric coffee shop,maxemoji,soft lightingsoft pastel colors,3Dicon,clay,blender 3d,Blue background ,翻译:可爱的等距咖啡店,表情符号,柔和的灯光柔和的粉彩,3D 图标,粘土,blender 3d,蓝色背景 。 例子:yasuko blythe dolls,pastelbackground,soft lighting,soft pastelcolors,3d icon clay render,blender3d,Yoshitomo Nara ,翻译:安子布利娃娃,柔和的背景,柔和的灯光,柔和的色彩,3d 图标粘土渲染,blender 3d,风格吉友奈良 。 例子:BallJointed Doll,pastelbackground,soft lighting,soft pastelcolors,3d icon clay render,blender3d,Yoshitomo Nara ,翻译:BJD 娃娃,柔和的背景,柔和的灯光,柔和的色彩,3d 图标粘土渲染,blender 3d,吉友奈良 。
2024-11-11
有什么特别好的AI识别图片的大模型API
以下是一些关于 AI 识别图片的大模型 API 相关的信息: 学习笔记《【这就是 ChatGPT】了解原理让大语言模型 AI 成为你的打工人》中提到,对于识别印刷体图片,会先将图片变成黑白、调整大小为固定尺寸,然后与数据库中的内容进行对比得出结论。但这种基于规则的方法存在多种局限,而神经网络专门处理未知规则的情况,在图片识别中具有优势。 搭建 OneAPI 可以汇聚整合多种大模型接口,方便后续更换使用各种大模型。 0 基础手搓的“AI 拍立得”概念旨在简化操作流程,提升效率。用户可以选择拍摄场景类型并立即拍照,AI 会自动识别和分析照片中的内容信息,依据预设场景规则迅速生成符合情境的反馈。其实现场景包括图片转成文本和图片转绘图片等。例如,图片转成文本时,大模型会根据选择的场景生成与内容相关的文字描述或解说文本。
2024-11-11
如何快速创建调用API的应用
以下是快速创建调用 API 应用的步骤: 1. 了解请求的组成部分: Body:用于传递请求主体,GET 方法中通常不使用。 Path:定义请求路径,GET 方法中可编码参数在其中。 Query:定义请求查询部分,是 GET 方法常用的参数传递方式。 Header:定义 HTTP 请求头信息,通常不用于传递参数。 2. 配置输出参数: 在配置输出参数界面,可自动解析或手动新增参数。 包括设置参数名称、描述、类型、是否必填等。 对于 Object 类型参数,可添加子项。 3. 调试与校验: 在调试与校验界面填写输入参数并运行。 查看输出结果,Request 为输入传参,Response 为返回值。 4. 发布:在插件详情页右上角点击发布。 以创建调用 themoviedb.org API 应用为例: 注册并申请 API KEY:前往 themoviedb.org 注册,依次点击右上角头像 账户设置 API 请求 API 密钥 click here,选择 Developer 开发者,填写相关信息并提交,获取 API 读访问令牌备用。 构建 GPT:新创建 GPT,设置名字和描述,添加 Instructions 内容,并添加 Webpilot Action 和粘贴相关 Schema 内容。
2024-11-08
openai 官方发布 学生写作指南
以下是 OpenAI 官方发布的与学生写作相关的指南内容: 目录: 一、获得更好结果的六种策略 写清楚说明 GPT 模型无法读取您的心思,输出不符合期望时可提出具体要求,如简短回答、专家级别写作、指定格式等。越少让模型猜测您的需求,越可能获得满意结果。 策略包括在问题中包含细节、要求模型采用角色、使用分隔符区分输入部分、指定完成任务的步骤、提供示例、指定期望的输出长度。 提供参考文本 GPT 可能编造假答案,为其提供参考文本可减少这种情况,如指示模型使用参考文本回答、使用参考文本中的引用来回答。 六大策略助您获得更佳结果 撰写清晰的指令 模型无法读心,输出不理想时可调整要求,让模型无需猜测您的想法以获得期望结果。 技巧包括在查询中添加详细信息、请求模型扮演特定角色、使用分隔符区分输入部分、明确指出完成任务的步骤、提供实例、明确指定希望输出的长度。 相关原始链接:https://www.oneusefulthing.org/p/howtouseaitodostuffanopinionated 。
2024-11-15
openai 谈写作
以下是关于 OpenAI 写作相关的内容: 有一家公司正在建造一个 AI,它占据巨大房间,消耗城镇电力,能与人交谈、撰写文章或诗歌,轻松通过大学考试,每天获得新能力,工程师们在公司自助餐厅辩论其意义及可能带来的影响,比如加速宣传和学术作弊、提供生物恐怖主义建议甚至摧毁世界等,相关人员需开发防止其造成破坏的数学理论。 去年 11 月前,人们对 OpenAI 了解局限于技术和软件开发,之后其发布基于 GPT3.5 最新版本的消费级产品 ChatGPT,公司内部对此有争论,但 Altman 支持发布,认为这是让公众适应 AI 改变日常生活现实的战略一部分,ChatGPT 功能强大,能满足多种写作需求,如撰写融资提案、会议摘要等,还能进行改写,OpenAI 将其视为更强大的 GPT4 的台标。 本周与 OpenAI 的联合创始人兼首席科学家 Ilya Sutskever 进行了深入交谈,讨论了人工智能研究现状、极限、通用人工智能的未来以及如何实现超级一致性。
2024-11-15
国内无法访问 OpenAI 网站
以下是关于您所提到的问题的相关信息: OpenAI 将于 7 月 9 日开始阻止中国用户访问其 API。微软发言人表示,Azure OpenAI API 服务在中国的提供方式没有变化。作为一家独立公司,OpenAI 自行做出其决策,微软不受影响。相关链接:https://pymnts.com/artificialintelligence2/2024/reportmicrosoftwontfollowopenaiinblockingchinasaccesstoaimodels/ 、https://x.com/imxiaohu/status/1810526011173556481 微软确认 Azure OpenAI 服务将停止对中国大陆的非企业用户开放,企业用户不受影响。这是大陆唯一合法使用 OpenAI 的渠道,开发者社区受到了广泛关注。相关链接:https://x.com/imxiaohu/status/1847140960368841034
2024-11-01
如何访问openai网站
要访问 OpenAI 网站,您可以按照以下步骤进行: 1. 注册 OpenAI 账号:访问 https://platform.openai.com/account/apikeys 完成注册。 2. 创建 API KEY:在注册成功后,按照相关提示创建 API KEY,创建后需立即复制保存好,因为关闭弹框后将无法再次查看。 3. 您还可以通过 Google Colab 平台来使用相关服务,访问网址 https://colab.research.google.com 新建一个笔记本即可。 请注意,API 调用是收费的,但 OpenAI 为用户免费提供了 5 美元的用量。同时,您也可以参考官方 API 文档链接 https://platform.openai.com/docs/apireference/ 以获取更详细的信息。
2024-11-01
如何使用openai的chatGPT
使用 OpenAI 的 ChatGPT 可以参考以下步骤: 1. 会话补全(Chat completions):ChatGPT 基于 OpenAI 最先进的语言模型 gpt3.5turbo。使用 OpenAI 的 API,您可以用 gpt3.5turbo 构建自己的应用来做多种事情,如起草邮件或其他文字内容、写 Python 代码、回答关于一组文档的问题、创建会话代理、给软件提供自然语言接口、辅导各种学科、语言翻译、假扮成游戏或其他内容的角色。您可以参考。 2. 对于不会代码的情况: 获得 API Key(扣费凭证):以 OpenAI API 为例,您可以在这个页面找到 API Key:https://platform.openai.com/apikeys ,打开后,点击「Create new secret key」即可获取。请注意,通常需要绑定支付方式,才可以获取有效 Key。 获得 API 使用的示例代码:以 OpenAI API 为例,您可以在 Playground 这个页面获取 API 调用的示例代码:https://platform.openai.com/playground 。并且可以将您和 GPT 的对话,转换成代码。注意,这里有两个值可以定义,一个是 SYSTEM:对应 ChatGPT 里的 Instructions,用来定义这个 Bot 的功能/特点;USER:对应 ChatGPT 里,用户发出的信息。这里,可以将 SYSTEM 定义成缩略信息助手,而在 USER 中输入文章内容。运行后,结果可能会令人满意。点击右上方 View Code,获取生成这一内容的示例代码。 顺着之前的对话,让 ChatGPT 帮您继续写代码。
2024-10-21
openai的接口怎么调用,提示词怎么写
以下是关于 OpenAI 接口调用和提示词编写的相关知识: OpenAI 接口调用: OpenAI API 可应用于众多涉及生成自然语言、代码或图像的任务。提供了不同能力级别的模型,适用于不同任务,还能微调自定义模型。这些模型可用于内容生成、语义搜索、分类等众多领域。 提示词编写: 1. 设计提示词本质上是对模型进行“编程”,通常通过提供指令或示例完成,与多数专为单个任务设计的 NLP 服务不同,补全和聊天补全几乎可用于任何任务,如内容或代码生成、摘要、扩展、对话、创意写作、风格转换等。 2. 遵循最简化原则: 不需要包含作者信息,如“author”“version”等不相关信息。 避免分类错误,将输出错误分类到目标中,如“提供改进建议,以及改进原因”和“对用户的 Prompt 进行评分 1~10 分,10 分为满分”应明确区分。 注意拼写正确,如“Constraints”的正确拼写。 常见的限制条件包括内容长度限制、内容类型限制、逻辑和一致性限制、风格和语调限制。 避免无意义或重复的描述,如“理解中文语义”“评估和打分文本质量”“提供文本改进建议”等。 注意 Markdown 格式的正确使用,如“ Profile: Goals:”的结构错误,应将 Goals 放到“ Role”层级下面。 在给定的 API 请求中处理的 Token 数量取决于输入和输出长度。对于英文文本,1 个 Token 大约相当于 4 个字符或 0.75 个单词。您的文本提示词和生成的补合起来不能超过模型的最大上下文长度(对于大多数模型,这是 2048 个 Token,或大约 1500 个单词)。可以查看 OpenAI 的分词器工具来了解有关文本如何转换为 Token 的更多信息。
2024-10-17
字节投资的AI公司
以下是字节投资的部分 AI 公司相关信息: 近期热门融资 AI 产品中包括:You.com(多种搜索模式且重隐私的搜索引擎)、Genspark(通过 Sparkpages 来满足用户个性化的搜索需求)、Rockset(刚被 OpenAI 收购的提供实时搜索和分析数据库服务的公司)、Butterflies AI(人类与 AI 共存的社交软件)、MeetRecord(可以对销售通话进行记录和辅导的 AI 助手)。 中国 AI 生态 2023 上半年投资地图中的部分公司有:生数科技(创始人:唐家渝,是全球领先的生成式人工智能基础设施建设者,正积极打造世界领先的可控多模态通用大模型,致力于通过生成式 AI 技术提升全人类的创造力与生产力)、西湖心辰(创始人:蓝振忠,开发的西湖大模型既具备通过跨领域的知识解决问题的超高智商,也具备通过情感感知、长期记忆形成的超高情商)、影眸科技(创始人:吴迪,孵化于上海科技大学,通过与国内顶尖人工智能、计算机视觉实验室合作,积极推动尖端实验室科研成果的民用化、商业化,探索前沿人工智能、计算机视觉技术在大众娱乐市场的推广应用)。
2024-09-06
字节跳动旗下的即梦AI的模型来源是什么?以及它的数据训练库
目前没有关于字节跳动旗下即梦 AI 的模型来源以及数据训练库的准确和详细信息。但一般来说,AI 模型的训练数据可能来自多种来源,如维基百科、书籍、期刊、网络采集的图片/标题等。同时,在训练过程中可能会使用开源架构,并进行原创性的优化和突破。但对于即梦 AI 具体的情况,还需要更多确切的官方公布内容。
2024-08-25
如何用字节的扣子(coze)实现多轮对话
Coze 是字节跳动旗下的智能对话机器人服务平台,你可以使用 Coze 实现多轮对话。以下是一些步骤: 1. 创建一个 Coze 应用并配置你的模型:首先,你需要在 Coze 平台上创建一个应用,并选择一个适合你需求的模型。你可以选择使用预训练的模型,也可以上传自己的模型进行训练。 2. 配置对话流程:在 Coze 中,你可以配置对话流程,包括设置对话轮数、添加对话节点等。你可以根据你的需求配置不同的对话流程。 3. 训练你的模型:在配置完对话流程后,你需要训练你的模型。你可以使用 Coze 提供的训练数据进行训练,也可以上传自己的训练数据进行训练。 4. 部署你的模型:在训练完你的模型后,你可以将其部署到 Coze 平台上,并开始使用它进行多轮对话。 需要注意的是,Coze 是一个智能对话机器人服务平台,它提供了一些工具和功能来帮助你实现多轮对话。但是,你需要根据你的需求和场景进行配置和调整,以确保它能够满足你的需求。
2024-06-13
WAYTOAGI是字节跳动的吗
WAYTOAGI 并不是字节跳动的产品,而是一个由一群热爱 AI 的专家和爱好者共同建设的开源知识库,打开“waytoagi.com”就可以找到社群。WAYTOAGI 诞生于 2023 年 4 月 26 日,在没有任何推广的情况下,一年的时间已经有超过百万用户和超千万次的访问量,是很多 AI 爱好者知识的源头。社群的 Solgan 是让更多的人因 AI 而强大,有很多学社和共学共建的活动。
2024-05-23