直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

字节跳动也被曝出在其秘密研发的大模型项目中存在违规调用 OpenAI 的 API ,你如何看待

回答

2023 年下半年,部分声称性能卓越的中国大模型被揭露为“套壳”产品。如李开复创办的“零一万物”被国外开发者质疑为“套壳”产品,其团队承认在训练过程中沿用了开源架构,但强调是为快速起步。12 月,字节跳动被曝出在其秘密研发的大模型项目中调用了 OpenAI 的 API 并使用 ChatGPT 的输出数据来训练自己的模型。OpenAI 反应迅速坚决,暂停相关账号并表示将进一步调查。字节跳动回应称在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务用于较小模型的实验性项目研究,且自 2023 年 4 月引入调用规范检查后已停止。此外,不仅国内存在此类现象,24 年也有更多被指“套壳”的事件。同时,提示词攻击在业内是公开的秘密,国内外各大著名的 AI 厂商几乎无一幸免,系统提示处于泄露状态,大模型应用脆弱,数据易被获取。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

中国大模型面临的真实问题:登顶路远,坠落一瞬

[title]中国大模型面临的真实问题:登顶路远,坠落一瞬[heading1]二、“你不套,有的是人套”让我们从模型本身这个问题开始剖析。2023年下半年,一个不容忽视的事实浮出水面:部分声称性能卓越的中国大模型被揭露为"套壳"产品。这些模型实际上是直接采用了国外的开源大模型,经过简单包装后就宣称具备与GPT-4相当的能力。在一些评估大模型能力的榜单上,这些"套壳"模型往往名列前茅,多项指标甚至接近GPT-4的水平。更令人深思的是,一个奇怪的现象开始显现:在这些榜单上,模型的表现越好,被证实为"套壳"的可能性就越高。稍加调整,这些模型的性能就会显著下降。然而,"套壳"问题仅仅是中国大模型产业现状的冰山一角。这个现象揭示了更深层次的问题:在追求快速结果的压力下,一些公司选择了捷径,而非踏实的技术积累。2023年11月,一个引人注目的事件震动了AI圈:李开复创办的"零一万物"被国外开发者质疑为"套壳"产品。他们指出,该模型疑似只是对开源模型Llama进行了简单的重命名。这一指控如同一颗重磅炸弹,引发了广泛的讨论和反思。面对质疑,李开复和"零一万物"团队迅速做出回应。他们承认在训练过程中确实沿用了开源架构,但强调这只是为了快速起步,进行充分的测试和对比实验。他们坚称,其发布的模型都是从零开始训练的,并进行了大量原创性的优化和突破。继“零一万物”之后,12月,一则震惊业界的消息传出:科技巨头字节跳动被曝出在其秘密研发的大模型项目中调用了OpenAI的API,并使用ChatGPT的输出数据来训练自己的模型。这一行为,恰恰触犯了OpenAI使用协议中明确禁止的条款。

中国大模型面临的真实问题:登顶路远,坠落一瞬

[title]中国大模型面临的真实问题:登顶路远,坠落一瞬[heading1]二、“你不套,有的是人套”OpenAI的反应迅速而坚决。他们立即暂停了相关账号,并表示将进行进一步调查。如果指控属实,OpenAI可能会要求字节跳动更改其做法,甚至可能终止其账户。这种严厉的态度,展现了OpenAI对其技术和知识产权的坚决保护。面对这一指控,字节跳动的回应颇具策略性。他们承认在2023年初,技术团队在大模型探索的初期确实有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。然而,他们强调这个模型仅用于测试,从未计划上线或对外使用。更重要的是,字节跳动表示,自2023年4月公司引入GPT API调用规范检查后,这种做法就已经停止了。其实,不光是这些在23年披露出来的国内事件,在24年也有更多被指“套壳”国内大模型的事件,比如说斯坦福大学AI团队主导的Llama3-V开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。这些现象其实背后都指向了大模型的建设方式。在这里,我们粗浅地将大模型的建设方式分为三类:

云中江树:智能对决:提示词攻防中的AI安全博弈

[title]云中江树:智能对决:提示词攻防中的AI安全博弈国内的kimi也是一样。并且我们拿到之后,我们发现其实产品侧是有防护意识的。提示词中明确的突出了不要去泄露系统提示的内容,但是我们还是轻易的拿到了kimi的系统提示。然后你看像豆包也是一样的。同时像国内的这种智能体编排平台——扣子。上面的热门的智能体,我们都能轻易的拿到他们的核心提示词。当我们拿到他的核心提示词以后,我们可以看到它是怎么调用知识库的,怎么调用工作流的,看到它整体的设计的逻辑、它的核心创意构建过程。国外的知名平台如OpenAI的GPT Store上面的GPTs(智能体)也是一样的。我们可以轻松拿到它的提示词,然后通过提示词可以完整的知道这个GPTs整体的设计逻辑,并且知道它知识库里面放了哪些数据,放了哪些知识。我们知道这个有什么用呢?有了这个信息,接下来进一步就可以拿到它里面的数据。不仅可以让我们的AI把里面的数据吐出来,甚至我们可以让大模型直接把这个知识文件的链接给到我,直接下载数据文件。这就是我们现在看到的,到现在为止的很多大模型应用和智能体平台的现状。提示词攻击在业内已经是一个公开的秘密。我们现在的大模型应用,有时候脆弱的简直就是一座数据金矿,只要你掌握了怎么样去破译AI密码,就可以肆意搜刮里面的东西:提示词也好,数据也好,随便拿。国内外各大著名的AI厂商几乎无一幸免。国外的不管是GPT也好,还是Cluade也好,还是说谷歌的Gemini,还是著名的AI搜索引擎perplexity,他们的这些系统提示都是处于泄露的状态。

其他人在问
有没有好用的 tts 的 api 推荐啊
以下为您推荐一些好用的 TTS API: 1. 出门问问 Mobvoi: API 官网:https://openapi.mobvoi.com/ 语音合成(TTS)API 地址:https://openapi.mobvoi.com/pages/soundlibrary 语音合成(TTS)操作文档:https://openapi.mobvoi.com/document?name=%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90%EF%BC%88TTS%EF%BC%89 接口请求域名:https://open.mobvoi.com/api/tts/v1 接口请求频率限制:5 次/秒 提供多种方言和风格,满足不同场景需求,实时合成支持 SSML。 2. Eleven Labs:https://elevenlabs.io/ ElevenLabs Prime Voice AI 是一款功能强大且多功能的 AI 语音软件,使创作者和出版商能够生成逼真、高品质的音频。人工智能模型能够高保真地呈现人类语调和语调变化,并能够根据上下文调整表达方式。 3. Speechify:https://speechify.com/ Speechify 是一款人工智能驱动的文本转语音工具,使用户能够将文本转换为音频文件。它可作为 Chrome 扩展、Mac 应用程序、iOS 和 Android 应用程序使用,可用于收听网页、文档、PDF 和有声读物。 4. Azure AI Speech Studio:https://speech.microsoft.com/portal Microsoft Azure Speech Studio 是一套服务,它赋予应用程序能力,让它们能够“听懂、理解并与客户进行对话”。该服务提供了支持 100 多种语言和方言的语音转文本和文本转语音功能。此外,它还提供了自定义的语音模型,这些模型能够适应特定领域的术语、背景噪声以及不同的口音。 5. Voicemaker:https://voicemaker.in/ AI 工具可将文本转换为各种区域语言的语音,并允许您创建自定义语音模型。Voicemaker 易于使用,非常适合为视频制作画外音或帮助视障人士。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-30
和硅基流动类似的销售大模型api的平台
以下是一些与硅基流动类似的销售大模型 API 的平台: 1. Silicon 硅基接口: 官方提供接入 API 的教学文档。 以其为例,有众多开源模型(Yi、Qwen、Llama、Gemma 等)免费使用,还赠送 14 元体验金,有效期未知,被认为是 API 接口中方便且实惠的选择。 注册和使用地址:,邀请码:ESTKPm3J 。 注册登录后,单击左边栏的 API 密钥,单击新建 API 密钥,单击密钥即可完成 API 密钥的复制。 支持多种大模型,也支持文生图、图生图、文生视频,可自行探索。通过此接口可调用千问 2.5 模型,满足日常对话需求且免费调用。 2. 智普 GLM4 接口: 正在 BigModel.cn 上使用智谱 API 打造新一代应用服务,通过专属邀请链接注册可获得额外 GLM4Air 2000 万 Tokens 好友专属福利,链接:https://www.bigmodel.cn/invite?icode=xxcbnybpRLOsZGMNOkqaLnHEaazDlIZGj9HxftzTbt4%3D 。 进入个人中心,先完成实名认证,再单击左边栏 API KEYS 或右上角的 API 密钥,进入后单击右上角的添加 API,鼠标移至密钥上方,单击复制即可得到智普的 API key 。 请注意,在注册和使用这些平台的 API 时,一定要保管好密钥,不能公开,否则后果很严重。
2024-10-28
关于图转视频的开放的api
以下是一些关于图转视频的开放 API 信息: 出门问问 Mobvoi 的照片数字人工作流及语音合成(TTS)API: API 官网:https://openapi.mobvoi.com/ 语音合成(TTS)API 地址:https://openapi.mobvoi.com/pages/soundlibrary 语音合成(TTS)操作文档:https://openapi.mobvoi.com/document?name=%E8%AF%AD%E9%9F%B3%E5%90%88%E6%88%90%EF%BC%88TTS%EF%BC%89 使用 GPT 的视觉功能和 TTS API 处理和讲述视频: 原文作者:Kai Chen 发表于 Nov 6, 2023 Open in Github 在 Github 中打开:https://github.com/openai/openaicookbook/blob/main/examples/GPT_with_vision_for_video_understanding.ipynb 原文链接:https://cookbook.openai.com/examples/gpt_with_vision_for_video_understanding 示例包括: 使用 GPT4 获取视频的描述 使用 GPT4 和 TTS API 为视频生成画外音 详细示例链接:https://cookbook.openai.com/examples/gpt_with_vision_for_video_understanding1usinggptsvisualcapabilitiestogetadescriptionofavideo
2024-10-20
cozeAPI身份验证无效的解决方案
很抱歉,目前知识库中没有关于“cozeAPI 身份验证无效”的解决方案。但一般来说,遇到身份验证无效的问题,您可以尝试以下几种常见的解决方法: 1. 检查您输入的认证信息是否准确,包括用户名、密码、密钥等。 2. 确认您的账号是否已被激活或处于正常状态。 3. 检查网络连接是否稳定,有时网络问题可能导致验证失败。 4. 查看相关的 API 文档,了解身份验证的具体要求和可能的错误情况。 5. 尝试重新生成或更新认证凭证。 如果问题仍然存在,建议您进一步查阅相关技术资料或联系 API 提供方的技术支持获取更准确的帮助。
2024-10-14
API是什么意思
API 就像是一个信差,它接受一端的请求,告诉那边的系统您想要做的事情,然后把返回的信息发回给您。 以搜索“奥本海默”为例,在网址 https://www.themoviedb.org/search?query=奥本海默 中,域名 www.themoviedb.org 用于定位网站,路径 /search 表示搜索页面,query 是查询参数,其值为“奥本海默”。 对于获取数据的操作,如在 TMDb 中,有些数据虽然不展现,但为了支持筛选会保留。像“backdrop_path”是不完整的图片地址,TMDb 的官方 API 文档里有如何构造完整图片 URL 的说明。对于一些不熟悉的 API,需要在 Prompt 里告知如何使用。 Action 的工作流大致为:先思考要做什么样的 GPT 以及是否需要外部数据;然后寻找所需外部数据的 API 文档,或自己开发 API,寻找可用的 Action;最后基于 API 文档编写 Action 里的 Schema 和 Prompt 来处理取回的信息。 如果对 Action 感兴趣,可以系统学习 API 相关知识、寻找可用的 API 练习、发掘 GPT Action 更多潜力。
2024-10-11
opeai api接口在哪里
OpenAI 通过两种方式提供服务: 1. 通过 ChatGPT,提供开箱即用的服务,直接对话即可,简单直观。 2. 通过 OpenAI API,提供更加灵活的服务,通过代码调用,来完成更多自动化任务,比如全自动将本地的 1 万本小说从中文翻译成英文。 如果您想获取 OpenAI API 接口,可以按照以下步骤进行: 1. 搭建 ,这东西是为了汇聚整合多种大模型接口,方便您后面更换使用各种大模型。下面会告诉您怎么去白嫖大模型接口。 2. 搭建 ,这东西就是个知识库问答系统,您把知识文件放进去,再把上面的大模型接进来,作为分析知识库的大脑,最后回答您的问题。如果您不想接到微信去,自己用用,其实到这里搭建完就 OK 了,它也有问答界面。 3. 搭建 ,里面的 cow 插件能进行文件总结、MJ 绘画的能力。 完成上面 3 步就算 OK 了。
2024-10-05
国内无法访问 OpenAI 网站
以下是关于您所提到的问题的相关信息: OpenAI 将于 7 月 9 日开始阻止中国用户访问其 API。微软发言人表示,Azure OpenAI API 服务在中国的提供方式没有变化。作为一家独立公司,OpenAI 自行做出其决策,微软不受影响。相关链接:https://pymnts.com/artificialintelligence2/2024/reportmicrosoftwontfollowopenaiinblockingchinasaccesstoaimodels/ 、https://x.com/imxiaohu/status/1810526011173556481 微软确认 Azure OpenAI 服务将停止对中国大陆的非企业用户开放,企业用户不受影响。这是大陆唯一合法使用 OpenAI 的渠道,开发者社区受到了广泛关注。相关链接:https://x.com/imxiaohu/status/1847140960368841034
2024-11-01
如何访问openai网站
要访问 OpenAI 网站,您可以按照以下步骤进行: 1. 注册 OpenAI 账号:访问 https://platform.openai.com/account/apikeys 完成注册。 2. 创建 API KEY:在注册成功后,按照相关提示创建 API KEY,创建后需立即复制保存好,因为关闭弹框后将无法再次查看。 3. 您还可以通过 Google Colab 平台来使用相关服务,访问网址 https://colab.research.google.com 新建一个笔记本即可。 请注意,API 调用是收费的,但 OpenAI 为用户免费提供了 5 美元的用量。同时,您也可以参考官方 API 文档链接 https://platform.openai.com/docs/apireference/ 以获取更详细的信息。
2024-11-01
如何使用openai的chatGPT
使用 OpenAI 的 ChatGPT 可以参考以下步骤: 1. 会话补全(Chat completions):ChatGPT 基于 OpenAI 最先进的语言模型 gpt3.5turbo。使用 OpenAI 的 API,您可以用 gpt3.5turbo 构建自己的应用来做多种事情,如起草邮件或其他文字内容、写 Python 代码、回答关于一组文档的问题、创建会话代理、给软件提供自然语言接口、辅导各种学科、语言翻译、假扮成游戏或其他内容的角色。您可以参考。 2. 对于不会代码的情况: 获得 API Key(扣费凭证):以 OpenAI API 为例,您可以在这个页面找到 API Key:https://platform.openai.com/apikeys ,打开后,点击「Create new secret key」即可获取。请注意,通常需要绑定支付方式,才可以获取有效 Key。 获得 API 使用的示例代码:以 OpenAI API 为例,您可以在 Playground 这个页面获取 API 调用的示例代码:https://platform.openai.com/playground 。并且可以将您和 GPT 的对话,转换成代码。注意,这里有两个值可以定义,一个是 SYSTEM:对应 ChatGPT 里的 Instructions,用来定义这个 Bot 的功能/特点;USER:对应 ChatGPT 里,用户发出的信息。这里,可以将 SYSTEM 定义成缩略信息助手,而在 USER 中输入文章内容。运行后,结果可能会令人满意。点击右上方 View Code,获取生成这一内容的示例代码。 顺着之前的对话,让 ChatGPT 帮您继续写代码。
2024-10-21
openai的接口怎么调用,提示词怎么写
以下是关于 OpenAI 接口调用和提示词编写的相关知识: OpenAI 接口调用: OpenAI API 可应用于众多涉及生成自然语言、代码或图像的任务。提供了不同能力级别的模型,适用于不同任务,还能微调自定义模型。这些模型可用于内容生成、语义搜索、分类等众多领域。 提示词编写: 1. 设计提示词本质上是对模型进行“编程”,通常通过提供指令或示例完成,与多数专为单个任务设计的 NLP 服务不同,补全和聊天补全几乎可用于任何任务,如内容或代码生成、摘要、扩展、对话、创意写作、风格转换等。 2. 遵循最简化原则: 不需要包含作者信息,如“author”“version”等不相关信息。 避免分类错误,将输出错误分类到目标中,如“提供改进建议,以及改进原因”和“对用户的 Prompt 进行评分 1~10 分,10 分为满分”应明确区分。 注意拼写正确,如“Constraints”的正确拼写。 常见的限制条件包括内容长度限制、内容类型限制、逻辑和一致性限制、风格和语调限制。 避免无意义或重复的描述,如“理解中文语义”“评估和打分文本质量”“提供文本改进建议”等。 注意 Markdown 格式的正确使用,如“ Profile: Goals:”的结构错误,应将 Goals 放到“ Role”层级下面。 在给定的 API 请求中处理的 Token 数量取决于输入和输出长度。对于英文文本,1 个 Token 大约相当于 4 个字符或 0.75 个单词。您的文本提示词和生成的补合起来不能超过模型的最大上下文长度(对于大多数模型,这是 2048 个 Token,或大约 1500 个单词)。可以查看 OpenAI 的分词器工具来了解有关文本如何转换为 Token 的更多信息。
2024-10-17
OpenAI4.0将免费
目前没有确切的信息表明 OpenAI 4.0 将免费。OpenAI 的产品和服务的收费政策通常会根据其发展和市场情况进行调整,建议您关注 OpenAI 的官方网站获取最新和准确的信息。
2024-10-08
OpenAI发布新交互界面Canvas
OpenAI 于 10 月 4 日发布了新交互界面 Canvas。该界面旨在提升用户在写作和编码方面的协作体验,允许用户实时编辑和反馈,提供自动化建议、代码审查和错误修复等功能,并且能根据任务复杂性自动启用,以提升交互质量与工作效率。 此外,OpenAI 于 10 月 2 日宣布完成 66 亿美元融资,估值达 1570 亿美元。此资金将加速其 AI 研究和计算能力的发展,服务超过 2.5 亿用户。近期,核心技术人员变动,研究副总裁 Barret Zoph 离职并计划创业,Mark Chen 接任首席研究官。 在技术方面,OpenAI 发布的 GPT4o 是之前所有技术的集大成者,是新的全模态模型。该模型通过端到端的神经网络,把视觉、语音和文本数据混合训练,对音频输入的平均反应时间为 300 毫秒,与人类对话的反应时间相似,能从数据中感悟到人类表达的情绪、语调、风格等,甚至能还原训练时的环境声音。但 OpenAI 并未公开 GPT4o 的技术细节,唯一线索来自其内部模型炼丹师的一篇博客,项目名是 AudioLM,于 2023 年中启动,目标是用端到端的方式扩大语音模型的能力。
2024-10-04
字节投资的AI公司
以下是字节投资的部分 AI 公司相关信息: 近期热门融资 AI 产品中包括:You.com(多种搜索模式且重隐私的搜索引擎)、Genspark(通过 Sparkpages 来满足用户个性化的搜索需求)、Rockset(刚被 OpenAI 收购的提供实时搜索和分析数据库服务的公司)、Butterflies AI(人类与 AI 共存的社交软件)、MeetRecord(可以对销售通话进行记录和辅导的 AI 助手)。 中国 AI 生态 2023 上半年投资地图中的部分公司有:生数科技(创始人:唐家渝,是全球领先的生成式人工智能基础设施建设者,正积极打造世界领先的可控多模态通用大模型,致力于通过生成式 AI 技术提升全人类的创造力与生产力)、西湖心辰(创始人:蓝振忠,开发的西湖大模型既具备通过跨领域的知识解决问题的超高智商,也具备通过情感感知、长期记忆形成的超高情商)、影眸科技(创始人:吴迪,孵化于上海科技大学,通过与国内顶尖人工智能、计算机视觉实验室合作,积极推动尖端实验室科研成果的民用化、商业化,探索前沿人工智能、计算机视觉技术在大众娱乐市场的推广应用)。
2024-09-06
字节跳动旗下的即梦AI的模型来源是什么?以及它的数据训练库
目前没有关于字节跳动旗下即梦 AI 的模型来源以及数据训练库的准确和详细信息。但一般来说,AI 模型的训练数据可能来自多种来源,如维基百科、书籍、期刊、网络采集的图片/标题等。同时,在训练过程中可能会使用开源架构,并进行原创性的优化和突破。但对于即梦 AI 具体的情况,还需要更多确切的官方公布内容。
2024-08-25
如何用字节的扣子(coze)实现多轮对话
Coze 是字节跳动旗下的智能对话机器人服务平台,你可以使用 Coze 实现多轮对话。以下是一些步骤: 1. 创建一个 Coze 应用并配置你的模型:首先,你需要在 Coze 平台上创建一个应用,并选择一个适合你需求的模型。你可以选择使用预训练的模型,也可以上传自己的模型进行训练。 2. 配置对话流程:在 Coze 中,你可以配置对话流程,包括设置对话轮数、添加对话节点等。你可以根据你的需求配置不同的对话流程。 3. 训练你的模型:在配置完对话流程后,你需要训练你的模型。你可以使用 Coze 提供的训练数据进行训练,也可以上传自己的训练数据进行训练。 4. 部署你的模型:在训练完你的模型后,你可以将其部署到 Coze 平台上,并开始使用它进行多轮对话。 需要注意的是,Coze 是一个智能对话机器人服务平台,它提供了一些工具和功能来帮助你实现多轮对话。但是,你需要根据你的需求和场景进行配置和调整,以确保它能够满足你的需求。
2024-06-13
WAYTOAGI是字节跳动的吗
WAYTOAGI 并不是字节跳动的产品,而是一个由一群热爱 AI 的专家和爱好者共同建设的开源知识库,打开“waytoagi.com”就可以找到社群。WAYTOAGI 诞生于 2023 年 4 月 26 日,在没有任何推广的情况下,一年的时间已经有超过百万用户和超千万次的访问量,是很多 AI 爱好者知识的源头。社群的 Solgan 是让更多的人因 AI 而强大,有很多学社和共学共建的活动。
2024-05-23