Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

ai模型chatglm,百川大模型,通义千问,yi系列的模型厂商和团队背景,ai产品调用api的成本

Answer

以下是关于您提到的 AI 模型的厂商和团队背景以及 AI 产品调用 API 成本的相关信息:

厂商和团队背景:

  • 通义千问:由阿里开发,接口可在 https://dashscope.console.aliyun.com/ 创建 API key。
  • 智谱 AI(ChatGLM):由智谱 AI 开发,相关网址为 https://chatglm.cn 。
  • 百川大模型:由百川智能开发,网址为 https://www.baichuan-ai.com/ 。

关于 AI 产品调用 API 的成本: 目前国内的大模型大多限制一定免费额度的 Token,各平台 API 调用计费是按计算 token 费率定价,具体收费标准不同,需自行留意对应官网。例如 GPT-3.5、GPT-4、文心一言、讯飞星火、通义千问、mimimax 等,收费标准不一,不做统一赘述。

Content generated by AI large model, please carefully verify (powered by aily)

References

DIN:全程白嫖 - 拥有一个AI大模型的微信助手

阿里的[通义千问大模型](https://dashscope.console.aliyun.com/)接口,然后打开链接,创建个APIkey。[智谱AI(ChatGLM)](https://open.bigmodel.cn/)、[科大讯飞(SparkDesk)](https://xinghuo.xfyun.cn/sparkapi),也有免费接口。目前国内的大模型大都是,限制一定免费额度的Token。[谷歌的Gemini大模型](https://ai.google.dev/)(gemini 1.5),[海外版Coze](https://www.coze.com/)的GPT4模型。是免费而且还能图片识别,但需要给服务器挂梯子。想使用,这里我推荐张梦飞同学写的这篇教程[【保姆级教程】这可能是你在地球上能白嫖到的,能力最强的超级微信机器人!一步一图,小白友好](https://waytoagi.feishu.cn/wiki/YeBiwZx2TiyNLMk8pdjcmdQfnjd)。里面手把手教你怎么给服务器搭梯子,怎么使用海外版coze。

8月正式上线的国内大模型

5⃣️五家北京企业机构:百度(文心一言)https://wenxin.baidu.com抖音(云雀大模型)https://www.doubao.com智谱AI(GLM大模型)https://chatglm.cn中科院(紫东太初大模型)https://xihe.mindspore.cn百川智能(百川大模型)https://www.baichuan-ai.com/3⃣️三家上海企业机构:商汤(日日新大模型)https://www.sensetime.com/MiniMax(ABAB大模型)https://api.minimax.chat上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn今天这8个大模型,在聊天状态下——能生成Markdown格式的:智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的:昇思(可以对文本进行是否由AI生成的检测,类似论文查重,准确度不错)、书生受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有15元的预充值额度进行体验,完成企业认证后可以进行充值)特色功能:昇思——生图,MiniMax——语音合成

熊猫大侠:基于COW框架的ChatBot实现步骤

已提供接口的常见模型:GPT-3.5,GPT-4,文心一言,讯飞星火,通义千问,mimimax,moonshot(大模型支持情况请查看主项目更新部分),按自己的需求去对应官网申请API,并且各平台API调用计费是计算token费率定价不一样,收费标准大家自行留意,不做统一赘述。

Others are asking
Ai高端工作坊
以下是为您整理的两个关于 AI 的高端工作坊相关信息: 全球 AI 视觉分享会 AI 视觉创意大赛 活动日程: 颁奖典礼:10 月 17 日,14:30 18:00,红立方公共艺术馆负一楼大屏幕。包括嘉宾签到、获奖作品欣赏、领导致辞、评委介绍、产业推介、合作项目签约、颁奖点评、AI 创意周启动、合影留念及作品展参观。 AI 视觉创意汇:10 月 18 20 日,10:00 18:00,专业观众日和公众开放日,红立方公共艺术馆 1、2、3 号展馆。体验最新 AI 视觉技术,参与产品发布会和场景对接会。 AI 视觉工作坊:10 月 19 日,9:00 20:00,红立方公共艺术馆及少年宫。深入探讨 AI 在艺术创作中的应用,参与分享会、模型训练、圆桌交流和实时挑战赛。 地点:深圳红立方公共艺术馆(广东省深圳市龙岗区龙翔大道 8028 号) 活动亮点: 颁奖典礼:见证 AI 艺术的新星诞生,与行业领袖共同庆祝。 AI 视觉创意汇:亲身体验最新 AI 视觉技术,探索创意作品。 AI 视觉工作坊:深入了解 AI 艺术创作,与专家面对面交流。 活动报名:记得填写 waytoagi AI 摊主速成脑暴会 AI 摆摊玩什么 AI 娱乐与算命:AI 算命、星盘、八字、人格测试、趣味算命、游戏化互动。示例项目如 AI 算命(15 积分)、星盘解析、职业规划、社交小游戏(如积分狩猎、刮刮乐)。 技术与工具教学:Prompt 技巧、AI 工具安装、提示词优化、复杂模型训练、文档信息提取。示例项目如 Prompt 技巧传授(10 积分)、MJ/Sd 出图(10 积分)、大模型调参(20 积分)、文件抽取(15 积分)。 个性化小工具:小红书账号文案、表情包、爆款名片生成、定制黄历、智能对话、内容分享。示例项目如小红书爆款文案(10 积分)、个人知识笔记(3 积分)、AI 爆款名片(10 积分)。 体验型项目:AI 桌宠、人工智能体互动、数字人互动、项目商业模式咨询、AI 情感陪伴。示例项目如桌宠体验(10 积分)、数字人体验(10 积分)、商业落地场景咨询(20 积分)。 AI 图像处理:图像生成、照片修复与动起来、动漫化头像、老照片复活、创意壁纸制作。示例项目如 AI 写真、老照片动起来(10 积分)、卡通头像(10 积分)、赛博头像定制(多样风格)。 文案与内容创作:文案定制、朋友圈文案生成、爆款文案编写、创意故事、情话生成。示例项目如产品文案优化(10 积分)、AI 土味情话(5 积分)、个性化文案定制(10 积分)、朋友圈鸡汤生成。 音频与音乐制作:专属歌曲创作、音频处理、声音克隆、AI 唱歌、背景音乐定制。示例项目如制作专属歌曲(10 积分)、声音克隆/视频对口型(20 积分)、声音解梦音乐制作。 视频处理:视频换脸、照片转视频、视频动漫化、视频剪辑、数字人制作。示例项目如换脸(60 积分)、视频动漫化、AI 生成的视频脚本(20 积分)、AI 高清处理(10 积分)。 智能体与 Coze:搭建智能体、GPTs 创建、coze 工作流、微信机器人。示例项目如搭建智能体(50 积分)、智能体体验(10 积分)、Coze 工作流(20 积分)、微信机器人搭建(100 积分)。 AI 教育与咨询:AI 应用培训、课程设计、商业化咨询、AI + 行业应用咨询。示例项目如 AI 培训策划(20 积分)、商业化建议(10 20 积分)、产品思路分享(5 积分)、应用场景分析。
2025-01-23
前沿ai学习网站
以下是一些前沿的 AI 学习网站: 1. WaytoAGI:这是一个致力于人工智能(AI)学习的中文知识库和社区平台。为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。它汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。平台提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。此外,社区还定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 2. 在没有任何推广的情况下,WaytoAGI 一年时间已有超过 100 万用户和超千万次的访问量。其目标是让每个人的学习过程少走弯路,让更多的人因 AI 而强大。目前合作过的公司/产品包括阿里云,通义千问,淘宝,智谱,支付宝,豆包,火山引擎,marscode,coze,堆友,即梦,可灵,MiniMax 海螺 AI,阶跃星辰,百度,Kimi,吐司,liblib,华硕,美团,美的,360,伊利,魔搭,央视频,Civitai,Openart,Tripo3D,青椒云等。 3. 「通往 AGI 之路」的品牌 VI 融合了独特的设计元素,以彩虹色彰显多元性和创新,以鹿的形象象征智慧与优雅,通过非衬线字体展现现代感和清晰性,共同构建了一个充满活力和前瞻性的品牌形象。
2025-01-23
我想学习AI视频创作流程
以下是 AI 视频创作的一般流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 另外,在一些具体的创作案例中,比如“AI 离谱社黄师傅”的工作流程中,有以下要点: 创作思路基于深度文化挖掘、自然风光和历史遗迹展示、故事性和情感连接等关键概念和创新方法,旨在通过人工智能技术全面展示中国各省份的文化和旅游魅力。 任务划分方面,制片人搭建整体框架,图像创意者提供有冲击力的图像画面,视频制作者熟悉并运用视频工具,编剧构思故事和创作台词文本,还有配音和配乐等工作。 在 AI 春晚采访问题中提到,脚本创作由 GPT 完成但需要大量人工干预,图像生成由 MJ 完成也需要人工调词,人工比例在 70%以上。
2025-01-23
有用来做网络游戏研发和运营的全套AI工具吗?
目前游戏领域还没有涵盖整个制作过程(包括代码、资产生成、纹理、音频等)的全套生成式人工智能工具,也没有能与流行的游戏引擎(如虚幻和 Unity)紧密结合使用、专为适应典型的游戏生产流程而设计的一体化平台。但有一些相关的工具和平台在不同方面发挥作用,例如: 生成可以互动的角色方面:有很多初创公司在研究,如 Charisma.ai、Convai.com、Inworld.ai 等平台,它们可以为具有情感和自主权的完全渲染的 3D 角色提供动力,并提供工具让创作者给角色设定目标。 语音生成方面:Coqui Studio(https://coqui.ai)、Bark(https://github.com/sunoai/bark)、Replica Studios(https://replicastudios.com)等。 语音识别方面:OpenAI Whisper(https://huggingface.co/openai/whisperbase)、Facebook Wav2Vec2(https://huggingface.co/facebook/wav2vec2largexlsr53)。 对话模型方面:ChatGPT(https://chat.openai.com)、HuggingChat(https://huggingface.co/chat)。 故事讲述模型方面:MPT7BStoryWriter65k+(https://huggingface.co/mosaicml/mpt7bstorywriter)、Claude 100k(https://www.anthropic.com/index/100kcontextwindows)、GTP4 32k(https://platform.openai.com/docs/models/overview)。 游戏设计方面:Ludo.ai(https://ludo.ai)。 搜索引擎方面:Haddock(https://www.haddock.ai)。 AI NPC 方面:Inworld(https://inworld.ai)。
2025-01-23
Ai智能体
AI 智能体在以下方面有重要应用和发展: 1. 在品牌卖点提炼中: 可搭建智能体作为引导型助手,帮助提炼品牌卖点。 但在搭建前需明确 AI 的能力边界,如 AI 对公司的主要产品、产品解决的用户需求、产品独特之处、获得的认可、依赖的核心渠道、核心购买人群、曾使用的营销手段、在新渠道的期望结果等了解程度接近于 0。 AI 真正的能力在于通过分析数据和信息进行逻辑推理、快速处理和分析数据并提取有价值信息和模式、拥有大量训练数据可输出更全面相关信息、理解用户提供内容并按正确结构梳理有效输出。 引导型助手更适合成为灵感提问助手,在寻找卖点思考路径停滞时提供更多思考维度。 2. 企业自动化方面: 生成式 AI 应用有三个核心用例与强大的产品市场契合度:搜索、合成和生成。 领先的应用程序构建商正在建立解决方案,处理之前只能由大量人力解决的工作流程。 借助多步逻辑、外部内存以及访问第三方工具和 API 等新型构建块,下一波智能体正在拓展 AI 能力边界,实现端到端流程自动化。 未来的完全自主智能体可能拥有所有四个构建块,但当前的 LLM 应用程序和智能体还未达到。 如流行的 RAG 架构不是智能体式的,一些设计支持工具使用,但应用程序的步骤仍由代码预先确定。 当将 LLM 置于应用程序的控制流中让其动态决定行动、使用工具等时,智能体出现。 确定了三种不同主要用例和应用程序进程控制自由度的智能体类型:决策智能体、轨道智能体、通用人工智能体。
2025-01-23
初学者如何使用AI学习AI知识
对于初学者学习 AI 知识,建议如下: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 通过与这些 AI 产品的对话,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-23
3d模型自动生成的ai 啊
在 3D 模型生成方面,AI 主要完成了对 3D 模型生成流程的“一步到位”。工作流中的每一个环节几乎都需要一位或一组 3D 美术工程师来完成,而使用 3D 生成模型可以直接完成一个可调整的 3D 粗模,大大提升效率。 以下为一些 AI 生成 3D 模型的工具介绍: 1. 3dfy.ai: 概览:是一家专注于开发先进技术的公司,能将稀疏数据转化为逼真的三维世界,领导团队由计算成像领域资深专家组成。 使用场景:数字 3D 互动体验流行度提升,但受 3D 内容可用性限制,其技术能利用稀疏数据自动创建高质量 3D 模型。 目标用户:数字内容创作者和艺术家、游戏开发者和动画制作人、教育和培训行业专业人士、医疗行业、建筑和工程领域。 应用案例:暂未提及。 2. xiaohu.ai 相关 3D 信息: MakeACharacter:一键生成 3D 数字人,可自定义面部特征,基于真实人类扫描数据,使用 Unreal Engine 渲染,支持中英文提示,兼容多个行业应用。 Rodin Gen1:3D 原生生成模型,拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术。 Skybox AI 0.9 版本更新:可以从文本提示或草图生成 360 度 3D 世界,使用 NeRF 技术,增强图像的空间深度和真实感,提供不同分辨率的 3D 网格下载。 扫描物体生成 3D 模型:使用 APP 扫描物体,完成 3D 全貌捕获,创建 AR QR 码,展示物体于任何地点,在苹果新品官网展示中有应用。
2025-01-23
大模型学习之路
大模型的学习之路包括以下几个重要方面: 什么是大模型: 通俗来讲,大模型是通过输入大量语料,让计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。 大模型的训练和使用过程: 1. 找学校:训练大模型需要大量计算,GPU更合适,只有购买得起大量GPU的才有资本训练自己的大模型。 2. 确定教材:大模型需要的数据量特别多,几千亿序列(Token)的输入基本是标配。 3. 找老师:即用合适的算法讲述“书本”中的内容,让大模型能够更好理解Token之间的关系。 4. 就业指导:为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,正式干活,比如进行翻译、问答等,在大模型里称之为推导(infer)。 Token: Token被视为模型处理和生成的文本单位,可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法。在将输入进行分词时,会对其进行数字化,形成一个词汇表。 大模型的运作原理: 以“我今天吃了狮子头和蔬菜”这句话为例,在transformer中,会由attention层对这句话加入更多信息来补充,最终层与层之间,哪些信息需要补充、保留、传递,均由模型自主学习完成。这些层就好像人在阅读文章时的连贯性注意力的过程,大模型以词向量和transformer的模型学习海量知识,把知识作为向量空间中的一种关系网进行存储,并在接受输入时,通过向量空间中的一系列匹配进行输出。 大模型的构建过程: 1. 收集海量数据:如同教孩子成为博学多才的人,让其阅读大量书籍、观看纪录片、与人交谈,对于AI模型就是收集互联网上的文章、书籍、维基百科条目、社交媒体帖子等各种文本数据。 2. 预处理数据:像为孩子整理资料,AI研究人员也需要清理和组织收集到的数据,如删除垃圾信息、纠正拼写错误、将文本分割成易于处理的片段。 3. 设计模型架构:为孩子设计学习计划,研究人员需要设计AI模型的“大脑”结构,通常是一个复杂的神经网络,如使用Transformer架构。 4. 训练模型:如同孩子开始阅读和学习,AI模型开始“阅读”提供的数据,通过反复尝试预测句子中的下一个词,逐渐学会理解和生成人类语言。
2025-01-23
帮我用最简单的方法解释一下时间序列模型
时间序列模型是用于分析和处理随时间变化的数据的一类模型。 例如,在评估 GPT4V 对时间序列和视频内容的理解时,会考虑其对现实世界中随时间展开的事件的理解能力,像时间预测、排序、定位、推理和基于时间的理解等。 在视频生成方面,如 Video LDM 模型,先训练图像生成器,再微调添加时间维度以生成视频。 总的来说,时间序列模型旨在理解和预测数据在时间上的变化规律和趋势。
2025-01-23
以豆包为例,如何通过API调用豆包大模型?
要通过 API 调用豆包大模型,以下是一些相关步骤和信息: 1. 直接调用大模型(之前完成过 coze 对接的同学,直接去二、百炼应用的调用): 百炼首页:https://bailian.console.aliyun.com/ 以调用“qwenmax”模型为例,在/root/chatgptonwechat/文件夹下,打开 config.json 文件,需要更改"model",和添加"dashscope_api_key"。 获取 key 的视频教程: 获取 key 的图文教程:以下是参考配置。 注意:需要“实名认证”后,这些 key 才可以正常使用,如果对话出现“Access to mode denied.Please make sure you are eligible for using the model.”的报错,那说明您没有实名认证,点击去,或查看自己是否已认证。 2. 创建大模型问答应用: 首先可以通过创建一个百炼应用,来获取大模型的推理 API 服务,用于实现 AI 助手。 创建应用: 进入百炼控制台的,在页面右侧点击新增应用。在对话框,选择智能体应用并创建。 在应用设置页面,模型选择通义千问Plus,其他参数保持默认。您也可以选择输入一些 Prompt,比如设置一些人设以引导大模型更好的应对客户咨询。 在页面右侧可以提问验证模型效果。不过您会发现,目前它还无法准确回答你们公司的商品信息。点击右上角的发布,我们将在后面的步骤中去解决这一问题。 获取调用 API 所需的凭证: 在我的应用>应用列表中可以查看所有百炼应用 ID。保存应用 ID 到本地用于后续配置。 在顶部导航栏右侧,点击人型图标,点击 APIKEY 进入我的 APIKEY 页面。在页面右侧,点击创建我的 APIKEY,在弹出窗口中创建一个新 APIKEY。保存 APIKEY 到本地用于后续配置。 3. 配置 FastGpt、OneAPI: 首先配置 OneAPI,还记得刚刚让您白嫖的大模型 API 吗?阿里的接口,这时要派上用场了,去阿里模型的链接里创建 ApiKey,并复制下来。然后在 OneAPI 的页面,点击【渠道】添加新渠道。添加时,类型选择阿里通义千问,名称自己取个,类型选择好后模型是会默认加进去,您不用删减,还有就把刚刚阿里那复制的 ApiKey 粘贴到秘钥里去。这样就 OK 了。后续有其他的大模型也是一样的添加方式。
2025-01-23
大模型训练方式
大模型的训练方式如下: 1. 通俗来讲,大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能进行文本生成、推理问答、对话、文档摘要等工作。可以用“上学参加工作”来类比其训练和使用过程: 找学校:训练大模型需要大量计算,GPU更合适,只有购买得起大量GPU的才有资本训练。 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。 找老师:即选择合适算法讲述“书本”内容,让大模型更好理解Token之间的关系。 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 搬砖:就业指导完成后,进行如翻译、问答等工作,在大模型里称之为推导(infer)。Token被视为模型处理和生成的文本单位,能代表单个字符、单词等,在将输入进行分词时,会形成词汇表。 2. 100基础训练大模型的步骤: 步骤一·创建数据集:进入厚德云模型训练数据集(https://portal.houdeyun.cn/sd/dataset),在数据集一栏中点击右上角创建数据集,输入数据集名称。zip文件可以是包含图片+标签txt,也可以只有图片没有打标文件,也可以一张一张单独上传照片,但建议提前把图片和标签打包成zip上传。Zip文件里图片名称与标签文件应当匹配,例如:图片名"1.png",对应的达标文件就叫"1.txt"。上传zip以后等待一段时间,确认创建数据集,返回到上一个页面,等待一段时间后上传成功,可以点击详情检查,可预览到数据集的图片以及对应的标签。 步骤二·Lora训练:点击Flux,基础模型会默认是FLUX 1.0D版本,选择数据集,点击右侧箭头,会跳出所有上传过的数据集。触发词可有可无,取决于数据集是否有触发词。模型效果预览提示词则随机抽取一个数据集中的标签填入即可。训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数,如果不知道如何设置,可以默认20重复次数和10轮训练轮数,可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力,然后等待训练,会显示预览时间和进度条,训练完成的会显示出每一轮的预览图,鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此lora生图的界面。点击下方的下载按钮则会自动下载到本地。 步骤三·Lora生图:点击预览模型中间的生图会自动跳转到相应页面。模型上的数字代表模型强度,可在0.61.0之间调节,也可以自己添加lora文件,点击后会显示训练过的所有lora的所有轮次。VAE不需要替换,正向提示词输入写的提示词,可以选择基于这个提示词一次性生成几张图,选择生成图片的尺寸,横板、竖版、正方形。采样器和调度器新手小白可以默认,迭代步数可以在2030之间调整,CFG可以在3.57.5之间调整,随机种子1代表随机生成图。所有设置都好了以后,点击开始生态,生成的图会显示在右侧。如果有哪次生成结果觉得很不错,想要微调或者高分辨率修复,可以点开那张图,往下滑,划到随机种子,复制下来,粘贴到随机种子这里,这样下次生成的图就会和这次的结果近似。如果确认了一张很合适的种子和参数,想要搞清放大,则点开高清修复,可以选择想放大的倍数,新手小白可以就默认这个算法,迭代步数建议在2030之间,重回幅度根据需求调整,正常在0.30.7之间调整。 3. 今日作业:按照比赛要求,收集六个主题中一个主题的素材并且训练出lora模型后提交lora模型与案例图像。提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd
2025-01-23
大模型下文档投喂后,大模型是如何解读文档提取出答案?
大模型在文档投喂后解读文档并提取答案的过程通常包括以下步骤: 1. 问题解析阶段:接收并预处理问题,通过嵌入模型(如 Word2Vec、GloVe、BERT)将问题文本转化为向量,以确保问题向量能有效用于后续检索。 2. 知识库检索阶段:知识库中的文档同样向量化后,比较问题向量与文档向量,选择最相关的信息片段,并抽取相关信息传递给下一步骤。 3. 信息整合阶段:接收检索到的信息,与上下文构建形成融合、全面的信息文本。整合信息准备进入生成阶段。 4. 大模型生成回答:整合后的信息被转化为向量并输入到 LLM(大语言模型),模型逐词构建回答,最终输出给用户。 在这个过程中还包括以下信息处理步骤: 1. 信息筛选与确认:系统会对检索器提供的信息进行评估,筛选出最相关和最可信的内容,同时对信息的来源、时效性和相关性进行验证。 2. 消除冗余:识别和去除多个文档或数据源中可能存在的重复信息,以防在生成回答时出现重复或相互矛盾的信息。 3. 关系映射:分析不同信息片段之间的逻辑和事实关系,如因果、对比、顺序等,构建一个结构化的知识框架,使信息在语义上更加连贯。 4. 上下文构建:将筛选和结构化的信息组织成一个连贯的上下文环境,包括对信息进行排序、归类和整合,形成一个统一的叙述或解答框架。 5. 语义融合:在必要时,合并意义相近但表达不同的信息片段,以减少语义上的重复并增强信息的表达力。 6. 预备生成阶段:整合好的上下文信息被编码成适合生成器处理的格式,如将文本转化为适合输入到生成模型的向量形式。 最终,全新的上下文被一起传递给大语言模型。由于这个上下文包括了检索到的信息,大语言模型相当于同时拿到了问题和参考答案,通过 LLM 的全文理解,最后生成一个准确和连贯的答案。 相关概念: LLM:Large language model 的缩写,即大语言模型。 Prompt:中文译作提示词,是输入给大模型的文本内容,可以理解为和大模型说的话、下达的指令。 Token:大模型语言体系中的最小单元,不同厂商的大模型对中文文本的切分方法不同,通常 1Token≈12 个汉字,大模型的收费计算方法及对输入输出长度的限制通常以 token 为单位计量。 上下文:英文通常翻译为 context,指对话聊天内容前、后的内容信息,上下文长度和上下文窗口都会影响大模型回答的质量。
2025-01-23
哪些应用或者是web服务可以使用api
以下是一些可以使用 API 的应用和 Web 服务: 1. TMDB 提供了搜索电影的 API,其文档网址为 https://developer.themoviedb.org/reference/searchmovie 。在该网站的开发者相关页面或 API 文档中,可获取 API 规则。通过在右上角的认证里能看到 API 读访问令牌,配置文件中包含了如 url、请求方法 get、查询参数 query 和 language 等。输入关键词和相关语言设置,如“奥本海默”和“zhCN”,点击 Try it 即可获取数据,返回的数据格式为 JSON。 2. RAG 加速器的数据抽取服务,基于 FastAPI 和 Postgresql 搭建,并提供了标准的 REST API 接口,附带有 dockercompose 文件方便搭建服务环境。该服务支持定义并持久化“抽取器”,包含抽取结构的图式(Schema)、抽取上下文的指令(Prompt)和抽取样例(Reference examples)。此外,提供了提交文件进行抽取的端点和通过 RemoteRunnable 使抽取服务在 LangChain Expression Language链中更易用的端点。预设了基于 MIME 类型的解析器,支持 PDF 和 HTML 文档的解析,还可扩展支持其他文件类型。使用时可通过 JSON 模式定义提取信息、指定样例提升提取结果质量,传入原始文本或二进制文件。 如果您对 Action 很感兴趣,可以从以下方向继续学习: 1. 系统学习 API 相关知识。 2. 在网上寻找可用的 API 进行练习。 3. 发掘 GPT Action 的更多潜力。
2025-01-23
Whisper API
以下是关于您提到的“Whisper API”的相关信息: 在不同的 API 端点中,与 Whisper 相关的有: /v1/audio/transcriptions:支持的型号名称为 whisper1。 /v1/audio/translations:支持的型号名称为 whisper1。
2025-01-21
在comfyUI中可以接入哪些api,又和3D相关的吗
在 ComfyUI 中可以接入以下与 3D 相关的 API: 1. @CSM_ai:可以将文本、图像或草图转换为 3D 素材,并直接应用于游戏中,无需后期处理。体验地址:https://cube.csm.ai ,https://x.com/xiaohuggg/status/1763758877999587757?s=20 2. Move AI 推出的 Move API:可以从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。链接:https://move.ai/api ,https://x.com/xiaohuggg/status/1761590288576061573?s=20 3. ComfyUI 3D Pack 引入 3D 图像处理:可以快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。链接:https://github.com/MrForExample/ComfyUI3DPack/tree/main ,https://x.com/xiaohuggg/status/1755824687811346514?s=20 此外,ZHO 博主有关于 ComfyUI 的更新记录: 1. 4 月 18 日,ComfyUI Stable Diffusion 3 API 已更新为 V1.5 版,图生图和 SD3 Turbo 都可以正常使用,但 SD3 图生图模式不支持选择比例,SD3 Turbo 模型不支持负面提示词。使用方法是先申请 API,然后填入 config.json 文件即可(每账户 25 免费积分),SD3 每张图 6.5 积分(比较贵)。项目地址:https://github.com/ZHOZHOZHO/ComfyUIStableDiffusion3API ,SD3 API ComfyUI 节点测试成功。 2. 4 月 17 日,Stability AI 刚刚发布了 Stable Diffusion 3 和 Stable Diffusion 3 Turbo,现在已经可通过 Stability AI 开发者平台 API 使用,SAI 计划在不久的将来通过会员资格提供模型权重。详情:https://bit.ly/3W43FjY
2025-01-14
国内coze调用api的例子
以下是国内 Coze 调用 API 的一些例子: 1. 通过已有服务 API 创建插件: 进入 Coze 个人空间,选择插件,新建一个插件并命名,如 api_1。 在插件的 URL 部分,填入 Ngrok 随机生成的 https 链接地址。 按照 Coze 的指引配置输出参数,测试后发布插件。 2. 手捏简单的 Bot 并接入创建的插件:创建测试 API 的 Bot,将创建的 api_1 插件接入,在 prompt 里让其调用插件。 3. 测试 AI Bot 时可能遇到的情况:Coze 国内版刚发布不久,有些官方和第三方插件的 API 调用和返回结果不太稳定,可能出现回答不完整的情况,但相信官方会尽快解决。 4. 获取 Coze 的 accessToken 和 botid: 获取 accessToken:在 Coze 界面右侧扣子 API 授权,或者打开链接 https://www.coze.cn/open/oauth/pats,添加令牌,设置名称、过期时间和权限,完成后点击确定按钮并复制下拉令牌。 获取 botid:通过工作空间获取,从“工作空间”打开一个 bot,点击商店按钮查看地址栏中的数字即为 botid。 发布为 bot api:注意在前端使用 bot 必须发布成为 API,点击发布并选择 API,等待审核通过后可按上述方法拿到 botid。 获取空间 id:进入 Coze 后,左边打开工作空间,找到 url 中的 id 并复制。
2025-01-12
如何通过程序代码调用coze的api?
要通过程序代码调用 Coze 的 API,大致步骤如下: 1. 创建一个插件: 填入插件名和插件描述。 选择云侧插件作为创建方式。 选择 Python 作为 IDE 运行时。 点击【在 IDE 中创建工具】。 在创建工具面板里: 填入工具名称。 填入工具介绍。 2. API 接入相关操作: Glif 允许通过 API 调用平台上的应用,API 接入:https://docs.glif.app/api/gettingstarted 。 去创建一个新的 Token 并复制备用。 将自己发布的 glif 链接上的 id 复制备用。 3. 在 Coze 的 IDE 中: 引入依赖和编写 handler 方法。 代码中对应的数据字段在元数据 Tab 中设置: 填写入参字段和描述,对完整链接要写清楚。 填写出参字段。 左侧的依赖包添加【requests】。 填入测试数据运行,测试通过后即可发布。 4. 创建一个 Bot,挂载新创建的插件,在 Prompt 中做一些对入参的校验和约束。 5. 测试从 Coze 调用 Glif 功能跑通,发布 Coze。 另外,获取 Coze 的 accessToken 和 botid 时,需要了解以下内容: 1. OAuth 授权的范围控制: 个人空间:访问个人创建的 bot。 团队空间:可以跨账号授权,比如让其他团队成员访问你创建的 bot。 2. 跨账号授权流程: 用户 A 在用户 B 的团队空间创建了 bot。 用户 A 要使用这个 bot,需要: 先让空间所有者安装这个 OAuth 应用。 然后用户 A 才能获取授权码访问其在该团队空间创建的 bot。 3. OAuth 和 PAT的主要区别: OAuth token 有效期更短,安全性更高。 OAuth 可以实现跨账号的授权。 PAT 只能访问个人的资源。 在 Coze 中用现有服务创建自己的 plugin 时: 1. 进入 Coze,在个人空间中选择插件,新建一个插件,起名并填写描述。 2. 在插件的 URL 部分,填入 Ngrok 随机生成的 https 的链接地址。 3. 配置输出参数。 4. 测试后发布插件。 5. 创建 Bot 并接入创建的插件,在 prompt 中设置调用插件的相关要求。
2025-01-12
ai模型chatglm,百川大模型,通义千问,yi系列的模型厂商和团队背景,ai产品调用api的成本
以下是关于您提到的 AI 模型的厂商和团队背景以及 AI 产品调用 API 成本的相关信息: 厂商和团队背景: 通义千问:由阿里开发,接口可在 https://dashscope.console.aliyun.com/ 创建 API key。 智谱 AI(ChatGLM):由智谱 AI 开发,相关网址为 https://chatglm.cn 。 百川大模型:由百川智能开发,网址为 https://www.baichuanai.com/ 。 关于 AI 产品调用 API 的成本: 目前国内的大模型大多限制一定免费额度的 Token,各平台 API 调用计费是按计算 token 费率定价,具体收费标准不同,需自行留意对应官网。例如 GPT3.5、GPT4、文心一言、讯飞星火、通义千问、mimimax 等,收费标准不一,不做统一赘述。
2024-08-20