Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

企业做自己的小模型,需要用到的工具及工具背后的公司都有哪些?

Answer

企业做自己的小模型,可能会用到以下工具及背后的公司:

  1. 在编排(Orchestration)方面,涉及的公司如 DUST、FIAVIE、LangChain 等,其提供的工具可帮助管理和协调各部分及任务,确保系统流畅运行。
  2. 部署、可扩展性和预训练(Deployment, Scalability, & Pre-Training)类别中,像 UWA mosaicm、NMAREL、anyscale 等公司提供的工具,有助于部署模型、保证可扩展性及进行预训练。
  3. 处理上下文和嵌入(Context & Embeddings)的工具,相关公司有 TRUDO、Llamalndex、BerriAI 等,能帮助模型处理和理解语言上下文,并将词语和句子转化为计算机可理解的形式。
  4. 质量保证和可观察性(QA & Observability)方面,例如 Pinecone、drant、Vald 等公司提供的工具,可确保模型表现并监控其性能和状态。

此外,还有以下工具和相关公司:

  1. 图片生成 3D 建模工具,如 Tripo AI(由 VAST 发布)、Meshy、CSM AI(Common Sense Machines)、Sudo AI、VoxCraft(由生数科技推出)等。

企业还可能涉及具身智能、3D 眼镜、AI 绘本、AI 图书、学习机、飞书的多维表格、蚂蚁的智能体、Coze 的智能体、Zeabur 等云平台、0 编码平台、大模型(通义、智谱、kimi、deepseek 等)、编程辅助、文生图(可灵、即梦等)等方面,可能需要相应资质。

Content generated by AI large model, please carefully verify (powered by aily)

References

Generative AI的开发工具和基础设施的趋势

这张图描绘了Generative AI的开发工具和基础设施的趋势。它代表了在AI开发领域中,为满足不同需求,工具和基础设施正在逐渐模块化和专业化的趋势。图中的公司被分组到以下四个主要类别:1.Orchestration(编排):涉及到的公司(如DUST、FIAVIE、LangChain等)提供的工具帮助开发人员管理和协调各个部分和任务,以确保系统的流畅运行。2.Deployment,Scalability,& Pre-Training(部署,可扩展性和预训练):这个类别的公司(如UWA mosaicm、NMAREL、anyscale等)提供工具,帮助开发人员部署模型,保证模型的可扩展性,以及在模型使用前进行预训练。3.Context & Embeddings(上下文和嵌入):这个类别的公司(如TRUDO,Llamalndex,BerriAI等)提供工具,帮助模型处理和理解语言上下文,以及将词语和句子转化为计算机可以理解的形式。4.QA & Observability(质量保证和可观察性):这个类别的公司(如Pinecone,drant,Vald等)提供工具,以确保模型的表现,并能够监控模型的性能和状态。这些类别和公司的出现代表了人工智能技术的复杂化和专业化。随着技术的发展,更多专门针对不同AI开发阶段的工具和服务正在被开发和使用,这有助于提高开发效率和模型质量。

06 企业权益和招募

1.企业可以是1.1.具身智能的,1.2.3D眼镜,1.3.AI绘本,1.4.AI图书等1.5.学习机1.6.飞书的多维表格1.7.蚂蚁的智能体1.8.Coze的智能体等1.9.Zeabur等云平台?1.10.0编码平台1.11.大模型:通义,智谱,kimi,deepseek等1.12.编程辅助1.13.文生图,可灵,即梦等1.14.推荐咖啡,奶茶等AI调配?需要相应资质1.15.企业权益:1.学校大屏幕广告(1周?一个月?PA屏)2.开幕式露出3.摊位本身的宣传4.其他的露出4.1.直播等?5.工作坊场?有教室等,可能是500人中的部分人报名,深度参与其中,尽量不是卖东西,应用实操5.1.AI辅助编程,每个人做一个专属自己的一站式工作台,工具箱5.2.针对典型的教学教研过程,做一个尝试6.圆桌会论坛之类7.真实案例收集反馈等,让大模型厂家的诉求8.半透明的chatbot会话,有二维码引流等,一周都可以,或者按时间聊权益

问:图片生成 3d 建模工具

图片生成3D建模工具是指利用人工智能技术,通过分析图片内容并将其转换成3D模型的软件或服务。以下是一些可用的工具:1.Tripo AI:Tripo AI是VAST发布的在线3D建模平台,它能够利用文本或图像在几秒钟内生成高质量且可立即使用的3D模型。该平台基于一个数十亿参数级别的3D大模型,能够实现快速的2D到3D转换,并提供AI驱动的精准度和细节。2.Meshy:Meshy是一个功能全面的工具,它不仅支持文本生成3D,还支持图片生成3D以及AI材质生成。用户可以通过上传图片并描述需要的材质和风格,来生成高质量的3D模型。3.CSM AI:CSM(Common Sense Machines)支持从视频和图像创建3D模型。它的Real-time Sketch to 3D功能支持通过手绘草图实时设计3D形象,再转换为3D模型。4.Sudo AI:Sudo AI支持通过文本和图像生成3D模型,特别适用于游戏领域的模型生成。用户可以上传图片或输入文本提示词来生成3D模型。5.VoxCraft:由生数科技推出的免费3D模型生成工具,能够将图像或文本快速转换成3D模型,并提供了图像到3D、文本到3D和文本到纹理等多种功能。这些工具通常具有用户友好的界面,允许用户通过简单的操作来生成3D模型,无需专业的3D建模技能。它们可以广泛应用于游戏开发、动画制作、3D打印、视觉艺术等领域。内容由AI大模型生成,请仔细甄别

Others are asking
生成logo图片工具
以下是一些生成 logo 图片的工具和方法: 1. 藏师傅的方法:通过智能体 https://www.coze.cn/s/iDec2U13/ ,整个流程分为三个部分,包括获取 Logo 图片的描述、根据描述和生成意图生成图片提示词、将图片和提示词输入 Comfyui 工作生成。 2. 即梦 AI:在其官网 https://jimeng.jianying.com/ ,左侧点击「智能画布」,上传 logo 图,点击「图生图」输入描述词,参考程度为 55 并选择「轮廓边缘」点击立即生成,然后在右侧图层选择喜欢的图,还可使用局部重绘、消除笔等功能调整或重新生成。 3. guahunyo 提供的 SD 入门讲解 PPT.pptx 中提到的相关采样器设置和生成图片的技巧,如预览图设置、右键无限跑图模式以及相关插件 https://github.com/ArtVentureX/sdwebuiagentscheduler 等。
2025-03-26
mermaid编辑工具
Mermaid 是一款用于创建各种图表的工具,它支持多种类型的图表,如思维导图、时序图、UML 图等。以下是关于 Mermaid 编辑工具的一些信息: 可以使用 Mermaid 语法创建简单的思维导图,例如:GRAPH CODE 判断 大语言模型 自然语言处理 机器学习 深度学习 执行 文本分析 情感分析 算法优化 神经网络 结束。 可用于将代码转化为图表,如在“code to diagram”的搜索结果中,Mermaid 不仅支持十几种图像,还提供了在线编辑器,生成器的网址为:https://mermaid.live/ 。 可以通过 ChatGPT 结合自然语法生成 Mermaid 图形语法,生成流程包括确定制作目标、通过自然语言描述逻辑、在线校验测试是否成功。例如,要求 ChatGPT 基于给定内容生成高速公路上车辆切入场景的时序图。
2025-03-25
你是一个财务总监,市场分析师,但是你没有数据,现在需要你寻找一下有没有可以自动查找数据,并且根据数据生成饼状图的 AI工具
以下是为您推荐的可以自动查找数据并根据数据生成饼状图的 AI 工具: 1. Claude Financial Data Analyst:可视化金融数据分析工具,能生成多种图表,包括饼图。上传文档后可快速生成动态图表,适用于趋势分析和分布分析。详细介绍:https://xiaohu.ai/p/14811 ,GitHub:https://github.com/anthropics/anthropicquickstarts/tree/main/financialdataanalyst ,https://x.com/imxiaohu/status/1847617781594030583 。 2. PandasAI:让 Pandas DataFrame“学会说人话”的工具,用户可以以 Pandas DataFrame 的形式提出有关数据的问题,会以自然语言、表格或者图表等形式进行回答,目前仅支持 GPT 模型,OpenAI API key 需自备。示例:pandas_ai.run 。GitHub 链接:https://github.com/gventuri/pandasai 。 3. DataSquirrel:自动进行数据清理并可视化执行过程,帮助用户在无需公式、宏或代码的情况下快速将原始数据转化为可使用的分析/报告的数据分析工具。平台符合 GDPR/PDPA 标准。链接:https://datasquirrel.ai/ 。
2025-03-25
我想找一个能帮我总结视频内容的AI工具
以下为您介绍两种能帮您总结视频内容的 AI 工具: 1. GPT: 对于有字幕的 B 站视频,若视频栏下有字幕按钮,说明视频作者已上传字幕或后台适配了 AI 字幕。 安装油猴脚本,刷新浏览器,点击字幕会出现“下载”按钮,可选择多种字幕格式。 将下载的字文字内容全选复制发送给 GPT 即可总结视频内容。总结完还可继续向 GPT 提问更多细节内容或探讨视频内容。 2. Get 笔记: 可以一键总结视频的笔记,支持抖音、小红书、B 站短视频和甚至是直播回放链接。 测试显示不仅能生成笔记,还有逐字稿。但使用时需注意:一是 AI 可能存在幻觉,生成内容仍需人类核对检查;二是若直播未准时开始,则不会生成直播笔记。
2025-03-25
想咨询一下有没有可以自动查找数据,并且根据数据生成饼状图的 AI工具
以下是一些可以自动查找数据并根据数据生成饼状图的 AI 工具: 1. PandasAI:这是一个让 Pandas DataFrame“学会说人话”的工具,用户可以以 Pandas DataFrame 的形式提出有关数据的问题,它会以自然语言、表格或者图表等形式进行回答,目前仅支持 GPT 模型,OpenAI API key 需自备。链接:https://github.com/gventuri/pandasai 2. DataSquirrel:能够自动进行数据清理并可视化执行过程,帮助用户在无需公式、宏或代码的情况下快速将原始数据转化为可使用的分析/报告,平台符合 GDPR/PDPA 标准。链接:https://datasquirrel.ai/ 此外,在一些特定的文档中还提到了通过代码生成和特定操作生成堆叠条形图、堆叠柱状图、百分比堆条形图等用于展示数据的方式。
2025-03-25
想咨询一下有没有可以自动查找数据生成饼状图的 AI工具
以下是一些可以自动查找数据生成饼状图的 AI 工具: 1. 对于一般的数据统计和图表生成,清华的智谱清言 Chatglm.cn 可能具备相关功能。 2. 在 CAD 领域,虽然主要是针对 CAD 图的生成,但也有一些工具可能适用于您的需求,例如: CADtools 12:这是一个 Adobe Illustrator(AI)插件,添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 Autodesk Fusion 360:是 Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能创建复杂的几何形状和优化设计。 nTopology:基于 AI 的设计软件,可创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,可根据用户输入的设计目标和约束条件自动产生多种设计方案。 需要注意的是,这些工具通常需要一定的相关知识和技能才能有效使用。对于初学者,建议先学习基本技巧,然后尝试使用这些工具来提高效率。同时,内容由 AI 大模型生成,请仔细甄别。
2025-03-25
怎么搭建扣子智能体提取抖音文案并进行改写用到哪些插件,并给我配置参数与步骤图
以下是搭建扣子智能体提取抖音文案并进行改写所需的插件、配置参数及步骤: 1. 插件搭建: 点击个人空间,选择插件,点击创建插件。 插件名称:使用中文,根据需求起名。 插件描述:说明插件的用途和使用方法。 插件工具创建方式:选择云侧插件基于已有服务创建,填入所使用 API 的 URL。 在新的界面点击创建工具,填写工具的基本信息,如工具名称(只能使用字母、数字和下划线)、工具描述、工具路径(以“/”开始,若使用 path 方式传参,用“{}”包裹变量)、请求方法等,结束后点击保存并继续。 2. 配置输入参数: 点击新增参数,填写所有需要使用的参数,保存并继续。 3. 配置输出参数: 如果一切填写正确,可直接点击自动解析,会自动调用一次 API 给出对应的输出参数。 填入汉字“张”,点击自动解析。 解析成功后显示解析成功,可看到输出参数已填好,然后点击保存并继续。 4. 调试与校验: 测试工具是否能正常运行。 运行后查看输出结果,Request 为输入的传参,Response 为返回值,点击 Response 可看到解析后的参数。 此外,安仔使用 Coze 免费创建 24 小时英语陪练的步骤包括: 1. 打开扣子首页,点击左上角创建 AI Bot 按钮。 2. 在弹窗输入 Bot 相关信息。 3. 设计人设与回复逻辑,根据功能需求设计提示词。 4. 调整模型设置,如改为 20 轮对话记录。 5. 选择使用插件,如英文名言警句、Simple OCR 等。 6. 设置开场白和预置问题。 7. 设置语音,选择亲切的英语音色。
2025-03-18
我想写一篇本科生论文,利用ai工具来帮我更好完善,需要用到那些常用指令
在本科生论文写作中,以下是一些常用的 AI 指令和相关工具: 1. 内容生成和辅助写作: 指令示例:“根据以下关于我的信息,写一篇四段的大学申请论文:我来自西班牙巴塞罗那。尽管我的童年经历了一些创伤性事件,比如我 6 岁时父亲去世,但我仍然认为我有一个相当快乐的童年。在我的童年时期,我经常换学校,从公立学校到非常宗教的私立学校。我做过的最‘异国情调’的事情之一是在爱达荷州的双子瀑布与我的大家庭一起度过六年级。我很早就开始工作了。我的第一份工作是 13 岁时的英语老师。在那之后,以及在我的学习过程中,我做过老师、服务员,甚至建筑工人。” 工具:Grammarly ,通过 AI 技术提供文本校对、语法修正和写作风格建议,帮助提高论文的语言质量;Quillbot ,一个基于 AI 的重写和摘要工具,可以帮助研究人员精简和优化论文内容。 2. 文献管理和搜索: 工具:Zotero ,结合 AI 技术,可以自动提取文献信息,帮助研究人员管理和整理参考文献;Semantic Scholar ,一个由 AI 驱动的学术搜索引擎,能够提供相关的文献推荐和引用分析。 3. 研究和数据分析: 工具:Google Colab ,提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化;Knitro ,一个用于数学建模和优化的软件,可以帮助研究人员进行复杂的数据分析和模型构建。 4. 论文结构和格式: 工具:LaTeX ,虽然不是纯粹的 AI 工具,但结合了自动化和模板,可以高效地处理论文格式和数学公式;Overleaf ,一个在线 LaTeX 编辑器,提供丰富的模板库和协作功能,简化论文编写过程。 5. 研究伦理和抄袭检测: 工具:Turnitin ,一个广泛使用的抄袭检测工具,帮助确保论文的原创性;Crossref Similarity Check ,通过与已发表作品的比较,检测潜在的抄袭问题。 需要注意的是,使用这些 AI 工具时,要结合自己的写作风格和需求,选择最合适的辅助工具,同时要确保使用方式符合学术道德和规范。
2025-03-15
我想要写小说,应该用到什么工具和ai
如果您想要写小说,可以使用以下工具和利用 AI 相关技术: 文字方面:可以使用 GPT 脚本来生成文字内容。 图片方面:Midjourney 可用于生成图片。 视频方面:Runway 可用于处理视频。 音频方面:ElevenLabs、剪映可用于处理音频。 剪辑方面:剪映可用于剪辑。 其他方面:PS、AE 可用于其他相关处理。 在故事创作方面,可以按照以下 Prompt 模板来生成内容: 标题:"generate:小说的标题" 设置:"generate:小说的情景设置细节,包括时间段、地点和所有相关背景信息" 主角:"generate:小说主角的名字、年龄、职业,以及他们的性格和动机、简要的描述" 反派角色:"generate:小说反派角色的名字、年龄、职业,以及他们的性格和动机、简要的描述" 冲突:"generate:小说故事的主要冲突,包括主角面临的问题和涉及的利害关系" 对话:"generate:以对话的形式描述情节,揭示人物,以此提供一些提示给读者" 主题:"generate:小说中心主题,并说明如何在整个情节、角色和背景中展开" 基调:"generate:整体故事的基调,以及保持背景和人物的一致性和适当性的说明" 节奏:"generate:调节故事节奏以建立和释放紧张气氛,推进情节,创造戏剧效果的说明" 其它:"generate:任何额外的细节或对故事的要求,如特定的字数或题材限制" 如果您想用 AI 把小说做成视频,以下是一些工具和一般流程: 工具与网址: Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址: Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址: Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: Clipfly:一站式 AI 视频生成和剪辑平台。网址: VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 故事 AI 绘图:小说转视频的 AI 工具。网址: 制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。内容由 AI 大模型生成,请仔细甄别。
2025-03-12
我想要制作一款小游戏,上架到抖音和微信,请你给我列举出需要用到的ai和软件
以下是制作小游戏并上架到抖音和微信可能需要用到的 AI 和软件: AI 方面:可以利用 AI 描述需求生成游戏代码,例如向云雀 3.5 等模型描述需求来辅助生成代码。还可以让 AI 处理图片、绘制角色形象等。 软件工具: 图像托管网站:用于上传游戏中的图片,选择无需登录、兼容性强的网站。 代码解释网站:有专门解释代码改游戏 bug 的网站,部分有免费额度。 GitHub:用于游戏发布,需要注册账号,设置游戏名,选择公共或锁定,上传文件等。 Zion:支持小程序、Web、AI 行为流全栈搭建,APP 端全栈搭建 2025 上线。 Coze:可作为后端服务。 微信开发者工具:用于微信小程序的开发。
2025-03-10
我想把小说改编动画需要用到什么
将小说改编成动画通常需要以下步骤和工具: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 以下是一些可以利用的工具及网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 关于人物站位调度,有研究表明: 1. GPT4 准确度高,3 个样本可以认为是全对,竖向总是 5 个人物位置排 6 个人的缺陷可以规则代码修复。 2. ChatGPT3.5,gpt3.5turbo 虽然没有 GPT4 的视觉能力,却可以通过文字脑补小说人物在空间的布局,属于是额外收获。 3. Gpt3.5turbo 存在幻觉 33%左右的成功率,ChatGPT3.5 成功率 50%+。ChatGPT4 成功率 33%50%左右。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-03-10
我需要把文字转语言,并且生成一些图片,做成视频,用到那些AIr
目前有多种 AI 工具可以帮助您实现将文字转换为语言并生成图片制作视频的需求。例如,一些语音合成工具如百度语音、科大讯飞等可以将文字转换为语言;在图片生成方面,像 DALL·E2、StableDiffusion 等工具表现出色;而制作视频时,您可以考虑使用剪映等软件结合上述生成的语音和图片来完成。
2025-03-10
帮我列举2025年3月1日以来,国内外、闭源开源模型厂商的更新记录。
以下是 2025 年 3 月 1 日以来,国内外、闭源开源模型厂商的部分更新记录: 2025 年 3 月 20 日,OpenAI 推出了一套全新的音频模型,旨在通过 API 为开发者提供更智能、更可定制的语音代理支持,包括改进的语音转文本和文本转语音功能,为语音交互应用带来显著提升。 李开复公开表示 OpenAI 面临生存危机,商业模式不可持续。他强调中国的 DeepSeek 以极低成本提供接近的性能,开源模式将主导未来 AI 发展。他认为企业级 AI 应用将成为投资重点,资源限制反而促进了创新。李开复大胆预测,中国将出现三大 AI 玩家,竞争愈发激烈。 SuperCLUE 发布《中文大模型基准测评 2025 年 3 月报告》,指出 2022 2025 年经历多阶段发展,国内外模型差距缩小。测评显示 o3mini总分领先,国产模型表现亮眼,如 DeepSeekR1 等在部分能力上与国际领先模型相当,且小参数模型潜力大。性价比上,国产模型优势明显。DeepSeek 系列模型深度分析表明,其 R1 在多方面表现出色,蒸馏模型实用性高,不同第三方平台的联网搜索和稳定性有差异。 以上信息来源包括: 《》 《》 《》
2025-03-26
用扣子的时候怎么让大模型严格按照知识库内容进行输出
以下是关于让大模型严格按照知识库内容进行输出的相关信息: 扣子的知识库功能强大,可上传和存储知识内容,提供多种查找方法。在智能体中使用知识库,收集相关内容,当智能体回答用户时会先检索知识库,使回复更准确。 在“掘金 x 扣子 Hackathon 活动 深圳站”的总冠军工作流中,对于用户向小说人物角色的提问,通过一系列节点,包括开始节点接收问题、知识库节点检索、大模型节点生成答案等,本质上是一个根据用户 query 进行检索增强生成(RAG)的任务,每个工作流中都嵌入了知识库节点,维护了如小说合集等知识库。 大模型节点是调用大语言模型,使用变量和提示词生成回复。按需选择基础版或专业版模型,基础版支持扣子预设的一批模型资源,专业版除默认添加的豆包模型外,还支持按需接入火山引擎方舟平台的模型资源。模型选择右下角生成多样性可从多个维度调整不同模型在生成内容时的随机性,有精确模式、平衡模式和创意模式等预置模式。输入方面,开启智能体对话历史后,上下文信息将自动携带进入大模型,参数名可随意设置但建议有规律,变量值可引用前面链接过的节点的输出或进行输入。
2025-03-26
我是一个没有技术背景且对AI感兴趣的互联网产品经理,目标是希望理解AI的实现原理并且能够跟开发算法工程师沟通交流,请给我举出AI模型或者机器学习的分类吧。
以下是 AI 模型和机器学习的分类: 1. AI(人工智能):是一个广泛的概念,旨在使计算机系统能够模拟人类智能。 2. 机器学习:是人工智能的一个子领域,让计算机通过数据学习来提高性能。包括以下几种类型: 监督学习:使用有标签的训练数据,算法学习输入和输出之间的映射关系,包括分类和回归任务。 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务如聚类。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训练小狗。 3. 深度学习:是机器学习的一个子领域,模拟人脑创建人工神经网络处理数据,包含多个处理层,在图像识别、语音识别和自然语言处理等任务中表现出色。 4. 大语言模型:是深度学习在自然语言处理领域的应用,目标是理解和生成人类语言,如 ChatGPT、文心一言等。同时具有生成式 AI 的特点,能够生成文本、图像、音频和视频等内容。 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖循环神经网络或卷积神经网络。生成式 AI 生成的内容称为 AIGC。
2025-03-26
是什么类似本地知识库的模型
本地知识库相关的模型主要涉及 RAG(Retrieval Augmented Generation,检索增强生成)技术。以下是对 RAG 技术的详细介绍: 背景:大模型的训练数据有截止日期,当需要依靠不在训练集中的数据时,RAG 技术发挥作用。 过程: 文档加载:从多种来源加载文档,如 PDF 等非结构化数据、SQL 等结构化数据以及代码等。 文本分割:把文档切分为指定大小的块。 存储:包括将切分好的文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。 检索:通过检索算法找到与输入问题相似的嵌入片。 输出:把问题及检索出来的嵌入片提交给 LLM,生成更合理的答案。 如果想要对本地知识库进行更灵活的掌控,可以使用额外的软件 AnythingLLM。其安装地址为:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步: 1. 选择大模型。 2. 选择文本嵌入模型。 3. 选择向量数据库。 在 AnythingLLM 中有 Workspace 的概念,可以创建独有的 Workspace 与其他项目数据隔离。构建本地知识库的步骤包括: 1. 首先创建一个工作空间。 2. 上传文档并在工作空间中进行文本嵌入。 3. 选择对话模式,包括 Chat 模式(大模型根据训练数据和上传的文档数据综合给出答案)和 Query 模式(大模型仅依靠文档中的数据给出答案)。 4. 测试对话。 在一个政府政策问答的项目实践中,由于传统智能问答产品在政策咨询方面存在困难,而大模型具有诸多优势,选择 LangChainChatchat 框架构建政策文档的本地知识库,实现基于本地知识库内容生成回答,为用户提供政策问答和解读服务。
2025-03-26
好用的大语言模型
目前好用的大语言模型有以下几种: 1. OpenAI 的 GPT4:是最先进和广泛使用的大型语言模型之一,在多种任务上表现卓越,包括文本生成、理解、翻译以及各种专业和创意写作任务。 2. Anthropic 公司的 Claude 3:在特定领域和任务上表现出色。 3. 谷歌的 Gemini。 4. 百度的文心一言。 5. 阿里巴巴的通义大模型:通义千问 2.0 在代码、上下文对话基础能力上排名国内第一,各项能力较为均衡,位于国内大模型第一梯队。适用于金融、医疗、汽车等垂直专业场景,以及代码生成与纠错、实时搜索信息、通用工具调用、办公等场景。 6. OPPO 的 AndesGPT:具有对话增强、个性专属和端云协同三大技术特征,已接入 OPPO 智能助理新小布,可用于用机助手、内容创作、超级问答、专属 AI、日程管理等全新能力,聚焦在移动设备端的应用。 7. 百川智能的 Baichuan213BChat:在逻辑推理、知识百科、生成与创作、上下文对话等基础能力上排名 200 亿参数量级国内模型第一,可应用场景广泛且可以私有化部署。 如果想了解国内的大模型效果,可以参考第三方基准评测报告: 。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-26
如果调教ai助力成为网文作家?选用市面上哪种ai模型好一些
如果想调教 AI 助力成为网文作家,以下是一些建议和可选用的 AI 模型: 借助 AI 分析好的文章: 找出您最喜欢的文章,投喂给 DeepSeek R1(理论上来说适合大多数 AI,尤其是有推理模型)。 分三次询问:第一次从写作角度分析;第二次从读者角度分析;第三次指出文章的缺点、不足及改善和提升的空间。 对作者进行侧写,分析成长背景、个人经历和知识结构对文章的影响。 让 AI 对您写的文章进行点评:使用类似“现在我希望你是一名资深中文写作教师/小学语文老师/中学语文老师/公文写作培训师,拥有 30 年教育经验,是一名传授写作技巧的专家。请先阅读我提供给你的文章,然后对文章进行分析,然后教我如何提升写作水平。请给出详细的优缺点分析,指出问题所在,并且给出具体的指导和建议。为了方便我能理解,请尽量多举例子而非理论陈述”的提示词。 分享一个根据文章内容对作者心理侧写的提示词:“我希望你扮演一个从业 20 多年,临床诊治过两千多例心理分析案例的人性洞察和意识分析方面的专家,精通心理学、人类学、文史、文化比较。先阅读后附文章全文,然后对作者进行人格侧写。要尖锐深刻,不要吹捧包装,不要提出一些只能充当心理安慰的肤浅的见解。包括作者的基本画像、核心性格特质、认知与价值观、潜在心理动机、行为模式推测、矛盾与盲点、文化符号映射。” 在模型选择方面: 目前只推荐 Claude 3.7 Sonnet,Anthropic 对 Claude 在编程和美学方面有深度优化,效果较好。但您也可以使用 DeepSeek 等模型进行尝试。 对于模型的选用,没有强制必须用某个模型的说法。而是根据自己的习惯、实测的响应速度、生成质量、调用费用进行综合选择。比如 Doubao Function Call 模型,对于插件调用、Coze 内 json 格式输出比较擅长;MiniMax 处理文字速度很快;GLM 对于用户提示词的理解比较好。每个模型都有自己擅长的特点,而且每家模型都在不断的迭代。所以模型的选用,需要根据实测情况综合调整。一般可选择豆包·function call 32k,“function call”代表有着更好的 Coze 的工具调用能力,“32k”代表模型的上下文窗口大小,即模型在处理文本时能够考虑的单词或标记的数量。如果输出和输入的类型不是纯文本时,比如是 array、object 结构,请根据实测情况,考虑替换上豆包 function call 版本,其他的 LLM 可能会输出格式比较混乱。
2025-03-25
AI发展背后是哪些技术进步推动的,原理是什么?
AI 发展背后主要由以下技术进步推动: 1. 核心架构:Transformer 和 Diffusion 这两种架构分别在数据转换和数据向图像转换方面发挥了关键作用,构成了当前 AI 技术的基石。 2. 算力提升:自 2010 年以来,GPU 等计算资源的快速发展使算力得到空前爆发,为 AI 技术进步提供强大支持。 3. 人才网络:AI 领域的关键人才大多源自 Google 及其相关实验室和收购的公司,形成强大人才网络,推动了技术发展,并培养了一批领军人物,人才在不同公司间的流动和合作促进了 AI 技术的快速进步。 其原理在于:这些技术的协同作用使得 AI 能够更高效地处理和分析大量数据,实现更复杂的任务和功能。例如,强大的算力能够支持大规模的数据训练和模型优化,优秀的架构能够提高数据处理和模型表达能力,而人才的创新和合作则不断推动技术的突破和应用拓展。
2025-03-24
【深度拆解】ChatGPT-4o背后的技术革新:从语言模型到多模态跨越
ChatGPT4o 背后的技术革新具有重要意义。人类的感知多样,仅靠语言描述世界远远不够,多模态理解非常有用,能更全面学习世界、理解人类需求等。2023 年 9 月 GPT4v 发布,将大语言模型竞赛带入多模态模型时代,如 ChatGPT 能看图说话、画图,Google 的 Gemini 支持多种模态,但 OpenAI 常抢先发布。今年 5 月 OpenAI 发布 GPT4o,向智能体方向迈进,其是之前技术的集大成者,通过端到端神经网络混合训练视觉、语音和文本数据,平均音频输入反应时间为 300 毫秒,能感悟人类表达的情绪等。OpenAI 未公开 GPT4o 技术细节,唯一线索来自内部炼丹师的博客 AudioLM。此外,GPT4 是 OpenAI 的多模态工具,在编程任务中表现出色,ChatGPT 是用户友好界面,可与高级语言模型交互。2024 年 5 月 14 日 OpenAI 发布 GPT4o,效率高、价格降低、延迟缩短。9 月 16 日 OpenAI 推出 o1 系列模型,在复杂任务中表现优异,o1mini 适合编码任务,两个模型已在 ChatGPT 中提供,有免费或收费版本。
2025-03-09
Claude大模型背后是什么公司
Claude 大模型背后的公司是 Anthropic。Claude 系列在前段时间推出了 Claude3.5Sonnet 等模型,并且在代码生成等方面表现出色。同时,Anthropic 公司的 Claude 还具有较大的上下文窗口等特点。
2025-01-17
AI创作背后的版权陷阱
AI 创作背后存在诸多版权陷阱: 1. AI 绘画的版权归属存在争议。有人认为其只是从现有素材库拼接和重塑内容,创意来自原始艺术家;也有人认为 prompt 体现了创意。在新法律法规出台前,使用 AI 制作的图版权可能为公版,难以保证著作权。为确保版权,应将机器生成内容作为原始素材,突出“人类创作”部分。 2. 在数字化时代,AI 技术发展对现有知识产权法律体系构成挑战。如广州互联网法院的一起判决,标志着我国在知识产权保护方面的司法实践迈出重要一步。AI 在内容生成方面,对版权法的挑战主要体现在输入端训练数据合法性和输出端生成内容的版权属性问题。 3. 律师建议,AI 直接生成的东西在中国及海外通常不受法律保护。因此需要对其进行后期修改,如土豆人 tudou_man 作品后期部分占 30%40%,使用正版软件并完成版权链。大众对 AIGC 作品存在抵触,如认为其盗图抢饭碗,初学者使用 AI 时往往不做处理,而专业创作者会尽力规避瑕疵,导致创作成本较高。
2024-11-03
请给我推荐一个适合非技术人员学习的提示词工程手册,但是我不希望提示词工程手册太实操导向,需要包括背后的原理和逻辑,而不是只像一个公式一样的教给我
以下为您推荐适合非技术人员学习的提示词工程手册: 1. 小七姐:Prompt 喂饭级系列教程 小白学习指南(二) 强调对框架的理解和运用,介绍了多种提示词框架,如情境,并提供了学习的三步走:懂原理、找需求、用框架。 2. 19. RAG 提示工程系列(一) 虽然网络上提示工程资料众多,但 RAG 任务中提示工程的资料相对较少。此系列将带领大家了解 RAG 架构的概念、组成、痛点及提示词工程在其中的应用,并指导实操案例,帮助编写调试符合企业生产级标准的提示词。 3. VIRTUAL Claude 官方文档提示词工程最佳实践@未来力场编译版(中英对照) 指出提示词工程是一门实证科学,需要不断测试和迭代,包括开发测试用例、构建初版提示词、进行用例测试、优化提示词和分享完善后的提示词,同时不要忘记测试边缘情况。
2024-08-15
sora背后的核心技术是啥
Sora 是一种基于扩散模型的视频生成模型,其核心技术是一个预训练的扩散变换器。扩散模型是一种生成式模型,通过学习输入数据的分布来生成新的数据。在 Sora 中,扩散模型被用来学习视频的分布,从而生成新的视频。 Sora 的核心技术源自 Diffusion Transformers(DiT),它结合了 VAE、ViT、DDPM 技术,优化了视频生成。具体来说,Sora 将原始输入视频压缩成一个时空潜在表示,然后从压缩视频中提取一系列时空潜在补丁,以封装短时间间隔内的视觉外观和运动动态。这些补丁类似于语言模型中的单词标记,为 Sora 提供了用于构建视频的详细视觉短语。Sora 的文本到视频生成是通过扩散变换器模型执行的。从一个充满视觉噪声的帧开始,模型迭代地去除噪声并根据提供的文本提示引入特定细节。本质上,生成的视频通过多步精炼过程出现,每一步都使视频更加符合期望的内容和质量。 总的来说,Sora 的核心技术是一个预训练的扩散变换器,它能够解析文本并理解复杂的用户指令,然后通过扩散模型生成视频。
2024-06-10