Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

你好,我想训练一个自己的专属模型,比如说基于网页里面的问卷调查,我有答题的逻辑,网页的问卷调查项目每天都有非常多的不同的地方,但是又有相通的地方,我想让AI在我的逻辑之上能自我迭代自动答题,我该怎么办

Answer

如果您想基于网页问卷调查训练一个能在您的逻辑之上自我迭代自动答题的专属模型,有以下两种常见的技术方案:

  1. 训练专有大模型:
    • 优点:效果最好。
    • 缺点:成本高,训练和维护需要大量计算资源和专业知识;更新模型知识难度大,需要重新训练或微调,过程复杂耗时。
  2. 利用 RAG(检索增强生成)技术:
    • 例如选择 Baichuan2-7B-Chat 模型作为底模,配置模型本地路径和提示模板。在 Train 页面里选择 sft 训练方式,加载定义好的数据集,根据数据集大小和收敛情况设置学习率和训练轮次。使用 FlashAttention-2 可减少显存需求、加速训练速度;显存小的朋友可减少 batch size 并开启量化训练,内置的 QLora 训练方式好用。但需要用到 xformers 的依赖。根据聊天记录规模大小,训练时间少则几小时,多则几天。

此外,还有学生训练专属植物分类 AI 模型的案例供您参考。在北京市新英才学校的跨学科选修课“生化 E 家”中,老师和学生共同收集校园内不同树叶的照片,在 OpenInnoLab(浦育)里找到图像分类训练工具,建立植物分类模型,加入大量数据集进行训练,再用图像化编程将其套在程序里,形成简单的识别工具。在这个过程中,老师通过生活体验与学生讨论图像分类原理,学生从体验到实践操作,在不进行大量代码编程的情况下能够训练 AI 模型,并了解模型训练准确度与数据的关系。

Content generated by AI large model, please carefully verify (powered by aily)

References

这可能是讲 Coze 的知识库最通俗易懂的文章了

私人知识库中内容一般有两种:日常从互联网收集的优质信息个人日常的思考以及分享如果我想基于这套知识库打造个人专属的ChatGPT该怎么做呢?这里面常见的会有两种技术方案1.训练专有大模型2.利用RAG(检索增强生成)技术初次听到这两个名词你可能有点懵,不要慌,接下来我会通俗易懂的语言让你了解他们的原理。[heading3]训练专有大模型[content]KimiChat和ChatGPT等AI聊天软件为什么能够精准的回答问题,因为他们使用了整个互联网的语料进行了训练,从而拥有了整个互联网的知识。看到这里你应该知道我想要讲什么了,对,既然能用整个互联网的知识训练出KimiChat和ChatGPT等大模型,那我能不能使用我的知识库来训练一个专有的大模型呢?当然可以!而且这样的效果是最好的。但是这并不是当下主流的方案,因为他有以下几个缺陷:高成本:训练和维护一个大型专有模型的成本非常高,需要大量的计算资源和专业知识。更新难度:如果需要更新模型的知识,需要重新训练或微调模型,这可能是一个复杂且耗时的过程下面让我们来看另一个方案:RAG(检索增强生成)

创作:基于百川大模型向微信群大佬们虚心学习

选择Baichuan2-7B-Chat模型作为底模,配置模型本地路径,配置提示模板Train页面里,选择sft训练方式,加载定义好的数据集wechat和self_cognition。其中学习率和训练轮次非常重要,根据自己的数据集大小和收敛情况来设置,使用FlashAttention-2则可以减少显存需求,加速训练速度;显存小的朋友可以减少batch size和开启量化训练,内置的QLora训练方式非常好用。需要用到xformers的依赖具体命令参数如下:显存占用20G左右,耐心等待一段时间,请神模式开启...根据聊天记录规模大小,少则要几小时,多则几天,一个虚拟助手就能训练完成了。专不专业还有待大量标准问答验证,只是口气和习惯的模仿是有点意思的,若再加上[《克隆自己的声音——赛博分身必备技能》](http://mp.weixin.qq.com/s?__biz=MzI0MzA4NDkwMw==&mid=2247492147&idx=1&sn=efacb40a6c5610b6ed7368ba1d043f13&chksm=e970d93bde07502df2ff09ae3e700923ae285c21c7151282870d9e1db309da07ee5a49f609ed&scene=21#wechat_redirect)的效果,那几乎就传神了。不过这里还有很多细节工作需要完善:

桌游、英语分级、生物模型……这所学校的师生用生成式AI做了这些事情!

理科结合AIGC也有一些创新空间。在北京市新英才有一个跨学科选修课“生化E家”,融合了“生物+化学+工程”。在课上,有一个章节是生物的分类,初中生物老师吴冰讲了植物分类的基本知识,尔后提出了一个实际的问题:“我们学校里的植物都有哪些种类?”然后让学生自己去探究,学生们提出了自己的方法,比如用手机拍照识别,也可以在植物检索表上去检索。魏一然找到生物老师吴冰,提到了这个课程创新的可能性。在魏一然的推动下,生物老师吴冰和信息科技老师李萌联合起来,共同出现在教室内给学生授课,探讨如何做一个专门识别植物的工具,对植物进行识别、鉴定及分类。学生们在学校里收集了很多不同的树叶,然后拿到学校的机房里面拍照。老师们带学生在OpenInnoLab(浦育)里面找到图像分类训练工具,建立了一个植物分类模型,在模型中加入大量的数据集,然后去训练生成一个专属于新英才学校植物分类的模型,最后再用图像化编程去把它套在一个程序里面,就形成了一个简单的识别工具,学生在校园中点击界面中的按钮即可识别校园植物。在这个过程中,老师通过生活体验和学生讨论图像分类的基本原理,学生从体验到实践操作,在不进行大量的代码编程的情况下,学生也能够进行AI模型的训练,而且能了解AI模型训练的准确度与数据的关系,为进一步学习做准备。可以看到,在各种课程当中,创新空间非常大。魏一然强调,这些创新全部都是老师和学生自主驱动的,学校非常支持老师和学生们拥抱人工智能。

Others are asking
根据小学生试卷答题情况,分析需要加强复习的知识点,用什么AI工具
以下是一些可用于根据小学生试卷答题情况分析需要加强复习知识点的 AI 工具及相关建议: 1. ChatGPT:可以帮助分析答题中的语言表达、逻辑推理等方面的问题,从而确定语文、数学等学科中需要加强的知识点。 2. 国内模型如豆包:能提供一定的分析和指导。 3. 通义:对于英语等学科的答题情况分析有帮助,例如语法、词汇等方面的问题。 在使用这些 AI 工具时,您可以将试卷内容输入给工具,并要求其分析答题中的错误和不足之处,从而找出需要加强复习的知识点。但需要注意的是,不能完全依赖 AI 的分析结果,还需要结合教师的专业判断和教学经验。
2025-01-05
问卷调查分析报告应该怎么写
问卷调查分析报告通常包括以下几个部分: 1. 引言:介绍研究背景、目的和方法。 2. 样本和数据收集:描述研究对象和样本大小,以及数据收集的方法。 3. 结果:呈现研究结果,包括描述性统计和推论统计。 4. 讨论:对研究结果进行分析和解释,包括与已有研究的比较。 5. 结论:总结研究结论,并提出建议和未来的研究方向。 6. 参考文献:列出参考文献。 在撰写问卷调查分析报告时,需要注意以下几点: 1. 清晰的结构:报告应该有一个清晰的结构,包括引言、方法、结果、讨论和结论等部分。 2. 简洁明了的语言:使用简洁明了的语言,避免使用过于复杂的词汇和句子结构。 3. 准确的数据:确保数据的准确性和可靠性,避免数据错误和偏差。 4. 合理的分析:对数据进行合理的分析和解释,避免过度解读和错误的结论。 5. 适当的引用:在报告中适当引用相关的文献和研究,以支持研究结论和建议。 以上是撰写问卷调查分析报告的基本框架和注意事项,希望对你有所帮助。
2024-06-14
如何识别网页内容
识别网页内容通常可以通过以下步骤实现: 1. 内容识别:使用智能算法分析网页的 HTML 结构,确定网页的主要内容区域。 2. 文本提取:在识别出内容区域后,提取这些区域的文本内容,包括从 HTML 标签中获取可见文本,同时忽略脚本、样式和其他无需翻译的代码。 3. 预处理:对提取出的文本进行处理,清除不必要的空格、特殊字符和格式信息,进行标准化。 4. 翻译调用:将预处理后的文本拼接到 Prompt 模板中请求相关模型的 API 进行翻译。 5. 结果整合:翻译完成后,将原文和译文对照整合回网页、字幕中,常见的展示形式有原文保持不变,译文以悬浮框、下划线注释或平行文本呈现。 6. 用户界面交互:用户可通过鼠标悬停、点击等操作控制翻译的显示与否,工具会根据用户操作实时显示或隐藏译文。 另外,在获取网页内容时,初版提示词实验中对大模型对话产品的外链解析能力依赖较大,但这种方式易受平台反爬机制制裁。转换思路,通过用户浏览器以浏览器插件形式本地提取网页内容是一种稳定且经济的解决方案。开发时,可拿着初版提示词询问 AI 来确定需要插件获取哪些网页元素。例如 SeeAct 能力可以在多种不同网站上识别网页上的各种元素,执行不同任务。
2025-04-15
我想将常用的AI入口手机放在一张网页上,该如何设置waytoAGI页面
以下是关于将常用的 AI 入口放在一张网页上设置 WaytoAGI 页面的方法: 1. 点开链接就能看:不用注册,不用花钱,直接点击。 2. 想看啥就看啥:比如您想学 AI 绘画,就去看“AI 绘画”部分;想找 AI 工具,就去“工具推荐”部分。内容分得清清楚楚,想学啥都能找到。 3. 有问题还能问:如果看了还有不懂的,或者想跟别人交流,可以加入社群,大家一起讨论。 另外,关于使用 Cursor 制作您的第一个主页: 1. 在搞定一个非常简单的小游戏之后,可以做一个自己的个人介绍网站。可以先看看官网,比如 allinagi.com.cn、sboat.cn。假设要做一个《全 AI 自动驾驶的火星登陆飞船》项目,首先会有一个初步简单的项目介绍,比如 WaytoMars 是一个制造、运营全 AI 自动驾驶的火星登陆飞船公司品牌,有着领先全球的技术实力、人才优势,预计在 2030 年推出可承载上千人,五星豪华级的全 AI 自动驾驶的火星登陆飞船。有了项目介绍后,让 AI 帮助生成一个具有前端大师级审美、极富科幻感的网站首页。首先,新建一个 waytomars 文件夹并打开,在 AI 对话框中输入上述的话,一路等待 AI 制作以及加入您的修改意见即可。 2. 如何让别人看到您的作品预览:通过将项目文件夹整体上传,就可以生成一个临时浏览链接,在不需要域名和服务器的情况下让外部也能够看到您的作品。注意:如果发现 cursor 有所卡顿,注意是不是 AI 让您在终端区或者对话区确认重要操作,左下角将 ask every time 修改为 auto run 就可以全自动化了。 WaytoAGI 就是一个帮您快速入门 AI、学会用 AI 搞事情的“武器库”。不管您是完全不懂 AI 的小白,还是想用 AI 赚钱的普通人,它都能帮到您。AI 是未来的趋势,现在学一点都不晚,如果您想了解 AI、用 AI、甚至靠 AI 搞钱,WaytoAGI 就是您最该看的“AI 宝典”。
2025-04-14
我要根据PPT开发一个网页,请详细提供操作步骤和选择哪一个AI工具更合适。
以下是根据 PPT 开发网页的详细操作步骤以及适用的 AI 工具: 一、生成 PDF 1. 将您的文件转换为 PDF 格式,其他文件格式也可行,但 PDF 效果更佳。 2. 若希望在文章中加入图片,需将图片转换为 Markdown 格式。 网络图片:直接复制图片的 URL,右键图片选择复制 URL,然后用 Markdown 格式写入文档。 自己的图片:使用图床服务(如 https://sm.ms/)托管图片,生成公链。 3. 插入视频:先将本地视频上传到公网(如 B 站),在视频页面寻找“分享”按钮,点击“嵌入”或“嵌入代码”选项获取 URL,用 Markdown 格式写入。 二、适用的 AI 工具 1. 爱设计 网址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite 输入大纲和要点: 导入大纲和要点 输入主题自动生成大纲和要求 选择模版并生成 PPT 导出 2. MindShow 网址:https://www.mindshow.fun//home 输入大纲和要点: 导入大纲和要点 输入主题自动生成大纲和要求 选择模版并生成 PPT 导出 3. Process ON 网址:https://www.processon.com/ 输入大纲和要点: 导入大纲和要点: 手动复制(相对耗时) 导入方式:复制最终大纲内容到本地 txt 文件,将后缀改为.md(若看不见后缀可自行搜索开启),打开 Xmind 软件导入 md 文件,在 Process ON 导入 Xmind 文件。 输入主题自动生成大纲和要求:新增思维导图,输入主题点击 AI 帮我创作。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版再点击下载。若喜欢使用且无会员,可在某宝买一天会员。
2025-04-13
AI的P图网页
以下为您介绍一些 AI 的 P 图网页: 1. 无界 AI:网址为 https://www.wujieai.cc/ ,新用户扫码注册可领取积分。基础关键词包括女生(如、白色蜘蛛战衣、金色短发等)和男生(如蜘蛛侠、笑容等)的相关描述,还有关键词分类(如人物、环境、光照、画幅视角、画质提升、画面风格等)。 2. ILLUMINARTY:网址为 https://app.illuminarty.ai/ ,用于鉴别 AI 绘图性质,但在测试中可能存在误判。 3. Adobe Photoshop 网页版:https://www.adobe.com/products/photoshop.html ,其中一项新技术能自动选择图像中的所有对象,使您更高效、准确和可控地编辑所选区域。您可以在此尝试:https://photoshop.adobe.com/id?intent=object_based_editing
2025-04-11
生成可视化网页的 prompt
以下是关于生成可视化网页的 prompt 相关内容: 1. 利用 AI 将 PDF 一键变成可视化网页: 整体思路来自归藏。 目前只有 Claude 3.7 Sonnet 效果最好,可将 prompt 发给能使用它的产品,如 Claude 自己的官网、trea 海外版、cursor 等。 Prompt 基本复制可用,但需将作者信息和媒体资源部分改成自己的内容。媒体资源若为网上现成图片,可复制图像链接;若为自己的图片,可使用图床服务生成公链,以 Markdown 格式贴到媒体资源处。 2. 为生成更漂亮的可视化网页编写的工具: 解决了模型生成结果过于随机的问题。 可在网页上自定义基础样式或随机生成,直到满意。 工具网址:https://60mcp23013.yourware.so/ 3. 3 月 25 日 AI 资讯汇总中的相关用例: 动态图表制作:输入“请给我输出红楼梦的人物关系,并与 html 的形式输出可视化图表,可以参考我给你的图表形式”,可添加参考的个性化图表示例,以 html 附件形式上传。 提供文案输出可视化网页:输入“来自归藏大大 我们输入我们的 AI 周刊内容”。 小红书卡片:输入“来自向阳乔木大大的提示词”。
2025-04-10
如何将智能体发布为网页
要将智能体发布为网页,您可以按照以下步骤进行操作: 1. 在相关平台(如阿里云百炼)创建智能体应用,准备好相关知识库文件,设定人设与回复逻辑。 2. 将已经发布的工作流添加到创建好的智能体,并进行测试。 3. 测试完成后,选择智能体的右上角,填写发布信息,选择发布渠道为网页,确认发布,等待审核完成。 4. 发布成功后,点击分享,复制访问链接即可。 需要注意的是,大模型存在一定局限性,智能体应用能够弥补这些不足,适用于有企业官网等渠道期望为客户提供产品咨询服务、缺少技术人员开发大模型问答应用等场景。智能体应用的典型场景包括私有领域知识问答、个性化聊天机器人、智能助手等。
2025-03-31
准确的讲述垂直大模型的概念,国内外的应用现状、场景,发展趋势,最好能附带图片。内容尽量详细、逻辑通顺。
垂直大模型是专注于特定领域的大模型,例如小语种交流、临床医学、AI 蛋白质结构预测等。 在国内,大模型分为通用模型如文心一言、讯飞星火等,处理自然语言;也有垂直模型专注特定领域。 大模型因其强大的语言理解和生成能力,在多个领域和应用场景中表现出色。比较火的应用场景包括: 1. 文本生成和内容创作:撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手:提供客户服务、日常任务提醒和信息咨询等服务。 3. 编程和代码辅助:代码自动补全、bug 修复和代码解释。 4. 翻译和跨语言通信:促进不同语言背景的用户之间的沟通和信息共享。 5. 情感分析和意见挖掘:为市场研究和产品改进提供数据支持。 6. 教育和学习辅助:创建个性化的学习材料、自动回答学生问题和提供语言学习支持。 7. 图像和视频生成:如 DALLE 等模型可以根据文本描述生成相应的图像,甚至在未来可能扩展到视频内容的生成。 8. 游戏开发和互动体验:创建游戏中的角色对话、故事情节生成和增强玩家的沉浸式体验。 9. 医疗和健康咨询:理解和回答医疗相关的问题,提供初步的健康建议和医疗信息查询服务。 10. 法律和合规咨询:帮助解读法律文件,提供合规建议,降低法律服务的门槛。 关于发展趋势,尽管当前市场以基础大模型为主,但将大模型与行业专业知识结合,以满足不同行业的需求,成为未来发展的关键。例如腾讯研究院的《行业大模型调研报告》指出,如何将大模型与行业专业知识结合是重点。同时,在发展过程中也需要注意其在隐私、安全和伦理方面的挑战。 很抱歉,暂时无法为您提供相关图片。
2025-04-11
中国AI投资逻辑
中国 AI 投资存在以下逻辑: 1. 大规模算力投资:会使公司转变为重资产模式,在瞬息万变的科技市场中可能对公司估值产生不利影响,进而影响投资人收益。获取和使用高性能算力成本高昂,是重大决策。 2. 投资圈现象:许多投资人给大模型创业者看似矛盾的策略,如招募名校人才、组织产品发布会、推出产品、进行下一轮融资,但避免购买算力。多数创业公司选择规避算力风险抬高估值,这可能成为突破的绊脚石,类似荷兰郁金香泡沫,当风口过去,真实收入将成关键。 3. 行业趋势:2024 年,AI 仍是最强吸金赛道。国内 AI 行业融资总金额增加但事件数下降,马太效应明显,资本更青睐热点和高成熟度赛道。智能驾驶在细分赛道中表现突出,AI+教育、游戏、医疗等赛道投资总额增长。政策方面,政府积极推进,国家队频繁出手投资。 4. 发展历程:OpenAI 坚持大模型方向成功,前瞻性投资算力为其奠定基础,其成功是战略眼光和长期投入的结果,背后是惊人的资源调动。中国企业工程优化能力强,人们对国内大模型快速应用充满期待。
2025-03-27
教我工作流的底层逻辑跟如何入门学习工作流
工作流的底层逻辑及入门学习方法如下: 工作流通常由多个节点构成,节点是其基本单元,本质上是包含输入和输出的函数。常见的节点类型包括: 1. LLM(大语言模型):使用输入参数和提示词生成处理结果。 2. Code(代码):通过 IDE 编写代码处理输入参数,并返回输出值。 3. Knowledage(知识库):根据输入参数从关联知识库中召回数据,并返回。 4. Condition(条件判断):ifelse 逻辑节点,用于设计工作流内的分支流程,根据设置条件运行相应的分支。 5. Variable(获取变量):从 Bot 中获取变量作为参数在工作流中使用。 6. Database(数据库):在工作流中使用提前配置在 Bot 数据库中的数据。 以下是一些入门学习工作流的示例和资源: 1. 对于生成绿幕素材和绿幕素材抠图的工作流,您可以下载工作流文件拖入 ComfyUI 中自动加载,然后对照相关说明进行学习。工作流链接:https://pan.quark.cn/s/01eae57419ce 提取码:KxgB 2. 对于 Glif 图像流制作冰淇淋甜品地标,您可以按照以下步骤学习: 1 分钟交作业:点击网址 https://glif.app/@jianStuart/glifs/cly85fy2i000cqe87zcu72i5l ,选一张主体区分度高且主体为地标的图,上传图片并点击相应按钮,多点几次选一张满意的即可。 5 分钟学习制作:点击顶上的“build”按钮,点击“+”加号,选择“img input”,再点下面的“+”加号,选“image generator”,把提示词放进节点,打开“advanced controls”,修改参数,勾选“Enable input image”并改参数。 3. 对于 Coze 平台的工作流,官方有现成的教程参考: 海外参考文档:https://www.coze.com/docs/zh_cn/use_workflow.html 国内参考文档:https://www.coze.cn/docs/guides/use_workflow 国内版本还提供了一些示例,建议跟着实操一遍,如: 搜索新闻:https://www.coze.cn/docs/guides/workflow_search_news 使用 LLM 处理问题:https://www.coze.cn/docs/guides/workflow_use_llm 生成随机数:https://www.coze.cn/docs/guides/workflow_use_code 搜索并获取第一个链接的内容:https://www.coze.cn/docs/guides/workflow_get_content 识别用户意图:https://www.coze.cn/docs/guides/workflow_user_intent
2025-03-24
我想写一部都市玄幻小说,已经有了简单的大纲。请问使用哪款AI工具?又没有 AI味。快速的写出真人作者的小说意境。并且上下逻辑清晰30万的长篇小说。列出免费工具。
以下为您推荐两款可用于写都市玄幻小说的免费 AI 工具及相关方法: 1. Coze: 工作流核心节点: 用 Bing 搜索标题相关的内容。 用程序将搜索结果结构化(不熟悉程序的可忽略或直接复制文中的代码)。 用大模型草拟大纲,包括标题、主旨、世界观、主要角色、小说背景、情节概要。 再用大模型来写文章。 输出文章内容。 2. 与 AI 交互写作(如南瓜博士的经验): 确定主题:不写科幻,用非常规视角,如以猫为第一人称写爱情小说。与 AI 讨论主题,挑选 AI 提供的调味料,明确主题。 构思情节:先刻画人物,如喜欢书店店员艾拉这个人物,使其更丰满,再设计故事线。 希望这些工具和方法能对您创作小说有所帮助。
2025-03-19
不能用APP思维、传统数字平台思维去做大模型创业和人工智能创业,二者在底层逻辑和商业模式等方面完全不同
大模型创业和人工智能创业与 APP 思维、传统数字平台思维在底层逻辑和商业模式等方面存在显著差异。大模型和人工智能创业更注重数据的深度处理、算法的优化创新以及对复杂问题的解决能力。相比之下,APP 思维通常侧重于用户界面和功能的设计,以满足特定的用户需求;传统数字平台思维则更多关注平台的搭建和用户流量的获取与运营。在大模型和人工智能领域,技术的突破和创新是关键,需要投入大量资源进行研发,并且要面对更高的技术门槛和不确定性。而 APP 和传统数字平台的创业相对更侧重于市场推广和用户体验的优化。总之,不能简单地用 APP 思维和传统数字平台思维来指导大模型和人工智能创业。
2025-03-07
AGI底层逻辑
AGI(通用人工智能)的底层逻辑包含以下方面: 在公众传播层面,相关名词常被混用,但底层是 Transformer 结构。Transformer 底层是 function loss 损失函数,是一个大参数(千亿级别)的回归方程。其通过回归方程的 Function loss 拟合 A 到 B 的 mapping 关系,实现数据集的压缩与还原。在一定 prompt condition 情况下,Transformer 能 repeat 曾经出现过的数据内容,从而实现“生成”能力。大语言模型在两个数据集压缩后,能解释两个数据集之间地带的“连续”能力。部分人觉得 LLM(大语言模型)具有 AGI 潜力,但 LeCun 反对。同时,大语言模型与 Alpha Go 存在差异,Alpha Go 是一个增强学习模型,学习结果会调整模型自身参数,具有推理能力,而大语言模型在这块很弱。Transformer 决定 LLM 是一个生成式模型。
2025-03-07