Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

除了LLM,就没有AI模型了吗?

Answer

除了 LLM ,还有很多其他类型的 AI 模型。以下为您详细介绍:

  1. 生成式 AI:可以生成文本、图片、音频、视频等内容形式。其中生成图像的扩散模型就不是大语言模型。
  2. 机器学习:电脑找规律学习,包括监督学习、无监督学习、强化学习。
    • 监督学习:有标签的训练数据,算法的目标是学习输入和输出之间的映射关系,包括分类和回归。
    • 无监督学习:学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。
    • 强化学习:从反馈里学习,最大化奖励或最小化损失,类似训小狗。
  3. 深度学习:一种参照人脑有神经网络和神经元的方法(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。
  4. 谷歌的 BERT 模型:可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类。

2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。生成式 AI 生成的内容,叫做 AIGC 。

Content generated by AI large model, please carefully verify (powered by aily)

References

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。

Others are asking
生成带有中文字体的海报,有哪些ai工具推荐
以下是为您推荐的生成带有中文字体海报的 AI 工具: 1. 即梦:上线了 2.1 图片模型,可以生成中英文字体,海报可以直出。能生成海报、带字表情包、漫画等。网址:https://jimeng.jianying.com/aitool/image/generate 2. coze:网址:https://www.coze.cn/template/project/7442540084944994344? 3. 美图 WHEe:支持文字可编辑图层,用户可拖动文字位置、更改字体并控制排版。目前仍在内测中,支持体验申请。内测申请:https://oc.meitu.com/whee/5924/index.html 官网:http://whee.com
2025-04-16
CAD画图AI
以下是关于画 CAD 图的 AI 工具及 AI 生成 CAD 图相关资料的介绍: 画 CAD 图的 AI 工具: 1. CADtools 12:这是 Adobe Illustrator 的插件,添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:Autodesk 开发的云端 3D CAD/CAM 软件,集成了 AI 功能,能创建复杂几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 主流 CAD 软件的生成设计工具:如 Autodesk 系列、SolidWorks 等,可根据设计目标和约束条件自动产生多种设计方案。 AI 生成 CAD 图的相关资料获取途径: 1. 学术论文:通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库搜索。 2. 专业书籍:查找与 AI 在 CAD 领域相关的专业书籍。 3. 在线课程和教程:参加 Coursera、edX、Udacity 等平台上的 AI 和 CAD 相关课程,在 YouTube 等视频平台上查找教程和演示视频。 4. 技术论坛和社区:加入如 Stack Overflow、Reddit 的 r/AI 和 r/CAD 等,与专业人士交流学习,关注相关博客和新闻网站。 5. 开源项目和代码库:在 GitHub 等开源平台上探索 AI 和 CAD 相关项目,如 OpenAI 的 GPT3、AutoGPT 等在 CAD 设计中的应用。 6. 企业案例研究:研究 Autodesk、Siemens 等公司在 AI 在 CAD 设计中的应用案例。 需要注意的是,这些工具通常需要一定的 CAD 知识和技能才能有效使用。对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。在学习和研究 AI 生成 CAD 图的过程中,了解相关的基础知识和技术细节非常重要。随着 AI 技术的不断发展,AI 在 CAD 设计中的应用将会越来越广泛,为设计师和工程师提供更多的辅助和支持。
2025-04-16
想让AI写一篇8000字的毕业论文,应该如何写提示词
以下是关于让 AI 写一篇 8000 字毕业论文的提示词相关内容: 云舒在读懂 Claude 论文的过程中,使用了“论文深度剖析导师”提示词,并借助具有强大多模态能力和长上下文的 Gemini2.5 来辅助。具体操作包括用 PrintFriendly 把论文打印成 PDF 后交给 Gemini 阅读。 这个提示词在很多场景都有出色表现,例如: 1. 老本行升级:能深度理解公众号文章、专业论文、书籍、在线课程等各种文本。 2. 求职分析利器:可拆解岗位描述,并基于此提供求职攻略和简历撰写建议。 3. 自我介绍“测谎仪”:能分辨出虚假或夸大的自我介绍。 4. PPT 阅读神器:能严肃分析吃瓜 PPT 和小红书报告等。 5. 长视频“粉碎机”:可逐帧拆解视频,理解其中的内容。 6. AI 绘画“解码器”:能反推好看的 AI 绘画的提示词。 7. 播客“精炼师”:能抓取播客主线并进行分析,标注可能的错误。 您可以参考上述内容,根据毕业论文的具体主题和需求,来构思适合的提示词。相关提示词的链接为:
2025-04-16
AI硬件
以下是关于 AI 硬件的相关信息: 扣子 AI 工坊将于 3 月 1 日在深圳举办硬件专场活动,推出全套硬件方案,将 DeepSeek 最新模型接入 AI 硬件。活动亮点包括硬件实验室、硬件场景分享会、开发者体验营、硬件厂商需求墙等。分享嘉宾有曾德钧、刘琰、颜伟志等。可扫描二维码报名,报名时间即日起至 2025 年 2 月 26 日,现场有礼品。 2025 年 AI 指数报告指出,硬件的进步在推动 AI 发展中起着关键作用,特别是更强大和高效的 GPU 的发展。 Will's GenAI 硬件榜 2024 年 8 月发布,榜单受众为 GenAI 硬件创始人、投资人、从业者等,以北美市场的销量、影响力为主,本次更新了相关数据和排序标准,更多榜单可通过链接访问,数据来源包括 google、tiktok、twitter、亚马逊等。对于榜单内容有疑问或想合作的可通过微信或文末留言交流。
2025-04-16
我想要完成一张海报,要求可以正确展示中文字,我应该用哪些AI网站
以下是一些可以帮助您完成一张能正确展示中文字的海报的 AI 网站: 1. 无界 AI:网址为 https://www.wujieai.cc/ 。其做图逻辑类似于 SD,优势在于国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。在无界 AI 中,您可以选择皮克斯卡通模型,比如在朋友圈 po 图时,画幅比例选择 1:1。 2. 小红书:是较好的海报参考网站,爆款多,对零基础和找爆款友好,还能找到设计思路和大师作品,但要避免参考百度无差别图片。 3. 花瓣网:可搜索元旦海报,收录有大厂海报。 此外,在制作海报时,您可以参考以下流程: 1. 确定主题与文案:借助 ChatGPT 等文本类 AI 工具协助完成文案。 2. 选择风格与布局:根据需求选择想要完成的风格意向,灵活调整画面布局。 3. 生成与筛选:使用无界 AI 等工具,输入关键词,生成并挑选一张满意的海报底图。 4. 配文与排版:将上述素材进行合理排版,得到成品。 在使用 AI 生成海报时,明确主题和色彩倾向是关键,其他如艺术风格、营造和构图要素为可选项,通过头脑风暴展开设计思路。
2025-04-16
哪个AI解析表格的能力最强?
目前在解析表格能力方面,以下几种 AI 表现较为出色: 1. LlamaParse 高级模式,具有最优化适配能力。 2. Sonnet3.7,这是 Anthropic 的新模型,在文档解析上表现卓越。 3. 基于 Gemini 2.0 的智能代理解析,解析效果惊艳。 此外,Mistral AI 发布的 Pixtral Large 123B 开源模型在图表、文档和图像处理方面能力较强,也支持表格等多种格式输入和专业的图像与文档解析。但需要注意的是,不同的 AI 在不同的应用场景和数据特点下,其表格解析能力的表现可能会有所差异。
2025-04-16
LLM应用可观测性
LLM 应用的可观测性主要体现在以下方面: LangChain:借助 LangSmith 提供更好的日志、可视化、播放和跟踪功能,以便监控和调试 LLM 应用。LangSmith 是基于 Web 的工具,能查看和分析细化到 class 的输入和输出,还提供跟踪功能,用于记录和展示 LLM 应用的执行过程和状态,以及 LLM 的内部信息和统计数据。 Langfuse:为大模型应用提供开源可观测性和分析功能,在可视化界面中可探索和调试复杂的日志和追踪,并使用直观的仪表板改善成本、降低成本、减少延迟,提高响应质量。 此外,微软(中国)的《面向大模型的新编程范式》报告中也强调了在线监控和可观测性的重要性。
2025-04-11
LLM模型响应时间较长,如何处理超时时间问题
处理 LLM 模型响应时间过长导致的超时问题,可以考虑以下方法: 1. 参数有效调整:这是一种新颖的微调方法,通过仅训练一部分参数来减轻微调 LLM 的挑战。这些参数可能是现有模型参数的子集,或者是一组全新的参数,例如向模型添加一些额外的层或额外的嵌入到提示中。 2. 优化提示设计:采用合适的提示方法,如零样本提示、一次性提示、Fewshot prompting 等。零样本提示是只给出描述任务的提示;一次性提示是让 LLM 执行任务的单个示例;Fewshot prompting 是让 LLM 执行任务的少量示例。同时,可以使用结构化模式设计提示,包含上下文、问题示例及相应答案等组件,以指示模型应如何响应。 3. 避免频繁调整某些参数:尤其是 Top K 和 Top P,不需要经常对其进行调整。 4. 关注模型响应质量:即使有良好的提示设计,模型输出仍可能不稳定,需要持续关注和优化。 5. 考虑成本和时间:微调大型模型可能耗时且成本高,为大模型提供服务也可能涉及额外麻烦和成本,需要综合评估和优化。
2025-04-11
linux下安装 anythingLLM
以下是在 Linux 下安装 AnythingLLM 的相关指导: 1. 安装地址:https://useanything.com/download 。 2. 安装完成后会进入配置页面,主要分为三步: 第一步:选择大模型。 第二步:选择文本嵌入模型。 第三步:选择向量数据库。 3. AnythingLLM 中有 Workspace 的概念,可以创建自己独有的 Workspace 与其他项目数据进行隔离。 首先创建一个工作空间。 上传文档并且在工作空间中进行文本嵌入。 选择对话模式,提供了 Chat 模式(大模型会根据自己的训练数据和上传的文档数据综合给出答案)和 Query 模式(大模型仅仅会依靠文档中的数据给出答案)。 4. 完成上述配置后,即可与大模型进行对话。 此外,在 GitHubDaily 开源项目列表 2023 年复盘的 AIGC 部分中,也有关于 AnythingLLM 的介绍: 是一个可打造成企业内部知识库的私人专属 GPT!可以将任何文档、资源或内容转换为大语言模型(LLM)知识库,使得在对话过程中可引用到里面的内容。 本文的思路来源于视频号博主黄益贺,作者按照他的视频进行了实操,并附加了一些关于 RAG 的额外知识。
2025-03-27
anythingLLM本地部署
以下是关于本地部署大模型以及搭建个人知识库的相关内容: 一、引言 作者是大圣,一个致力于使用 AI 工具将自己打造为超级个体的程序员,目前沉浸于 AI Agent 研究。本文将分享如何部署本地大模型及搭建个人知识库,读完可学习到如何使用 Ollama 一键部署本地大模型、了解 ChatGPT 信息流转、RAG 概念及核心技术、通过 AnythingLLM 搭建本地化数据库等。 五、本地知识库进阶 如果想要对知识库进行更灵活掌控,需要额外软件 AnythingLLM,它包含所有 Open WebUI 能力,并额外支持选择文本嵌入模型和向量数据库。 安装地址:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步: 1. 第一步:选择大模型。 2. 第二步:选择文本嵌入模型。 3. 第三步:选择向量数据库。 构建本地知识库: AnythingLLM 中有 Workspace 概念,可创建独有 Workspace 与其他项目数据隔离。 1. 首先创建一个工作空间。 2. 上传文档并在工作空间中进行文本嵌入。 3. 选择对话模式,提供 Chat 模式(大模型根据训练数据和上传文档综合给出答案)和 Query 模式(大模型仅依靠文档数据给出答案)。 配置完成后可进行测试对话。 六、写在最后 作者推崇“看十遍不如实操一遍,实操十遍不如分享一遍”。如果对 AI Agent 技术感兴趣,可联系作者或加其免费知识星球(备注 AGI 知识库)。 本文思路来源于视频号博主黄益贺,作者按照其视频进行实操并附加了一些关于 RAG 的额外知识。
2025-03-26
LLM的原理
LLM(大语言模型)的工作原理如下: 以“我今天吃了狮子头和蔬菜”这句话为例,在 Transformer 中,会由 Attention 层对其加入更多信息补充,如“狮子头是一道菜”“今天是星期六”等,这些补充信息作为输入给到下一个 Attention 层,层与层之间,哪些信息补充、保留、传递,由模型自主学习,最终模型把海量数据以关系网形式“消化”并保留重要相关性。 形象地说,就像人阅读文章时的连贯性注意力过程,在阅读理解时,脑子里会消化吸收记忆,记忆的不是点状知识,而是网状经验。 大模型以词向量和 Transformer 模型学习海量知识,把知识作为向量空间中的关系网存储,接受输入时通过向量空间中的匹配进行输出。 观察大模型回复,是一个字一个字流式输出的,因为大模型确实在一个字一个字地推理生成内容。比如输入法输入联想,根据输入的单个字推测下一个字,加入上下文能帮助模型理解下一个字。但存在两个问题:一是全量数据计算算力吃不消,二是仅算字的概率易被不相干信息干扰,此时词向量机制和 Transformer 模型中的 Attention 自注意力机制解决了难题。 另外,RAG 对大语言模型的作用就像开卷考试对学生,事实性知识与 LLM 的推理能力相分离,被存储在容易访问和及时更新的外部知识源中,分为参数化知识(模型训练中学习得到,隐式储存在神经网络权重中)和非参数化知识(存储在外部知识源,如向量数据库中)。
2025-03-25
notebookllm
NotebookLM 是谷歌推出的一款工具,具有以下特点和用途: 有人称它为笔记工具,有人说它是 AI 学习工具,还有人认为它是播客生成器。 只要上传文档、音频或感兴趣的网页链接,如 YouTube 等,就能轻松生成专业的播客。播客中两个主持人的对话生动自然,包含各种人类的语气和行为。 是 Google AI Lab 开发的笔记应用,基于 Gemini 1.5 Pro 的长文本理解和多模态能力。用户可通过上传文件或链接快速生成笔记和音频内容,适合教育和研究等场景。尽管产品界面设计一般,但其强大的文本理解能力在处理复杂内容时表现突出。支持协作,适合整理公众号文章、编写书稿等多种用途。 体验地址:https://notebooklm.google/
2025-03-22
DB gpt具备商用化能力了吗?
目前 DB GPT 尚未具备成熟的商用化能力。其在技术、性能、安全性、稳定性等方面可能还存在一些需要进一步完善和优化的地方。商用化需要满足一系列严格的标准和要求,包括但不限于高效的处理能力、准确的结果输出、可靠的安全性保障以及良好的用户体验等。
2025-02-17
dify知识库能接入企业微信客服 了吗?
Dify 可以接入企业微信,以下是接入的步骤: 1. 创建聊天助手应用:在 Dify 平台创建基础编排聊天助手应用,获取 API 密钥和 API 服务器地址。 2. 下载 Dify on WeChat 项目:下载并安装依赖。 3. 填写配置文件:在项目根目录创建 config.json 文件,填写 API 密钥和服务器地址。 4. 把基础编排聊天助手接入微信:快速启动测试,扫码登录,进行对话测试,可以选择源码部署或 Docker 部署。 5. 把工作流编排聊天助手接入微信:创建知识库,导入知识库文件,创建工作流编排聊天助手应用,设置知识检索节点和 LLM 节点,发布更新并访问 API。 6. 把 Agent 应用接入微信:创建 Agent 应用,设置对话模型和添加工具,生成 API 密钥,填写配置文件,启动程序并进行测试。 更多内容请访问原文:https://docs.dify.ai/v/zhhans/learnmore/usecases/difyonwechat
2025-02-05
AI可以做营销推广了吗
AI 可以用于营销推广,以下是一些相关的案例和方法: 案例: 1. 分众传媒携手阿里通义大模型,部署分众专属的营销垂类大模型,推出“众智 AI”产品,赋能中小广告主解决营销难题,精准高效投放线下广告流量,建立品牌认知和营销推广。 2. 大淘宝设计部在品牌超级符号映射、品牌 IP 形象 AI 生成、传播&投放、大促营销等多个场景中应用 AI,例如根据品牌符号模型训练生成主视觉、生成定制化 IP 形象、生成传播和大促相关的海报等。 方法: 1. 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况,快速识别关键信息。 2. 关键词优化:AI 分析和推荐高流量、高转化的关键词,优化产品标题和描述,提高搜索排名和可见度。 3. 产品页面设计:AI 设计工具根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:AI 文案工具撰写有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:AI 图像识别技术选择或生成高质量的产品图片,展示产品特点。 6. 价格策略:AI 分析不同价格点对销量的影响,制定有竞争力的价格策略。 7. 客户反馈分析:AI 分析客户评价和反馈,优化产品和服务。 8. 个性化推荐:AI 根据用户购买历史和偏好提供个性化产品推荐,增加销售额。 9. 聊天机器人:AI 驱动的聊天机器人提供 24/7 客户服务,解答疑问,提高满意度。 10. 营销活动分析:AI 分析不同营销活动效果,了解哪些活动更能吸引顾客并产生销售。 11. 库存管理:AI 预测需求,优化库存管理,减少积压和缺货情况。 12. 支付和交易优化:AI 分析不同支付方式对交易成功率的影响,优化支付流程。 13. 社交媒体营销:AI 帮助在社交媒体上找到目标客户群体,精准营销提高品牌知名度。 14. 直播和视频营销:AI 分析观众行为,优化直播和视频内容,提高参与度和转化率。
2025-01-16
AI现在可以完成插画设计了吗
AI 现在可以完成插画设计。生成式 AI 能够为游戏创建 2D 艺术、纹理、3D 模型,并协助关卡设计,在营销中也有望取代库存艺术、产品摄影和插图,且已在网页设计、室内设计和景观设计中有所应用。 Midjourney 等 AI 绘画技术在设计工作中有多种应用,比如快速草图、自动化创意设计、自动化颜色匹配、自动化插图绘制等,能帮助设计师更快速、更高效地完成设计工作。 Recraft 正在构建包含图像生成及各种用 AI 进行的图像编辑和设计编辑的技术部分,以及能让用户在其中完全解决任务而无需在其他工具间切换的工作流程部分。不过当前行业和模型、技术尚未达到理想水平,设计师要获得所需结果仍有难度。 同时,AI 行业在与插画师社区的关系处理上存在问题,未来希望能有所改变,让艺术界从 AI 中获得足够价值。
2025-01-16
gpt4 可以免费了吗
GPT4 并非完全免费。免费用户有一定的对话次数限制,付费 Plus 用户可以批量对话。目前 ChatGPT 官网有两个版本,GPT3.5 是免费版本,而 GPT4 若要使用更多功能则需要升级到 PLUS 套餐,收费标准是 20 美金一个月。此外,微软 Copilot iOS 版中 GPT4 可免费使用,功能类似 ChatGPT 和 DALLE 3 图像生成,并提供 Image Creator 功能,可从文本提示创建海报。
2024-12-30
AI能力到达AGI了吗
目前 AI 能力尚未达到 AGI(通用人工智能)。汪华老师认为此次 AI 的变革量级,100%能够抵达与移动互联网处于同一级别的第一个阶段,50%有可能发展至与蒸汽机的出现同量级的第二个阶段,但能否到达 AGI 的第三个阶段尚不明确。同时,学习笔记中也提到 AI 分为 ANI(弱人工智能)和 AGI,ANI 得到巨大发展但 AGI 还没有取得巨大进展。
2024-12-26
如何让大模型记住实时时间
要让大模型记住实时时间,可以通过以下方式: 1. 利用本地运行的代码,如一段 Python 代码,在本地的 Python 环境中运行来获取所在时区的时间。 2. 通过系统提示词告知大模型安装了提供实时时间的 MCP 工具,如 Time 工具。大模型结合系统提示词和用户询问,经过上下文思考,得出结论并连接 MCP 服务器中的时间服务器来获取实时时间。 3. 在安装 MCP 服务器的过程中,通过特定的 Python 脚本(如 github:https://github.com/modelcontextprotocol/servers/tree/main/src/time 中的 server.py 代码)来实现获取相应的时间。 在实际操作中,还包括一些准备工作,如把 Cline 模型进行切换,修改 Cline 的模型指向 Cloudflare 的 URL,选择 OpenRouter 上的模型(如 OpenAI Compatible、Deepseek V3 等),在 Cline 对话框中选择 act 模式进行相关操作等。
2025-04-16
有什么合适的工具将图片内容转换为3D模型
以下是一些可将图片内容转换为 3D 模型的工具: 1. Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速的 2D 到 3D 转换,提供 AI 驱动的精准度和细节。 2. Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成。用户上传图片并描述所需材质和风格,可生成高质量 3D 模型。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域的模型生成,用户上传图片或输入文本提示词即可生成 3D 模型。 5. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 此外,还有一种将单张图片生成精致 3D 小屋场景的工具链:Midjourney(生成等距图像)→Trellis(图像转 3D 模型)→Browser Lab(浏览器内 3D 编辑器)。步骤如下: 1. 使用 Midjourney 生成等距 3D 场景,提示词示例:3D isometric bedroom with a bed and desk。(DALLE 3 也可测试) 2. 用 Trellis 工具将图像转为 3D 模型(支持 Tripo 3D 等其他工具)。工具地址: 3. 下载生成的 3D 模型(GLB 文件或高斯分布文件),然后导入 Browser Lab 编辑器中进一步编辑。编辑器地址: 这些工具通常具有用户友好的界面,允许用户通过简单操作生成 3D 模型,无需专业 3D 建模技能,可广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。
2025-04-16
怎么写系统提示词让大模型记住人设、当前时间等预置内容
以下是关于如何写系统提示词让大模型记住人设、当前时间等预置内容的相关信息: 对于让大模型记住当前时间等预置内容: 1. 时间锚定:明确当前日期和知识更新时间,让模型始终了解“现在”是何时。 2. 知识边界:设定可靠信息的截止日期,避免使用过时信息,明确知识局限性。 3. 时间适应性:指导回答不同时期事件的方法。 4. 透明度:允许说明知识局限性,在面对超出知识范围的问题时能够坦诚相告。 对于让大模型记住人设: 在输入防护提示词框架中融入人格设定元素,赋予模型拟人化特征。在整个提示词结构中,将人格设定放置在尾部,利用大型模型的注意力机制,使模型能够更加关注其人格设定以及头部的内容(头部内容主要描述了整个工作流程),从而加固输入防护的审核能力以及人格设定的稳定性。 此外,在提示词落地案例中,输入环节的设计构建了全面的提示词框架,包含伦理审查以及针对不同类型攻击的审查规则。随着时间推移和不断迭代,审查系统可能会扩展到更多类别。
2025-04-16
如何写chatbot的系统提示词,让大模型记住人设、当前时间等预置内容
以下是关于如何写 chatbot 系统提示词,让大模型记住人设、当前时间等预置内容的一些方法和要点: 1. 时间认知体系: 时间锚定:明确当前日期和知识更新时间,让模型始终了解“现在”是何时。 知识边界:设定可靠信息的截止日期,避免使用过时信息,明确知识局限性。 时间适应性:指导回答不同时期事件的方法。 透明度:允许说明知识局限性,在面对超出知识范围的问题时能够坦诚相告。 2. 模型人设信息:通过提示词为模型设定清晰的人设。 3. 能力范围:明确模型的服务能力场景,可用于回答用户“模型能做什么”的疑问。 4. 链接与媒体处理限制: 能力限制:明确模型无法直接访问外部链接和媒体。 交互指导:引导模型在遇到相关请求时做出适当解释。 替代方案:出现对应情况时,要求用户直接提供相关内容。 5. 大模型节点配置: 系统提示词:为对话提供系统级指导,如设定人设和回复逻辑。 用户提示词:向模型提供用户指令,如查询或任何基于文本输入的提问。 输出:支持指定输出格式,包括文本、Markdown 和 JSON。同时,可增加文本处理,让大模型输出的内容更符合人类聊天习惯。例如将一整段文本处理成结构化数据,使其更接近人类的交流方式。
2025-04-16
在aily中使用大模型,需要给大模型挂载知识库。如何操作?
在 Aily 中使用大模型并挂载知识库,可按以下步骤操作: 1. 上传文件:在百炼控制台的中的非结构化数据页签中点击导入数据,根据引导上传相关文件。根据您上传的文档大小,百炼需要一定时间解析,通常占用 1 6 分钟,请您耐心等待。 2. 建立索引:进入,根据引导创建一个新的知识库,并选择刚才上传的文件,其他参数保持默认即可。知识库将为上一步骤中准备的文档建立索引,以便后续大模型回答时检索参考。选择向量存储类型时,如果您希望集中存储、灵活管理多个应用的向量数据,可选择 ADB PG。 3. 引用知识:完成知识库的创建后,可以返回进入到刚才创建的应用设置界面,打开知识检索增强开关、选择目标知识库,测试验证符合预期后点击发布。Prompt 中会被自动添加一段信息,以便大模型在后续回答时参考检索出来的信息。 此外,RAG(检索增强生成)是一种结合了检索和生成的技术,能让大模型在生成文本时利用额外的数据源以提高生成质量和准确性。其基本流程为:首先,给定用户输入(如问题或话题),RAG 从数据源中检索出相关文本片段(称为上下文);然后,将用户输入和检索到的上下文拼接成完整输入传递给大模型(如 GPT),输入通常包含提示,指导模型生成期望输出(如答案或摘要);最后,从大模型的输出中提取或格式化所需信息返回给用户。
2025-04-16
对大模型安全得提示词 看是否合规
大模型安全的提示词合规性可以从以下几个方面考虑: 1. 输入侧防御: 传统防御手段可用,结合大模型特性进行意图识别、语义匹配、提示词语义结构分析等,综合判断用户输入是否恶意。 基于规则进行过滤,即根据需要在提示词中列出“绝对不行的”清单,让模型检查用户输入,但开发提示词时要尽可能穷尽需过滤内容,否则有恶意内容泄漏风险,此为简单防御手段,可与其他技术组合使用。 基于模型进行分类过滤,如使用 BERT 等小型文本分类模型或 ChatGPT 等大型语言模型自动分析和分类输入内容,好处是不需要提前知道很多信息就能灵活应对复杂场景和不同需求,通过学习和训练大量已知安全威胁样本建立分类模型,检测和过滤有害内容,这是很多大型语言模型服务采用的主流防御策略,如 OpenAI 的 ChatGPT、谷歌的 Bard、微软的 NewBing 等。 2. 模型侧防御:对于有模型训练能力和大模型厂商,应增强安全性,从对抗训练到安全微调,到带安全任务的多任务学习,以及在整体对话过程中进行安全性的上下文动态感知等,但要注意安全训练与模型性能的平衡。 3. 输出侧防御:传统防御和内容过滤手段均可使用,基于大模型特点,可进行提示词、私有数据泄露等方面的检查,以及针对大模型幻觉问题,判断是否有事实性错误、脱离话题、乱码文本、不正确格式、错误代码等。 此外,对于开发者来说,往往无法训练模型,但能在开发中带着安全意识优化应用和系统的提示词,加上安全引导和禁止内容等。像 phidata 等智能体框架也包含了相关功能。在进行提示词设计时就要考虑到安全性,对保障安全性效果较为显著,相关论文也有这方面的研究。
2025-04-16