Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

科普性质的介绍下目前大模型的优秀应用案例和实施经验

Answer

以下为目前大模型的一些优秀应用案例和实施经验:

在问答行业

  • Baichuan 借鉴了 Meta 的 CoVe 技术,将复杂 Prompt 拆分为多个独立且可并行检索的搜索友好型查询,使大模型能够对每个子查询进行定向知识库搜索。
  • 利用自研的 TSF(Think-Step Further)技术来推断和挖掘用户输入背后更深层的问题,以更精准、全面地理解用户意图。
  • 自研 Baichuan-Text-Embedding 向量模型,对超过 1.5T tokens 的高质量中文数据进行预训练,并通过自研损失函数解决了对比学习方式依赖 batchsize 的问题。同时引入稀疏检索和 rerank 模型,形成向量检索与稀疏检索并行的混合检索方式,大幅提升了目标文档的召回率,达到 95%。

在医疗行业

  • 涵盖疾病的诊断与预测、药物研发以及个性化医疗等方向。
  • 例如,麻省理工学院利用 AI 发现了新型广谱抗生素 Halicin。研究者先构建由两千个性能已知的分子组成的训练集,用它们训练 AI 学习分子特点,总结规律,再对美国 FDA 已通过的六万多个分子进行分析,最终成功识别出有效分子,且实验证明效果良好。

在模型架构方面

  • 包括 encoder-only、encoder-decoder 和 decoder-only 等类型。
  • 如 BERT 是 encoder-only 模型的代表,google 的 T5 是 encoder-decoder 模型的代表,众多熟知的 AI 助手包括 ChatGPT 基本属于 decoder-only 架构。
  • 大模型的特点在于预训练数据量大,往往来自互联网上的多种来源,且参数众多,如 Open 在 2020 年发布的 GPT-3 就已达到 170B 的参数。
Content generated by AI large model, please carefully verify (powered by aily)

References

大模型RAG问答行业最佳案例及微调、推理双阶段实现模式:基于模块化(Modular)RAG自定义RAG Flow

基于百川的宣传资料整理([查看原文](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650901201&idx=1&sn=3a9bd61403fb4b024ec5d8c128990495&scene=21#wechat_redirect)),由于资料有限,对于部分细节笔者进行了适当猜测和补充。针对用户日益复杂的问题,Baichuan借鉴了Meta的CoVe技术,将复杂Prompt拆分为多个独立且可并行检索的搜索友好型查询,使大模型能够对每个子查询进行定向知识库搜索。此外,他们还利用自研的TSF(Think-Step Further)技术来推断和挖掘用户输入背后更深层的问题,以更精准、全面地理解用户意图。TSF的技术细节并没有披露,猜测其本质应该是对Step-back prompting方法的改良。在检索步骤中,百川智能自研了Baichuan-Text-Embedding向量模型,对超过1.5T tokens的高质量中文数据进行预训练,并通过自研损失函数解决了对比学习方式依赖batchsize的问题。该向量模型登顶了C-MTEB。同时引入稀疏检索和rerank模型(未披露),形成向量检索与稀疏检索并行的混合检索方式,大幅提升了目标文档的召回率,达到了95%。

开发:AI应用大模型商业化落地现状与思考

首先来看医疗行业,这是关乎每个人生命健康的重要领域。大模型在医疗行业的应用主要涵盖三个方向:疾病的诊断与预测、药物研发以及个性化医疗。从医疗前期的图像诊断,基因组学和精准医疗到药物研发阶段再到最后病人的个性化医疗,人工智能都有其适合的应用场景。例如,在2020年,麻省理工学院利用AI发现了一种名为Halicin的新型广谱抗生素,它不仅能有效杀灭对现有抗生素产生耐药性的细菌,而且不会使细菌产生新的耐药性。这一突破性发现源于AI的助力。研究者先搞了一个由两千个性能已知的分子组成的训练集,这些分子都被标记好了是不是可以抑制细菌生长,用它们去训练AI。AI自己学习这些分子都有什么特点,总结了一套“什么样的分子能抗菌”的规律。之后又对美国FDA已通过的六万多个分子中进行分析,最终成功识别出了一个符合所有要求的分子,这就是Halicin。之后研究者开始做实验证明,它真的非常好使,大概很快就会用于临床,造福人类。这个例子充分展示了AI大模型在医疗领域的巨大潜力,目前很多医疗研究机构都进行医疗大模型的开发研究,大模型在医疗领域大有可为!

从 0 到 1 了解大模型安全,看这篇就够了

encoder-only:这些模型通常适用于可以自然语言理解任务,例如分类和情感分析.最知名的代表模型是BERTencoder-decoder:此类模型同时结合了Transformer架构的encoder和decoder来理解和生成内容。该架构的一些用例包括翻译和摘要。encoder-decoder的代表是google的T5decoder-only:此类模型更擅长自然语言生成任务。典型使用包括故事写作和博客生成。这也是我们现在所熟知的众多AI助手的结构我们目前耳熟能详的AI助手基本都来自左侧的灰色分支,当然也包括ChatGPT。这些架构都是根据谷歌2017年发布的论文“attention is all you need”中提出的transformer衍生而来的,在transformer中,包括Encoder,Decoder两个结构目前的大型语言模型就是右侧只使用Decoder的Decoder-only架构的模型大模型又大在哪呢?第一,大模型的预训练数据非常大,这些数据往往来自于互联网上,包括论文,代码,以及可进行爬取的公开网页等等,一般来说,现在最先进的大模型一般都是用TB级别的数据进行预训练。第二,参数非常多,Open在2020年发布的GPT-3就已经达到170B的参数

Others are asking
快速帮我科普下通往AGI之路
通往 AGI 之路的相关内容如下: 上篇文章主要介绍了 WaytoAGI 和为什么要学习研究 AI,解决了 Why 的问题。此次旨在解决 What 和 How 的问题,作者虽不专业,但重点推荐了两个对其个人有重大帮助的视频,并附上了链接。 1. (女神)主讲,和某知识 up 主 Genji 一起制作的免费公益课,新手友好,能带你 50 分钟速通 AI 大模型原理。 2. ,某知识 up 主老石谈芯专访安克创新 CEO 阳萌的视频,一共两期,此链接为第二期,两期内容都值得观看,访谈非常硬核。
2024-12-02
如果我需要撰写一个以“AI对音乐行业就业岗位的影响”为主题的约3000字的科普类文章,我应该优先关注WaytoAGI 知识库中的哪些内容?
很抱歉,目前“通往 AGI 之路”知识库中没有与“AI 对音乐行业就业岗位的影响”相关的直接内容。但您可以从以下几个方面入手来撰写这篇文章: 1. 了解 AI 在音乐创作、制作、表演等方面的应用现状和发展趋势。 2. 研究 AI 技术如何改变音乐的生产流程和效率。 3. 分析 AI 对音乐创作者、演奏者、制作人等不同岗位的具体影响,包括可能的岗位替代和新岗位的产生。 4. 探讨 AI 带来的音乐版权和知识产权问题,以及对相关法律和政策的影响。 5. 关注音乐消费者对 AI 参与音乐创作和表演的接受程度和需求变化。
2024-10-19
以图像识别,为小白科普相关知识和交叉领域,并为研究生提供参考选题
图像识别是指利用计算机技术对图像进行处理和分析,以识别和理解图像中的内容。 对于小白来说,图像识别是让计算机像人一样“看懂”图像。它基于深度学习、机器学习等技术,通过对大量图像数据的学习和训练,能够自动提取图像的特征,并进行分类、识别等操作。 图像识别的应用非常广泛,比如在安防领域,用于人脸识别、车牌识别等;在医疗领域,辅助疾病诊断、医学影像分析;在交通领域,实现交通标志识别、车辆检测等。 图像识别与多个领域存在交叉,如计算机视觉,它不仅关注图像的识别,还包括图像的生成、处理等;与人工智能的其他分支如自然语言处理也有结合,实现图文转换等功能;在工业领域,与自动化生产相结合,进行产品质量检测等。 对于研究生来说,以下是一些参考选题: 1. 基于小样本学习的图像识别算法研究。 2. 融合多模态信息的图像识别模型优化。 3. 针对特定场景(如复杂环境、低光照等)的图像识别改进。 4. 图像识别在医疗诊断中的精准度提升策略。 5. 结合深度学习和传统方法的图像识别性能比较。 6. 基于新型神经网络架构的图像识别应用。
2024-10-19
Aigc科普资料
以下是关于 AIGC 的科普资料: AIGC(人工智能生成内容)是一种利用人工智能技术生成各种类型内容的应用方式。它能够通过机器学习和深度学习算法,根据输入的数据和指令生成符合特定要求的内容,在内容创作、广告、媒体等领域有着广泛的应用。 AIGC 主要分为语言文本生成、图像生成和音视频生成。语言文本生成利用马尔科夫链、RNN、LSTMs 和 Transformer 等模型生成文本,如 GPT4 和 GeminiUltra。图像生成依赖于 GANs、VAEs 和 Stable Diffusion 等技术,应用于数据增强和艺术创作,代表项目有 Stable Diffusion 和 StyleGAN 2。音视频生成利用扩散模型、GANs 和 Video Diffusion 等,广泛应用于娱乐和语音生成,代表项目有 Sora 和 WaveNet。此外,AIGC 还可应用于音乐生成、游戏开发和医疗保健等领域,展现出广泛的应用前景。 目前,我国对 AIGC 的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成了共同监管的形势。 GenAI(即生成式 AI)是一种能够从已有数据中学习并生成新的数据或内容的 AI 应用,利用 GenAI 创建的内容即 AIGC。 相关概念包括: 人工智能:一种目标,让机器展现智慧,Artificial Intelligence,简称 AI。 生成式人工智能 GenAI:一种目标,让机器产生复杂有结构的内容,Generative AI 简称 GenAI。 机器学习:一种手段,让机器自动从资料中找到公式。 深度学习:一种更厉害的手段,类神经网络 非常大量参数的函数。 大语言模型:是一类具有大量参数的“深度学习”模型,Large Language Models,简称 LLMs。 ChatGPT:一个应用实例,形象比喻:通过投喂大量资料预训练后,ChatGPT 会通过聊天玩“文字接龙游戏”了。英文解释:Chat 聊天,G:Generative 生成,P:Pretrained 预训练,T:Transformer 类神经网络模型。 ChatGPT 是 AIGC 技术的一个应用实例,它代表了 AIGC 在文本生成领域的进展。AGI、GenAI、AIGC 几个概念存在一定的区别。
2024-09-25
人工智能科普
以下是关于人工智能的科普内容: 一、人工智能简介 人工智能(Artificial Intelligence)是一门研究如何使计算机表现出智能行为,例如做一些人类所擅长的事情的科学。最初,查尔斯·巴贝奇(Charles Babbage)发明了计算机,用于按照一套明确定义的程序(即算法)来对数字进行运算。现代计算机虽更先进,但仍遵循相同的受控计算理念。然而,像“根据照片判断一个人的年龄”这类任务,由于我们不清楚大脑完成此任务的具体步骤,所以无法编写明确程序让计算机完成,这类任务正是人工智能感兴趣的。 二、人工智能简史 早期的程序如,基于简单语法规则,将输入句子重新表述为问题。现代助手如 Cortana、Siri 或谷歌助手等是混合系统,使用神经网络将语音转换成文本并识别意图,再采用推理或明确算法执行操作。未来有望出现完整基于神经网络的模型独立处理对话,如最近的 GPT 和 TuringNLG 系列神经网络在这方面取得了巨大成功。 三、新手学习 AI 的方法 学习人工智能是既刺激又富有挑战的旅程。 1. 了解 AI 基本概念: 阅读「」部分,熟悉术语和基础概念,了解其主要分支及联系。 浏览入门文章,了解历史、应用和发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按自己节奏学习并获取证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),可根据兴趣选择特定模块深入学习。
2024-09-10
AI儿童科普演讲大纲
很抱歉,目前知识库中没有关于 AI 儿童科普演讲大纲的相关内容。但我可以为您提供一个大致的框架以供参考: 一、引言 1. 用有趣的故事或现象引入 AI 的概念 2. 提问引发孩子们的兴趣 二、什么是 AI 1. 简单解释 AI 的定义 2. 举例说明 AI 在日常生活中的应用,如语音助手、智能家电等 三、AI 的工作原理 1. 以简单易懂的方式讲解数据输入、算法处理和结果输出 2. 用形象的比喻帮助孩子们理解 四、AI 的优点 1. 提高效率、准确性 2. 解决一些复杂的问题 3. 为人们的生活带来便利 五、AI 的挑战与担忧 1. 可能导致的就业变化 2. 数据隐私和安全问题 六、未来的 AI 1. 鼓励孩子们想象未来 AI 的发展 2. 激发他们对科技的兴趣和探索精神 七、总结 1. 回顾重点内容 2. 鼓励孩子们学习科学知识,为未来做好准备 您可以根据实际情况和孩子们的年龄特点对内容进行调整和丰富。
2024-09-09
AI营销案例
以下是一些 AI 营销案例: 1. 大淘宝设计部 2023 年度 AI 设计实践: 品牌超级符号映射:根据品牌符号的模型训练和结构控制,用户输入丰富关键词可快速完成准确的超级符号主视觉,如双 11 AI 创作赢红包、双 11 联合传播猫头海报&花车大巡游、超级品类日 品牌符号系列海报等案例。 品牌 IP 形象 AI 生成:训练特定的天猫/淘宝/营销 IP 公仔模型,根据不同需求稳定输出定制化 IP 形象,如天猫 AI 玩行动 品牌联合海报、天猫双 11 出游主题喵卡、淘宝天猫一起冲亚、天猫 U 先公仔三视图生成及应用等案例。 传播&投放:包括双 11 超级发布 品牌联合海报、媒介投放开屏海报等案例。 大促营销:通过 AI 生成图像或素材,结合平面合成及修正,如淘宝天猫大促视觉、双 11 大促 横向会场版头模板化应用、天猫小黑盒 新品联名等案例。 2. AI 在活动策划中的应用: 活动主题及内容生成:根据活动目标、参与者背景等信息生成合适的活动主题和内容框架建议,例如通过对话生成模型提出活动主题和议程草案。 邀请函和宣传文案生成:基于活动信息生成吸引人的邀请函和宣传文案,如微软在 Build 大会上使用 AI 生成 8000 多份个性化的邀请函。 现场活动管理:利用计算机视觉、语音识别等辅助管理活动现场的人流、秩序等,例如基于人群密度的通道引导、实时翻译等。 虚拟助手:AI 对话系统作为虚拟活动助手,为参与者提供信息查询、问题咨询等服务,例如 Replika 提供的智能虚拟活动助手应用。 活动反馈分析:自动分析活动反馈(文字、语音等),总结关键观点和改进建议,例如飞书和钉钉的会议总结功能。 活动营销优化:基于参与者行为数据优化营销策略,实现个性化营销,例如针对目标受众的定向广告投放等。 3. 其他案例: 营销:蓝色光标 X 京东|AIGC 代言人营销新模式,OPEN AD 时代来临:在代言人项目中探索出了行业崭新的 AIGC 精细化作业模式,革新传统代言人 TVC 制作流程。 营销:定制营销报告:涵盖汇报对象身份、销售数据、财务报告、市场分析、客户反馈、营销效果评估等方面。 办公:高效做 PPT:用 ChatGPT 生成 Markdown 语法内容,再借用 MindShow 工具转换为精美的 PPT。
2025-01-21
AI 营销最佳实践或案例
以下是一些 AI 营销的最佳实践或案例: 大淘宝设计部 2023 年度 AI 设计实践: 1. 品牌超级符号映射:根据品牌符号的模型训练和结构控制,用户输入丰富关键词可快速完成准确的超级符号主视觉。案例包括双 11 AI 创作赢红包、双 11 联合传播猫头海报&花车大巡游、超级品类日 品牌符号系列海报。 2. 品牌 IP 形象 AI 生成:训练特定的天猫/淘宝/营销 IP 公仔模型,根据不同需求稳定输出定制化 IP 形象,还可形成素材库。案例有天猫 AI 玩行动 品牌联合海报、天猫双 11 出游主题喵卡、淘宝天猫一起冲亚、天猫 U 先公仔三视图生成及应用。 3. 传播&投放:案例有双 11 超级发布 品牌联合海报、媒介投放开屏海报。 4. 大促营销:通过 AI 生成图像或素材,结合平面合成及修正,确保符合品牌形象,精准表达营销活动主题,快速生成多个设计变体并迭代优化。案例包括淘宝天猫大促视觉、双 11 大促 横向会场版头模板化应用、天猫小黑盒 新品联名。 AI 在活动策划中的应用案例: 1. 活动主题及内容生成:根据活动目标、参与者背景等信息,生成合适的活动主题和内容框架建议,例如通过对话生成模型提出活动主题和议程草案。 2. 邀请函和宣传文案生成:基于活动信息生成吸引人的邀请函和宣传文案,增强宣传效果。例如微软在 Build 大会上使用 AI 生成了 8000 多份个性化的邀请函。 3. 现场活动管理:利用计算机视觉、语音识别等辅助管理活动现场的人流、秩序等。例如基于人群密度的通道引导、实时翻译等。 4. 虚拟助手:AI 对话系统作为虚拟活动助手,为参与者提供信息查询、问题咨询等服务。例如 Replika 提供了智能的虚拟活动助手应用。 5. 活动反馈分析:自动分析活动反馈(文字、语音等),总结关键观点和改进建议。例如飞书和钉钉的会议总结功能。 6. 活动营销优化:基于参与者行为数据,优化营销策略,实现个性化营销。例如针对目标受众的定向广告投放等。 AIGC 商业视频落地经验分享: 1. AIPO 校园创投活动:10 月 20 号将在全国 20 多所高校举办线下 AIPO 模拟创业者和投资人的活动,校园大使确定举办校内线下活动的报名今晚 8 点半截止。 2. AI 商业片分享:邀请自媒体博主 EM7 和南柒老师讲解如何使用 AIGC 工具完成品牌方合作,包括实战项目、合作品牌、案例区分、制作流程等,并提及不同平台发作品的区别。 3. 品牌营销与营销的概念差异:品牌营销侧重于让用户记住品牌,加深大众记忆;营销则以销售和转化为目的,更着重于产品本身。 4. AI 在品牌广告中的应用案例:如伊利的黏土风格广告,通过特定元素复原运动员形象,属于品牌广告。 5. AI 在营销广告中的应用案例:某宝好物节的广告,旨在促进消费,属于营销广告。 6. AI 视频制作的突破与挑战:路特斯的广告在时间有限的情况下仍做出尝试和突破,早期 AI 技术下的视频存在一些痛点,后续不断改进。
2025-01-20
国内优秀Agent应用案例
以下是一些国内优秀的 Agent 应用案例: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具拓展 Bot 能力边界。 2. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 3. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 4. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色,提供更深入的环境感知和记忆功能。
2025-01-19
国内优秀智能体案例
以下是一些国内优秀智能体案例: 在车辆使用指南维度,多个大模型表现优异,达到 80 分以上,在操作指南、车辆故障诊断、维修保养等任务上具备较高交互成熟度。 在汽车场景中,部分 13 14B 中小模型超过云端闭源模型,展现出端侧模型满足用户需求的良好能力和巨大潜力。 在社交方向,有用户注册后先创建自己的智能体,让其与他人的智能体聊天,然后真人介入的有趣场景。 字节推出的“扣子”是用于开发下一代 AI 聊天机器人的构建平台。 国内存在如 Dify.AI 等智能体开发平台。
2025-01-19
2024大模型典型应用案例集
以下是 2024 大模型的一些典型应用案例及相关信息: 《2024 大模型典型示范应用案例集》汇集了 97 个优秀案例,展示了大模型技术在教育、医疗、金融、政务等多个行业和领域的应用。案例由阿里云、百度、华为等领先企业实施,上海成为应用落地的热点地区,大中型企业是主要试验场。AI 智能体和知识库成为提升大模型落地实效的关键手段。 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 整体来看,在主流大模型厂商中,百度表现突出,拿下最关键的中标项目数量、中标金额两项第一。截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%,其增长主要由互联网、教育、金融等行业对模型训练和推理的高需求带动。 企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。 相关报告: 《信达证券:AI 行业设计领域专题报告:Adobe AI 功能覆盖全面,Canva、美图等力争上游》 《中国信通院:大模型基准测试体系研究报告(2024 年)》 《埃森哲:人工智能行业:2024 在生成式人工智能时代重塑工作、劳动力和员工》 此外,还有一些相关活动,如: 2024 年是国内大模型技术加速落地的关键年份,各大厂商如百度、阿里、字节等在 AI 大模型领域展开激烈竞争。百度凭借 40 个中标项目和 2.74 亿元中标金额在行业中处于领先地位。尤其在金融、智能终端等行业,百度文心大模型的应用广泛,表现亮眼。 🏮「非遗贺春」魔多蛇年春节 AI 模型创作大赛,大赛时间 2024 年 12 月 24 日2025 年 1 月 15 日。大赛奖池【¥12000】现金奖励+官方高含金量荣誉证书+会员与算力激励+流量激励。双赛道同时开启,赛道一【春节】+赛道二【爱非遗 AI 传承】。本次活动由浙江省非遗保护中心(浙江省非遗馆)指导×浙江省非遗保护基金会主办×魔多 AI 联合承办,由提供社区传播支持。
2025-01-16
消费行业ai案例
以下是一些消费行业的 AI 案例: 《2024 生成式 AI 商业落地白皮书》由火山引擎、RollingAI 和 InfoQ 研究中心联合发布,为 CXO 提供 AI 转型战术指南。书中通过 240 个应用场景地图,展示了 AI 在消费零售等行业的落地案例,探讨了 AI 基础设施构建、项目落地准备和快速补齐能力差距等关键问题,并提出了八步实施大模型接入的方法论。 关于 AI 的最强大之处之一是它能使产品个性化用户体验。这方面的早期应用已经出现在教育科技和搜索中,预计这种定制将是许多 AI 启用产品的核心价值主张。 此外,人工智能在汽车行业也有广泛应用: 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定,自动驾驶汽车能够自主导航和驾驶。 车辆安全系统:AI 被用于增强车辆的安全性能,如自动紧急制动、车道保持辅助和盲点检测系统。 个性化用户体验:AI 可以根据驾驶员的偏好和习惯来调整车辆设置。 预测性维护:通过分析车辆的实时数据,AI 可以预测潜在的故障和维护需求。 生产自动化:在汽车制造过程中,AI 被用于自动化生产线,提高生产效率和质量控制。 销售和市场分析:汽车公司使用 AI 来分析市场趋势、消费者行为和销售数据。 电动化和能源管理:AI 在电动汽车的电池管理和充电策略中发挥作用。 共享出行服务:AI 支持的共享出行服务,使用 AI 来优化路线规划、调度车辆和定价策略。 语音助手和车载娱乐:AI 驱动的语音助手允许驾驶员通过语音命令控制车辆功能、获取信息和娱乐内容。 车辆远程监控和诊断:AI 系统可以远程监控车辆状态,提供实时诊断和支持。
2025-01-14
怎样构建一个自己专业的AI小模型
构建一个自己专业的 AI 小模型可以参考以下步骤: 1. 搭建 OneAPI:这是为了汇聚整合多种大模型接口,方便后续更换使用各种大模型,同时了解如何白嫖大模型接口。 2. 搭建 FastGpt:这是一个知识库问答系统,将知识文件放入,接入上面的大模型作为分析知识库的大脑,最后回答问题。如果不想接到微信,搭建完此系统就可以,它也有问答界面。 3. 搭建 chatgptonwechat 并接入微信,配置 FastGpt 把知识库问答系统接入到微信,建议先用小号以防封禁风险。若想拓展功能,可参考 Yaki.eth 同学的教程,里面的 cow 插件能进行文件总结、MJ 绘画等。 部署和训练自己的 AI 开源模型的主要步骤如下: 1. 选择合适的部署方式,包括本地环境部署、云计算平台部署、分布式部署、模型压缩和量化、公共云服务商部署等,根据自身的资源、安全和性能需求进行选择。 2. 准备训练所需的数据和计算资源,确保有足够的训练数据覆盖目标应用场景,并准备足够的计算资源,如 GPU 服务器或云计算资源。 3. 选择合适的预训练模型作为基础,可以使用开源的预训练模型如 BERT、GPT 等,也可以自行训练一个基础模型。 4. 针对目标任务进行模型微调训练,根据具体应用场景对预训练模型进行微调训练,优化模型结构和训练过程以提高性能。 5. 部署和调试模型,将训练好的模型部署到生产环境,并对部署的模型进行在线调试和性能优化。 6. 注意安全性和隐私保护,大模型涉及大量数据和隐私信息,需要重视安全性和合规性。 大模型的构建过程包括: 1. 收集海量数据:像教孩子成为博学多才的人一样,让模型阅读大量的文本数据,如互联网上的文章、书籍、维基百科条目、社交媒体帖子等。 2. 预处理数据:清理和组织收集到的数据,如删除垃圾信息,纠正拼写错误,将文本分割成易于处理的片段。 3. 设计模型架构:为模型设计“大脑”结构,通常是一个复杂的神经网络,如使用 Transformer 架构。 4. 训练模型:让模型“阅读”提供的数据,通过反复尝试预测句子中的下一个词等方式,逐渐学会理解和生成人类语言。
2025-01-29
现在最好的AI大模型
目前较为出色的 AI 大模型包括: 1. GPT4(免费可用):是 OpenAI 在深度学习规模扩大方面的最新里程碑,是一个大型多模态模型,在各种专业和学术基准测试中表现出与人类相当的水平。 2. Midjourney v5(免费):具有极高的一致性,擅长以更高分辨率解释自然语言 prompt,并支持像使用 tile 这样的重复图案等高级功能,能生成令人惊叹的逼真 AI 图像。 3. DALL·E 3(免费可用):代表了生成完全符合文本的图像能力的一大飞跃,能轻松将想法转化为极其精准的图像。 4. Mistral 7B(免费):是一个具有 73 亿参数的模型,在所有基准测试上超越了 Llama 2 13B,在许多基准测试上超越了 Llama 1 34B,在代码任务上接近 CodeLlama 7B 的性能,同时在英语任务上表现良好。 此外,在主要的大语言模型方面: 1. OpenAI 系统:包括 3.5 和 4.0 版本,3.5 模型在 11 月启动了当前的 AI 热潮,4.0 模型功能更强大。微软的 Bing 使用 4 和 3.5 的混合,通常是 GPT4 家族中首个推出新功能的模型。 2. 谷歌:一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是一个名叫 PaLM 2 的模型。 3. Anthropic 发布了 Claude 2,其最值得注意的是有一个非常大的上下文窗口。
2025-01-29
你好,你是什么模型?
您好,我是一名 AI 知识专家,能够为您提供全面的 AI 知识指导和解答相关问题。 关于模型方面的知识: LoRA 和 LyCORIS 都属于微调模型,常用于控制画风、生成的角色、角色姿势等。它们的后缀均为.safetensors,体积较主模型小,一般在 4M 300M 之间,使用 LoRA 模型较多,LyCORIS 可调节范围更大,现在 SD 已内置。在 WebUl 中使用时,可在 LoRA 菜单中点击使用,也可直接使用 Prompt 调用。 在 Tusiart 中,首页有模型、帖子、排行榜,展示了大手子炼成的模型和图片。生图必需基础模型(Checkpoint),任何生图操作必须选定一个 Checkpoint 模型才能开始,lora 是低阶自适应模型,可有可无,但对细节控制有价值。ControlNet 可控制图片中特定图像,VAE 类似于滤镜调整生图饱和度,选择 840000 即可。Prompt 提示词是想要 AI 生成的内容,负向提示词是想要 AI 避免产生的内容。还有图生图,即上传图片后 SD 会根据相关信息重绘。 如果您想搭建类似的群问答机器人,可以参考以下内容:
2025-01-28
为什么要布置大模型到本地
布置大模型到本地主要有以下原因: 1. 无需科学上网,也无需支付高昂的 ChatGPT 会员费用。 2. 可以通过 Web UI 实现和大模型进行对话的功能,如 Open WebUI 一般有两种使用方式,包括聊天对话和 RAG 能力(让模型根据文档内容回答问题),这也是构建知识库的基础之一。 3. 能够更加灵活地掌握个人知识库。 但需要注意的是,运行大模型需要很高的机器配置: 1. 生成文字大模型,最低配置为 8G RAM + 4G VRAM,建议配置为 16G RAM + 8G VRAM,理想配置为 32G RAM + 24G VRAM(如果要跑 GPT3.5 差不多性能的大模型)。 2. 生成图片大模型(比如跑 SD),最低配置为 16G RAM + 4G VRAM,建议配置为 32G RAM + 12G VRAM。 3. 生成音频大模型,最低配置为 8G VRAM,建议配置为 24G VRAM。 个人玩家的大多数机器可能负担不起,最低配置运行速度非常慢。但亲自实操一遍可以加深对大模型构建的知识库底层原理的了解。
2025-01-27
Coze + 飞书 + 飞书多维表格:通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出。由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,无需开发任何插件、APP,能实现跨平台的稍后读收集与智能阅读计划的推荐。其设计思路包括简化“收集”,实现跨平台收集和通过输入 URL 完成收集;自动化“整理入库”,自动整理关键信息并支持跨平台查看;智能“选择”推荐,根据收藏记录和用户兴趣生成阅读计划——这个方法具体如何操作?
以下是关于通过飞书机器人与 Coze 搭建的智能体进行对话,并利用飞书多维表格存储和管理稍后读数据,实现跨平台的稍后读收集与智能阅读计划推荐的具体操作方法: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口完成收集输入。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用飞书·稍后读助手: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。但目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 至此,专属 AI 稍后读智能体大功告成,您可以尽情享受相关服务。
2025-01-27
大语言模型
大语言模型相关知识如下: Encoder:在大型语言模型中,Encoder 是模型的编码器部分,负责对输入的文本序列进行编码,获取其对应的语义表示。具有词嵌入、位置编码、注意力机制、层叠编码、上下文建模等关键作用。其输出是输入序列对应的上下文化语义表示,会被模型的 Decoder 部分利用。 介绍:大型语言模型是深度学习的一个子集,可以预训练并进行特定目的的微调。能解决诸如文本分类、问题回答、文档摘要、跨行业的文本生成等常见语言问题,还可利用相对较小的领域数据集进行定制以解决不同领域的特定问题。其三个主要特征是大型(训练数据集规模和参数数量大)、通用性(能解决常见问题)、预训练微调(用大型数据集预训练,用较小数据集微调)。使用大型语言模型的好处包括一种模型可用于不同任务、微调所需领域训练数据较少、性能随数据和参数增加而增长等。视频中还提到了自然语言处理中的提示设计和提示工程,以及三种类型的大型语言模型:通用语言模型、指令调整模型和对话调整模型。 性能对比:对比不同大型语言模型的性能需考虑多个维度,如理解能力、生成质量、知识广度和深度、泛化能力、鲁棒性、偏见和伦理、交互性和适应性、计算效率和资源消耗、易用性和集成性等。可采用标准基准测试、自定义任务、人类评估、A/B 测试、性能指标等方法进行有效比较。
2025-01-27
有哪些优秀的AI copilot?
以下是一些优秀的 AI copilot: 1. 对于编程辅助方面: GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议。 通义灵码:阿里巴巴团队推出,提供多种编程相关能力。 CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,实时提供代码建议。 CodeGeeX:智谱 AI 推出的开源免费编程助手,基于 130 亿参数的预训练大模型。 Cody:Sourcegraph 推出的代码编写助手,借助强大的代码语义索引和分析能力了解开发者的整个代码库。 CodeFuse:蚂蚁集团支付宝团队为国内开发者提供的免费 AI 代码助手。 Codeium:由 AI 驱动的编程助手工具,提高编程效率和准确性。 更多辅助编程 AI 产品,还可以查看:https://www.waytoagi.com/category/65 。每个工具功能和适用场景不同,可根据需求选择。 2. 在 Agent 构建平台方面: Coze:新一代一站式 AI Bot 开发平台,集成丰富插件工具。 Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作等,并能部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识等,并能访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景。 钉钉 AI 超级助理:依托钉钉优势,在处理高频工作场景表现出色。 3. 此外,还有一些新的 AI 产品和网站,如: SciSpace Copilot:由印度论文服务平台 SciSpace 开发,用于解释科学文献中的文本、数字和表格,输出内容更精确。链接:https://typeset.io/ AIPRM for ChatGPT:SEO Prompt 模板插件,支持 ChatGPT 和 Midjourney 等。链接:https://www.aiprm.com/ Teamsmart:有趣的文档助手,根据不同职业/技能提供不同能力点的机器人。链接:https://www.teamsmart.ai/ Boring Report:应对标题党的神器,去除文章夸张表述,保留客观事实。
2025-01-18
优秀的来源大模型有哪些
以下是一些优秀的大模型: Google 的 T5:属于 encoderdecoder 类型的模型,适用于翻译和摘要等任务。 OpenAI 的 GPT3:预训练数据量大,参数众多,能根据用户输入的任务描述或示例完成任务。 ChatGPT:用户通过像和人类对话的方式即可完成任务。 国内的优秀大模型有: 智谱清言(清华&智谱 AI):基础模型为 ChatGLM 大模型。在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三,更擅长专业能力,但代码能力有优化空间,知识百科稍显不足。可应用于 AI 智能体、较复杂推理、广告文案、文学写作等场景。 通义千问 2.0(阿里云):在语言理解与抽取、角色扮演能力上排名国内前一,在代码、生成与创作、上下文对话能力上排名国内前三,各项能力较为均衡。聚焦在移动设备端的应用,涵盖知识、记忆、工具、创作等方向,支持多种工具和文生文、文生图等场景。 Baichuan213BChat(百川智能):百川智能自主训练的开源大语言模型,是中文开源模型的主导力量。
2024-12-28
如何向chatgpt写一个优秀的关于论文修改的提示词
以下是一些关于向 ChatGPT 写优秀的论文修改提示词的建议: 1. 利用 ChatGPT 的对抗性演练生成提示词: 对指定文章进行改写。 对改写后的版本进行原创性检验。 根据检验结果,指导 ChatGPT 进一步优化。 重复上述过程,直至满足高度原创的标准。 采用逆向工程的方法,梳理 ChatGPT 的改写策略。 整合这些策略,形成一套提高文章原创性的高效提示词。 2. 对于文章修改的具体步骤: 先使用 ChatGPT 对一段文字进行改写。 对改写后的文字进行原创性检测。 把原创度检测工具的结果告诉负责二创的 ChatGPT 角色,让其继续改写。 不断重复上述步骤,让 ChatGPT 多次对文章进行二创。 让 ChatGPT 自己总结提示词。 整理 ChatGPT 返回结果,形成文字二次创作的通用提示词。 3. 对于 ChatGPT 给 DALL·E 3 优化提示词的元提示,需要注意: 不改变表情包、虚构角色的起源或未见过的人物,保持原始提示词的意图,优先考虑质量。 不创建任何具有冒犯性的图像。 对于传统上存在偏见的场景,确保指定关键特征,如性别和种族,且方式无偏见。 对于包含特定人物或名人的名字、暗示或参考的描述,进行谨慎的修改,用通用描述替代,不泄露其身份信息,除非是性别和体格。 对于提到的创意专业人士或工作室,用对其风格的描述替代名称,或在未知时删除该参考。 提示词必须详细、客观地描述图像的每个部分。思考描述的最终目标,并推断出能生成满意图像的内容。
2024-12-19
这样创造一个优秀的智能体
要创造一个优秀的智能体,可以考虑以下几个方面: 1. 前置概念: 省略:在人类日常交流中常有省略现象,因给定情境下有些信息可理解或已被暗示,无需明言。 不严格逻辑能力:人类语言使用受多种因素影响,日常沟通中会用情感驱使表达观点,可能使用不严格逻辑的俚语或造新词。 比喻:日常生活沟通中人们习惯用比喻,能使抽象复杂概念具象易懂,助于交流。 2. 例子: 省略 prompt 方面的例子。 不严格逻辑能力 prompt 方面的例子。 3. xAI 的使命:致力于更好地理解深度学习技术,创建能帮助理解宇宙的聪明智能体,解决重要问题是 AGI 的关键门槛,追求科学是工作基础。 4. 软件开发与智能体:当软件开发部分变得更快、更容易、更便宜时,大型语言模型可表现为智能体,能制定计划和决策,使用工具和逻辑链接的架构可完成复杂任务,已部署到帮助专业开发人员的工具中,但存在怀疑和争议。
2024-12-12