Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

闭源模型分类和典型案例

Answer

以下是一些常见的闭源模型分类和典型案例:

  • 通用大模型:字节云雀大模型。
  • 行业大模型:如蚂蚁金融大模型等。

在 2023 年,还有众多闭源模型的发布和升级,例如:

  • 文心一言:经历了从 1.0 到 V3.5 的版本升级。
  • 星火:科大讯飞发布的星火 1.0 及后续的升级版本。

此外,Qwen 系列模型也有出色表现,Qwen2 在性能上超越了目前所有开源模型和国内闭源模型,如文心 4.0 等。Qwen2 具有多种尺寸的预训练和指令调整模型,在大量基准评估中表现出先进的性能,提升了代码、数学、推理等多方面的能力,并在多个国际权威测评中获得冠军。

Content generated by AI large model, please carefully verify (powered by aily)

References

2023年度中文大模型基准测评报告.pdf

时间2022.125字节云雀大模型闭源通用大模型百川BaichuanYi-34B开源医疗汽车教育行业大模型MindGPT部分领域岐黄问道银河大模型..................序列猴子BlueLMAndesGPT孟子玉言云天书金融工业文化/零售/交通蚂蚁金融大模型妙笔大模型AInno-15B轩辕大模型COSMO-GPTSMore LrMo..................2023年值得关注的中文大模型全景图国内外大模型发展趋势过去六个月国内外代表性模型的发展趋势趋势说明过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从7月份与GPT3.5的20分差距,每个月都有稳定且巨大的提升,到11月份测评时已经完成总分上对GPT3.5的超越。

2023年度中文大模型基准测评报告.pdf

•OpenAI发布GPT4•科大讯飞发布星火1.0•百度发布文心一言1.0•清华开源ChatGLM•360发布360智脑1.0•复旦开源MOSS•元语开源ChatYuan•阿里云发布通义千问1.0•商汤科技发布商量1.0•昆仑万维发布天工1.0•出门问问发布序列猴子•华为发布盘古3.0•西湖心辰发布西湖大模型•文心一言升级V3.5•云从科技发布从容大模型•商汤科技升级商量2.0•理想汽车发布MindGPT•360升级智脑4.0•字节跳动公测大模型产品豆包•OPPO发布AndesGPT•商汤科技升级商量3.0•vivo发布BlueLM•阿里云开源Qwen-7B•零一万物开源Yi-34B•小米发布大模型MiLM•科大讯飞升级星火3.0•元象科技开源XVERSE-13B•Google发布多模态大模型Gemini•上海人工智能实验室开源InternLM-20B•百川智能发布Baichuan2—Turbo2月4月8月6月10月2023.12

Qwen 2开源了 模型性能超越目前所有开源模型和国内闭源模型

5种尺寸的预训练和指令调整模型,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B;(Qwen2-57B-A14B这个模型可以重点看看除英语和中文外,还接受过另外27种语言的数据训练;在大量基准评估中表现出最先进的性能;在大量基准评估中获得SOTA性能。代码和数学性能显著提高,全面超越llama3增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。HF最新榜第一72B和7B可处理128k上下文57B-A14B可处理64k上下文0.5B和1.5B可处理32k上下文相比2月推出的通义千问Qwen1.5,Qwen2实现了整体性能的代际飞跃。在权威模型测评榜单OpenCompass中,此前开源的Qwen1.5-110B已领先于文心4.0等一众中国闭源模型。刚刚开源的Qwen2-72B,整体性能相比Qwen1.5-110B又取得了大幅提升。(图说:在上海人工智能实验室推出的OpenCompass大模型测评榜单上,此前开源的Qwen1.5-110B已领先于文心4.0等一众中国闭源模型)通义千问Qwen2系列模型大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。在MMLU、GPQA、HumanEval、GSM8K、BBH、MT-Bench、Arena Hard、LiveCodeBench等国际权威测评中,Qwen2-72B获十几项世界冠军,超过美国的Llama3。(图说:Qwen2-72B在十多个权威测评中获得冠军,超过美国的Llama3-70B模型)

Others are asking
开源模型和闭源模型
开源模型和闭源模型的情况如下: 专有模型(闭源模型):如 OpenAI、Google 等公司的模型,需访问其官方网站或平台(如 ChatGPT、Gemini AI Studio)使用。 开源模型: 可使用推理服务提供商(如 Together AI)在线体验和调用。 可使用本地应用程序(如 LM Studio)在个人电脑上运行和部署较小的开源模型。 例如 DeepSeek、Llama 等开源模型。 Qwen 2 开源,具有多种尺寸的预训练和指令调整模型,在大量基准评估中表现出先进性能,超越目前所有开源模型和国内闭源模型,在代码和数学性能等方面显著提高。 金融量化领域的大模型正趋向闭源,几个巨头的核心模型如 OpenAI 最新一代的 GPT4、Google 的 Bard 以及未来的 Gemini 短时间内不会公开。Meta 的 LLaMA 目前开源,但未来可能改变。OpenAI 未来可能开源上一代模型。
2025-02-17
开源模型与闭源模型调用
以下是关于开源模型与闭源模型调用的相关信息: 1. 通义千问自 2023 年 8 月起密集推出 Qwen、Qwen1.5、Qwen2 三代开源模型,Qwen 系列的 72B、110B 模型多次登顶 HuggingFace 的 Open LLM Leaderboard 开源模型榜单。Qwen2 系列已上线魔搭社区 ModelScope 和阿里云百炼平台,开发者可在魔搭社区体验、下载模型,或通过阿里云百炼平台调用模型 API。同时,Qwen272binstruct 模型已上线中国大语言模型评测竞技场 Compass Arena,所有人都可登录体验其性能或进行对比测评,测评地址为。Compass Arena 集齐了国内主流的 20 多款大模型,用户可在平台选择大模型的两两“对战”。 2. 部分声称性能卓越的中国大模型被揭露为“套壳”产品,如李开复创办的“零一万物”被国外开发者质疑为“套壳”产品,其团队承认在训练过程中沿用了开源架构,但坚称发布的模型从零开始训练并进行了大量原创优化和突破。此外,字节跳动被曝出在其秘密研发的大模型项目中调用了 OpenAI 的 API,并使用 ChatGPT 的输出数据来训练自己的模型,此行为触犯了 OpenAI 使用协议中禁止的条款。 3. 在 LLM 应用程序中,OpenAI 已成为语言模型领域领导者,开发者通常使用 OpenAI API 启动新的 LLM 应用,如 gpt4 或 gpt432k 模型。项目投入生产并规模化时,有更多选择,如切换到 gpt3.5turbo,其比 GPT4 便宜约 50 倍且速度更快;与其他专有供应商如 Anthropic 的 Claude 模型进行实验;将一些请求分流到开源模型,这通常与微调开源基础模型结合更有意义。开源模型有多种推理选项,包括 Hugging Face 和 Replicate 的简单 API 接口、主要云提供商的原始计算资源等。
2025-01-06
开源模型与闭源模型调用
开源模型与闭源模型调用相关信息如下: 通义千问自 2023 年 8 月起密集推出 Qwen、Qwen1.5、Qwen2 三代开源模型,Qwen 系列的 72B、110B 模型多次登顶 HuggingFace 的 Open LLM Leaderboard 开源模型榜单。Qwen2 系列已上线魔搭社区 ModelScope 和阿里云百炼平台,开发者可在魔搭社区体验、下载模型,或通过阿里云百炼平台调用模型 API。同时,Qwen272binstruct 模型已上线中国大语言模型评测竞技场 Compass Arena,所有人都可登录体验其性能或进行对比测评,测评地址为:https://opencompass.org.cn/arena 。Compass Arena 是由上海人工智能实验室和魔搭社区联合推出的大模型测评平台,集齐了国内主流的 20 多款大模型。 部分声称性能卓越的中国大模型被揭露为“套壳”产品,如李开复创办的“零一万物”被国外开发者质疑为“套壳”产品,其团队承认在训练过程中沿用了开源架构。此外,字节跳动被曝出在其秘密研发的大模型项目中调用了 OpenAI 的 API,并使用 ChatGPT 的输出数据来训练自己的模型。 在 LLM 应用程序中,开发者通常使用 OpenAI API 启动新的 LLM 应用,如 gpt4 或 gpt432k 模型。当项目投入生产并规模化时,常见的选择包括切换到更便宜且速度更快的 gpt3.5turbo,与其他专有供应商(如 Anthropic 的 Claude 模型)进行实验,将一些请求分流到开源模型等。开源模型有多种推理选项,包括 Hugging Face 和 Replicate 的简单 API 接口、主要云提供商的原始计算资源等。
2025-01-06
开源模型与闭源模型调用
开源模型与闭源模型调用相关信息如下: 通义千问自 2023 年 8 月起密集推出 Qwen、Qwen1.5、Qwen2 三代开源模型,Qwen 系列的 72B、110B 模型多次登顶 HuggingFace 的 Open LLM Leaderboard 开源模型榜单。Qwen2 系列已上线魔搭社区 ModelScope 和阿里云百炼平台,开发者可在魔搭社区体验、下载模型,或通过阿里云百炼平台调用模型 API。同时,Qwen272binstruct 模型已经上线中国大语言模型评测竞技场 Compass Arena,所有人都可以登录体验 Qwen2 的性能,或者选择 Qwen2 模型与其他大模型进行对比测评。测评地址:https://opencompass.org.cn/arena 。Compass Arena 是由上海人工智能实验室和魔搭社区联合推出的大模型测评平台,集齐了国内主流的 20 多款大模型。 部分声称性能卓越的中国大模型被揭露为“套壳”产品,如李开复创办的“零一万物”被国外开发者质疑为“套壳”产品,其团队承认在训练过程中沿用了开源架构,但坚称发布的模型都是从零开始训练的,并进行了大量原创性的优化和突破。此外,字节跳动被曝出在其秘密研发的大模型项目中调用了 OpenAI 的 API,并使用 ChatGPT 的输出数据来训练自己的模型,这触犯了 OpenAI 使用协议中明确禁止的条款。 在 LLM 应用程序中,OpenAI 已成为语言模型领域的领导者,开发者通常使用 OpenAI API 启动新的 LLM 应用,如 gpt4 或 gpt432k 模型。当项目投入生产并开始规模化时,常见的选择包括切换到 gpt3.5turbo、与其他专有供应商(如 Anthropic 的 Claude 模型)进行实验、将一些请求分流到开源模型等。开源模型可以使用多种推理选项,包括 Hugging Face 和 Replicate 的简单 API 接口、来自主要云提供商的原始计算资源等。
2025-01-06
对于大语言模型使用的未来趋势,是闭源云端还是开源本地部署,作为普通用户是否有必要了解本地部署知识,并且是否有必要自己搭建agent以及rag?
大语言模型的未来趋势在闭源云端和开源本地部署方面存在多种可能性。 对于开源本地部署,以下是一些相关信息: Ollama 是一个方便用户在本地运行和管理大型语言模型的框架,具有以下特点: 支持多种大型语言模型,如通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 CPU 和 GPU。 提供模型库,用户可从中下载不同模型,以满足不同需求和硬件条件,模型库可通过 https://ollama.com/library 查找。 支持用户自定义模型,例如修改温度参数调整创造性和连贯性,或设置特定系统消息。 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 安装可访问 https://ollama.com/download/ 。 可以通过一些教程学习如何本地部署大模型以及搭建个人知识库,例如了解如何使用 Ollama 一键部署本地大模型、通过搭建本地聊天工具了解 ChatGPT 信息流转、RAG 的概念及核心技术、通过 AnythingLLM 搭建完全本地化的数据库等。 同时,采用开源或国内企业提供的 13B 级模型本地部署在内部系统中,虽需投入算力,但有其价值。智能客服的大量优质大客户可能会选择自己搭建智能客服平台,并结合大模型企业提供的技术服务,基于大模型搭建 LangChain、RAG 框架,实现 RPA 自动流程。 对于普通用户是否有必要了解本地部署知识以及是否有必要自己搭建 agent 以及 rag,这取决于个人需求和兴趣。如果您希望更深入了解大模型的工作原理和运行机制,或者有特定的个性化需求,那么了解和尝试本地部署可能是有意义的。但如果只是一般的使用需求,可能无需深入了解和自行搭建。
2024-09-03
飞书接入deepseek 多维表格处理案例
以下是关于飞书接入 DeepSeek 多维表格处理的相关案例和信息: 自定义 AI(DeepSeek 版):https://bytedance.larkoffice.com/base/extension/replit_3f6c0f185eac23fb ,支持 DeepSeek R1、V3 模型,以及 DeepSeek 官方、火山方舟、硅基流动三个服务商。 有案例如“笨笨 v 泡泡”的 deepseekr1:7b 模型行测试题分析过程及结果,可参考:https://mp.weixin.qq.com/s/kjYiRS9RE25vywm0EsP6A?token=8615663&lang=zh_CN 。 相关文章和教程: 《突破 DeepSeek R1 能力天花板,火山引擎扣子+飞书一站式企业解决方案》:https://waytoagi.feishu.cn/wiki/RZE9wP94tiEO6bkU5cTcyecHnnb 。 《羊毛快薅|字节火山上线了 DeepSeek 系列模型并悄悄更改了模型服务价格...》:https://waytoagi.feishu.cn/wiki/HzHSwEwtCiBmWrkRm6fc0J0Qneh 。 《喂饭级教程:飞书多维表格+DeepSeek=10 倍速用 AI》:https://mp.weixin.qq.com/s/aIi4tIy0CCINyQE_3AfF_Q ,介绍了如何结合实现批量处理信息、提升工作效率等。 飞书多维表格的接入方法在整理列上这两天直播教程中的所有模板中有提及。 2 月 10 日的社区动态中有 DeepSeek R1 赏析分享会等相关内容。 2 月 14 日的社区动态中有关于另外一款推理模型 zero 的推理过程等相关内容。
2025-02-17
目前针对H5,有哪些可以和ai结合的案例
目前在 H5 领域,与 AI 结合的案例相对较少。但一些可能的方向包括:利用 AI 进行个性化内容推荐,根据用户的浏览历史和偏好为其推送相关的 H5 页面内容;通过 AI 实现智能客服,在 H5 页面中为用户提供实时的问题解答和帮助;运用 AI 图像识别技术,让用户可以通过拍照或上传图片在 H5 页面中获取相关信息或进行互动。
2025-02-17
AI智能体在企业应用案例
以下是一些 AI 智能体在企业中的应用案例: 决策智能体: 以 Anterior 为例,它是一家健康计划自动化公司,开发了用于自动化理赔提交审核的临床决策引擎。将付款方规则转换为有向无环图,智能体遍历决策树,利用 LLM 评估相关临床文件是否符合规则,在复杂任务中选择最佳方法并更新状态,直至最终确定。 Norm AI 正在为监管合规打造 AI 智能体,Parcha 正在为 KYC 建立智能体。 检索增强生成(RAG): 以 Sana 的企业搜索用例为例,应用程序加载和转换无结构文件,将其分块并作为向量嵌入存储在数据库中。当用户提问时,系统检索相关上下文块,折叠到“元提示”中与检索信息一起喂给 LLM,合成答复返回给用户。 Eve 法律研究的共同驾驭员会将研究查询分解为独立提示链,运行每个提示链生成中间输出,并综合编写最终备忘录。 生成式 AI 应用: 具有搜索、合成和生成三个核心用例,Menlo Ventures 投资组合公司如 Sana(企业搜索)、Eve(法律研究副驾驶)和 Typeface(内容生成 AI)是早期突破性的代表。 领先的应用程序构建商如 Anterior、Sema4 和 Cognition 正在建立解决方案,处理之前只能由大量人力解决的工作流程。借助多步逻辑、外部内存以及访问第三方工具和 API 等新型构建块,拓展 AI 能力边界,实现端到端流程自动化。
2025-02-16
开源模型的MIT模式、Apache、GPL、BSD模式的模型案例有哪些?
目前开源模型的 MIT 模式、Apache、GPL、BSD 模式的具体案例众多且不断更新。MIT 模式的开源模型如 TensorFlow Lite;Apache 模式的有 MXNet;GPL 模式的像 Gnuplot;BSD 模式的例如 OpenCV 等。但请注意,这只是其中的一部分,实际情况可能会有所变化。
2025-02-14
AI视频,用海螺走T台的案例
以下是关于 AI 视频中用海螺走 T 台的相关内容: 全新 AI 整活计划第三期:巨大萌物 奖励方式:使用海螺 AI 进行视频制作,海螺 AI 会评选出预计 10 位创意奖,给大家颁发海螺会员+现金奖励。 制作教程: 第一步:点开 whisk 网站(https://labs.google/fx/zh/tools/whisk),找到两张图(如:皮卡丘和埃菲尔铁塔),然后传上去,样式风格空着,写一句 Prompt(如:巨大的皮卡丘抱着埃尔菲铁塔)合成出来一张图片。 第二步:点开海螺网站(https://hailuoai.com),例如 Prompt:巨大的可达鸭在斗兽场上熟睡并打呼,肚皮缓慢起伏,马路上的车在行驶,突然斗兽场塌了,冒出滚滚沙尘,可达鸭突然惊恐地睁大眼睛;巨大的卡比兽,把一碗雪倒扣在富士山上,富士山瞬间被雪覆盖。并提供了相关视频案例的链接。 视频模型:MiniMax 海螺 AI 中级实现精准的画面控制和高画面表现,精准美学控制,给出了现代都市街道上摩托车与警车追逐的 Prompt 示例及相关视频。 实际运用案例(电影、广告片、宣传片、短视频),包括场戏分镜头拆解梳理,如男人无奈起身开门、开门、开门走出、门外小女孩要糖、男人拒绝等情节的视频生成方式及相关视频链接。
2025-02-13
寻找论文写作案例适合使用哪个ai工具?
在论文写作中,以下是一些常用的 AI 工具: 1. 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,能提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,方便进行数据分析和可视化。 Knitro:用于数学建模和优化的软件,有助于复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:虽不是纯粹的 AI 工具,但结合自动化和模板,能高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化论文编写。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 此外,对于帮助学生做好组会准备,Claude 和 Gamma.app 是不错的选择。Claude 能帮助快速寻找符合条件的论文、提取精炼论文信息、找到适合的 PPT 制作工具并教会使用。 在 AI 文章排版方面,一些流行的工具包括: 1. Grammarly:不仅是语法和拼写检查工具,还提供排版功能,改进文档风格和流畅性。 2. QuillBot:AI 驱动的写作和排版工具,改进文本清晰度和流畅性。 3. Latex:常用于学术论文排版,使用标记语言描述格式,有许多 AI 辅助的编辑器和插件。 4. PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 5. Wordtune:AI 写作助手,重新表述和改进文本,使其更清晰专业。 6. Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的工具取决于具体需求,如文档类型、出版标准和个人偏好。学术论文常用 Latex 和 Overleaf,一般文章和商业文档则 Grammarly 和 PandaDoc 等更适用。
2025-02-13
大模型的基本原理
大模型的基本原理如下: 1. 模仿人类大脑结构,表现出人的特征,应对大模型回答不及预期的解决之道与人与人交流沟通的技巧相似。 2. GPT 全称是生成式预训练转换器模型(Generative Pretrained Transformer): 生成式(Generative):大模型根据已有的输入为基础,不断计算生成下一个字词(token),逐字完成回答。例如,从提示词“How”开始,依次推理计算出“are”“you”等,直到计算出下一个词是的概率最大时结束输出。 3. 通俗来讲,大模型通过输入大量语料来让计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。其训练和使用过程可类比为上学参加工作: 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练。 确定教材:大模型需要大量数据,几千亿序列(Token)的输入基本是标配。 找老师:用合适算法讲述“书本”内容,让大模型更好理解 Token 之间的关系。 就业指导:为让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 搬砖:就业指导完成后进行推导(infer),如进行翻译、问答等。 4. 在 LLM 中,Token 被视为模型处理和生成的文本单位,可代表单个字符、单词、子单词等,在将输入进行分词时会对其进行数字化,形成词汇表。 5. 相关技术名词及关系: AI 即人工智能。 机器学习包括监督学习、无监督学习、强化学习,监督学习有标签,无监督学习无标签自主发现规律,强化学习从反馈里学习。 深度学习参照人脑有神经网络和神经元,神经网络可用于多种学习方式。 生成式 AI 可生成多种内容形式,LLM 是大语言模型,生成只是大语言模型的一个处理任务。 6. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出 Transformer 模型,基于自注意力机制处理序列数据,不依赖 RNN 或 CNN。
2025-02-17
千帆大模型开发平台
百度智能云的千帆大模型平台在解决大模型的调用、开发和应用开发方面表现出色。它支持调用文心大模型全系列模型,并提供全面的工具链,支持定制化的模型开发。在应用开发上,通过 AppBuilder 提供企业级 Agent 和企业级 RAG 开发能力,还能将企业应用中产生的数据经过评估和对齐进一步反馈到模型中,形成良性循环,持续优化模型性能。 2024 年上半年,百度智能云在 MaaS 市场和 AI 大模型解决方案市场中均获得第一名,市占率分别为 32.4%和 17%。MaaS 业务主要依托百度智能云千帆大模型平台提供服务,AI 大模型解决方案方面沉淀了八大行业解决方案。在 2024 百度世界大会上,百度智能云千帆大模型平台发布了工作流 Agent 能力,有助于企业更稳定、高效地实现多任务分解和执行。
2025-02-17
你是用什么模型来回答问题的?
我使用多种模型和相关知识来回答您的问题,包括但不限于以下内容: 2023 年度中文大模型基准测评报告中提到的 GPT4Turbo 和 gpt3.5turbo 等模型,并对其在准确性、相关性等方面的表现进行了评估。 智谱·AI 开源模型列表中的 WebGLM10B、WebGLM2B、MathGLM2B、MathGLM500M、MathGLM100M、MathGLM10M、MathGLMLarge 等模型,介绍了它们的特点和相关链接。 OpenAI 官方指南中提到的一些战术,如指示模型使用参考文本回答,包括提供参考文本和使用参考文本中的引文来回答等策略。 但具体回答您的问题所依据的模型和知识来源会根据问题的性质和需求而定。
2025-02-17
大语言模型幻觉的本质是什么
大语言模型幻觉的本质主要包括以下方面: 1. 大语言模型的底层原理是基于数学概率的文字预测,类似于文字接龙,这导致其存在幻觉问题,会在没有答案的情况下提供虚假信息,提供过时或通用的信息,从可信度低非权威来源的资料中提供结果等。 2. 样本存在错误,即如果大语言模型学习的“教材”中有错误,那么它也容易给出错误的回答。 3. 大语言模型技术的本质导致其输出结果具有不可预测性,且静态的训练数据导致其掌握的知识存在截止日期,无法即时掌握最新信息。 4. 大语言模型通过训练数据猜测下一个输出结果,可能因错误数据导致给出错误答案,优质数据集对其很重要。
2025-02-16
LLM 训练推理模型有哪些
以下是一些常见的 LLM 训练推理模型: 1. FengshenbangLM: 地址: 简介:是 IDEA 研究院认知计算与自然语言研究中心主导的大模型开源体系,开源了姜子牙通用大模型 V1,是基于 LLaMa 的 130 亿参数的大规模预训练模型,具备翻译、编程、文本分类、信息抽取、摘要、文案生成、常识问答和数学计算等能力。除姜子牙系列模型之外,还开源了太乙、二郎神系列等模型。 2. BiLLa: 地址: 简介:开源了推理能力增强的中英双语 LLaMA 模型。较大提升 LLaMA 的中文理解能力,并尽可能减少对原始 LLaMA 英文能力的损伤;训练过程增加较多的任务型数据,利用 ChatGPT 生成解析,强化模型理解任务求解逻辑;全量参数更新,追求更好的生成效果。 3. Moss: 地址: 简介:支持中英双语和多种插件的开源对话语言模型,MOSS 基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。 此外,Andrej Karpathy 的相关介绍中提到了 LLM 训练的一些情况,如训练过程涉及大约 10TB 的文本,通常来源于互联网的抓取,需要大量的互联网资源和一个 GPU 集群,费用大约 200 万美元。Karpathy 的视频还详细介绍了 LLM 训练的全部过程,包括预训练、有监督微调和强化学习等。
2025-02-16
ai的研究是否可以分为神经网络与知识图谱两个大的分类?
AI 的研究可以分为多个不同的分类,并非仅仅局限于神经网络与知识图谱这两个大的分类。 在常见的分类中: 非监督学习:最著名的是聚类,只需提供大量数据,让 AI 自行找出有趣信息。 迁移学习:在任务 A 中学习的内容可用于帮助完成任务 B,在计算机视觉领域有较多应用。 强化学习:根据输出好坏给予奖励或惩罚,利用“奖励信号”让 AI 自动学习最大化奖励,但需要大量数据。 生成对抗网络:由生成器和判别器构成,两者不断训练和竞争,提高生成真实数据的能力,广泛应用于多种领域。 此外,从技术和应用的角度来看: 知识图谱:在搜索等场景中展示关键信息,如人物相关信息、酒店信息等。 在企业中建构人工智能方面,NLG 可作为全新场景讨论,生成内容分为根据任务要求生成标准结果和根据信息进行内容创作两类,分别偏向 B 端和 C 端。NLP 能做的事情较标准化,LLM 的出现对其有提升和冲击。知识图谱领域本身有多种技术路径,与 LLM 可能是互补关系。 对于希望精进的学习者,还需要了解 AI 的背景知识,包括基础理论、历史发展、数学基础(统计学、线性代数、概率论),掌握算法和模型(监督学习、无监督学习、强化学习),学会评估和调优(性能评估、模型调优),以及神经网络基础(网络结构、激活函数)等。
2025-02-12
你是一个专业的AI工具测评师,用过市场上的所有AI工具,请制作一个PPT,介绍一个如何使用AI进行办公提效,并根据你的经验,对使用过的AI工具进行分类对比和测评,对比结果以表格形式呈现,需要包括是否收费,国内是否可用,主要面向对象,优点和缺点,突出功能等
以下是为您制作的关于如何使用 AI 进行办公提效以及 AI 工具分类对比和测评的 PPT 内容: 幻灯片 1:封面 标题:AI 助力办公提效及工具测评 幻灯片 2:目录 AI 在办公中的应用场景 常用 AI 办公工具分类对比 各工具的详细测评 幻灯片 3:AI 在办公中的应用场景 辅助文档处理 自动生成会议记录 办公文件分类管理 语言学习纠错 幻灯片 4:常用 AI 办公工具分类对比(表格形式) |工具名称|是否收费|国内是否可用|主要面向对象|优点|缺点|突出功能| |||||||| |平安好医生 APP|部分功能收费|是|医疗工作者和患者|辅助医生诊断,提高准确性|可能存在误判|辅助疾病诊断| |腾讯会议|部分高级功能收费|是|企业和个人|自动生成会议记录,方便回顾|语音识别准确性有待提高|会议记录生成| |字体管家 APP|部分字体收费|是|设计和文字工作者|生成多种书法字体|字体版权问题|书法字体生成| |醒图 APP|部分功能收费|是|摄影爱好者|提供构图建议,提升照片质量|对复杂场景的建议有限|摄影构图建议| |游戏内商城推荐功能|部分游戏收费|是|游戏玩家|根据需求推荐道具|推荐的精准度因人而异|游戏道具推荐| |彩云天气分时预报|部分功能收费|是|出行人群|提供精准分时天气预报|天气变化的不确定性|分时天气预报| |医渡云病历分析系统|收费|是|医疗机构|分析病历辅助诊断|数据安全性|病历分析| |讯飞听见会议总结功能|部分功能收费|是|企业和个人|自动总结会议发言内容|对复杂语言理解有限|会议发言总结| |书法临摹软件|部分功能收费|是|书法爱好者|提供临摹指导和评价|对不同书法风格的适应性|临摹辅助| |下厨房口味调整功能|部分功能收费|是|烹饪爱好者|根据反馈调整菜谱口味|口味调整的局限性|菜谱口味调整| |英语流利说纠错功能|部分课程收费|是|语言学习者|帮助纠正错误|对口语表达的纠错有限|语言学习纠错| |豆瓣电影剧情分析工具|免费|是|电影爱好者|提供剧情深度解读|分析的主观性|剧情分析| |腾讯文档分类功能|部分高级功能收费|是|企业和个人|自动分类办公文件|分类准确性依赖数据|文件分类| |美丽修行定制方案功能|部分功能收费|是|美容护肤人群|定制个性化护肤方案|方案的普适性|护肤方案定制| 幻灯片 5:总结 强调 AI 在办公领域的重要性和潜力 鼓励根据实际需求选择合适的 AI 工具提升办公效率 以上 PPT 内容仅供参考,您可以根据具体需求进行修改和完善。
2025-02-10
知识库中已有的ai工具按能力分类列举
以下是知识库中已有的 AI 工具按能力分类列举: 工具入门篇 数据工具: 多维表格小白之旅 适用人群:Excel 重度使用者、手动数据处理使用者、文件工作者 简要说明:用表格+AI 进行信息整理、提效、打标签,满足 80%数据处理需求 编程工具: Cursor 的小白试用反馈 适用人群:0 编程经验、觉得编程离我们很遥远的小白 简要说明:通过 AI 工具对编程祛魅,降低技术壁垒 音乐工具: Suno 的小白探索笔记 适用人群:0 乐理知识、觉得作词作曲和我们毫不相关成本巨大的小白 简要说明:AI 赋能音乐创作,无需乐理知识即可参与音乐制作 100 个 AI 应用 81 100: AI 菜谱口味调整工具 已有产品:下厨房口味调整功能 一句话介绍:根据用户反馈调整菜谱口味。 AI 语言学习纠错平台 已有产品:英语流利说纠错功能 一句话介绍:帮助语言学习者纠正错误。 AI 电影剧情分析系统 已有产品:豆瓣电影剧情分析工具 一句话介绍:分析电影剧情,提供深度解读。 AI 办公文件分类系统 已有产品:腾讯文档分类功能 一句话介绍:自动分类办公文件,方便管理。 AI 美容护肤方案定制平台 已有产品:美丽修行定制方案功能 一句话介绍:根据用户肤质定制护肤方案。 21 40: AI 菜谱生成平台 已有产品:豆果美食 APP 一句话介绍:根据用户口味和现有食材生成个性化菜谱。 AI 语言学习助手 已有产品:沪江开心词场 一句话介绍:辅助用户学习语言,提供个性化学习方案。 AI 电影推荐系统 已有产品:爱奇艺智能推荐 一句话介绍:根据用户喜好推荐电影,发现优质影片。 AI 办公自动化工具 已有产品:WPS Office 一句话介绍:提高办公效率,实现自动化办公流程。
2025-01-23
按你这个分类,机器学习和深度学习是并列的?
机器学习和深度学习不是并列的关系,而是包含关系。 机器学习是人工智能的一个子领域,其核心是让计算机通过对数据的学习来提高性能,不是直接编程告诉计算机如何完成任务,而是提供大量数据让机器找出隐藏模式或规律,进而预测新的、未知的数据。 深度学习是机器学习的一个子领域,它尝试模拟人脑的工作方式,创建人工神经网络来处理数据。这些神经网络包含多个处理层,深度学习模型能够学习和表示大量复杂的模式,在图像识别、语音识别和自然语言处理等任务中表现出色。 总之,深度学习是机器学习的一个分支,二者存在包含与被包含的关系。
2025-01-21
AI在教育上应用分类
AI 在教育上的应用主要包括以下几类: 1. 个性化学习:通过集成算法和大数据分析,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源,如 Knewton 平台。 2. 自动评估:利用自然语言处理技术(NLP)自动批改学生的作文和开放性答案题,如 Pearson 的 Intelligent Essay Assessor,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学:推出智能辅助教学工具,如 AI 教师引导学生通过对话学习、解答疑问并提供即时反馈,Google 的 AI 教育工具 AutoML 用于创建定制学习内容,提高学习动机和知识掌握程度。 4. 虚拟现实(VR)和增强现实(AR):学生可通过 VR 头盔进入虚拟实验室进行安全实验操作并获得 AI 系统反馈,如 Labster 的虚拟实验室平台。
2025-01-14
AI用途分类
AI 的用途分类广泛,主要包括以下方面: 1. 医疗保健: 医学影像分析,辅助诊断疾病。 药物研发,加速研发过程。 个性化医疗,提供个性化治疗方案。 机器人辅助手术,提高手术精度和安全性。 2. 金融服务: 风控和反欺诈,降低金融机构风险。 信用评估,帮助做出贷款决策。 投资分析,辅助投资者决策。 客户服务,提供 24/7 服务并回答常见问题。 3. 零售和电子商务: 产品推荐,分析客户数据推荐感兴趣产品。 搜索和个性化,改善搜索结果和提供个性化购物体验。 动态定价,根据市场需求调整产品价格。 聊天机器人,回答客户问题和解决问题。 4. 制造业: 预测性维护,预测机器故障避免停机。 质量控制,检测产品缺陷提高质量。 供应链管理,优化供应链提高效率和降低成本。 机器人自动化,控制工业机器人提高生产效率。 5. 交通运输: 自动驾驶,提高交通安全性和效率。 交通管理,优化信号灯和交通流量缓解拥堵。 物流和配送,优化路线和配送计划降低运输成本。 无人机送货,将货物快速送达偏远地区。 6. 其他应用场景: 教育,提供个性化学习体验。 农业,分析农田数据提高农作物产量和质量。 娱乐,开发虚拟现实和增强现实体验。 能源,优化能源使用提高能源效率。 在汽车行业,AI 的应用案例包括: 1. 自动驾驶技术,自主导航和驾驶。 2. 车辆安全系统,预防事故。 3. 个性化用户体验,根据偏好和习惯调整车辆设置。 4. 预测性维护,预测潜在故障和维护需求。 5. 生产自动化,提高生产效率和质量控制。 6. 销售和市场分析,理解客户需求制定策略和优化定价。 7. 电动化和能源管理,优化电池使用和充电策略。 8. 共享出行服务,优化路线规划、调度车辆和定价策略。 9. 语音助手和车载娱乐,通过语音控制车辆功能和获取信息。 10. 车辆远程监控和诊断,实时了解车辆状况并提供支持。
2025-01-14