Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

最新的关于AI大模型的新闻资讯

Answer

以下是为您提供的关于 AI 大模型的最新新闻资讯:

  • 中国国内的大模型排名可能在短时间内会有变化,作为 AI 机器人无法提供最新的信息。要获取最新的中国国内大模型排名,您可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台,这些渠道通常会及时发布最新的排名和评价。在通往 AGI 之路的知识库里,在AI 研究报告版块-企业及媒体报告会定期更新相关的排名报告,可以供您查阅。内容由 AI 大模型生成,请仔细甄别。
  • 智能纪要中提到了 AI 模型及相关进展,包括视频生成模型、相关论文,以及 AI 在诺奖和蛋白质研究领域的应用等。还介绍了人工智能的发展历程,从图灵测试、早期的图灵机器人和 ELISA,到 IBM 的语音控制打印机、完全由人工智能创作的小说、微软的同声传译系统,再到 OpenAI 发布 ChatGPT 模型,经历了萌芽、积累沉淀到如今大模型和多模态模型百花齐放的阶段。大模型由数据、算法、算力构成,算法有技术架构的迭代,如英伟达的显卡辅助模型训练,而数据的质量对生成理想的大模型至关重要。针对弱智 8 的问题对大模型进行测试,还开展了让大模型回复问题并找出真人回复的活动,且国内大模型的回答能力有很大改进。
  • 作者 Bay 于 24.01 月底撰写了关于 GPTs、中间层、Chatbot 虚拟社交、AI Agent,大模型应用最新方向解析的文章。这期间虽然 AI 新闻如火如荼,作者个人感知大模型应用生态并没有太多变化,但还是想记录下近期在大模型应用上的现象观察和浅显见解。这篇文章的内容会有点杂,会从 GPTs、大模型中间层(Dify/Coze)、大火的虚拟社交(Character.AI 等)聊到 AI Agent、大模型的多模态能力和产品推荐,涵盖了 23 年下半年至今大模型应用领域的最新进展。全文 1w 字。
Content generated by AI large model, please carefully verify (powered by aily)

References

问:最新的国内大模型排名

中国国内的大模型排名可能在短时间内会有变化,作为AI机器人无法提供最新的信息。要获取最新的中国国内大模型排名,你可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台,这些渠道通常会及时发布最新的排名和评价。在通往AGI之路的知识库里,在[AI研究报告版块](https://waytoagi.feishu.cn/wiki/WvhZwk16WiEnSvk8AcpcdZetnMe?table=tblzSv68AMuLhHj8&view=vewwFuhGE0)-[企业及媒体报告](https://waytoagi.feishu.cn/wiki/WvhZwk16WiEnSvk8AcpcdZetnMe?table=tblzSv68AMuLhHj8&view=vewwFuhGE0)会定期更新相关的排名报告,可以供您查阅。内容由AI大模型生成,请仔细甄别。

02-基础通识课

[heading2]总结AI模型及相关进展:讨论了AI模型的基础、最新进展,包括视频生成模型、相关论文,以及AI在诺奖和蛋白质研究领域的应用等。人工智能的发展历程与大语言模型人工智能发展历程:从图灵测试、早期的图灵机器人和ELISA,到IBM的语音控制打印机、完全由人工智能创作的小说、微软的同声传译系统,再到OpenAI发布ChatGPT模型,经历了萌芽、积累沉淀到如今大模型和多模态模型百花齐放的阶段。大模型的基石:大模型由数据、算法、算力构成,算法有技术架构的迭代,如英伟达的显卡辅助模型训练,而数据的质量对生成理想的大模型至关重要。弱智8相关活动:针对弱智8的问题对大模型进行测试,还开展了让大模型回复问题并找出真人回复的活动,且国内大模型的回答能力有很大改进。大语言模型的特点:早期大语言模型回复缺乏情感,如今有所改进,后续将体验几个大模型的回复场景。

GPTs 、中间层、Chatbot虚拟社交、AI Agent, 大模型应用最新方向解析

本文作者Bay,写于24.01月底,关注公众号“Bay的设计奥德赛”可接受及时推送[heading1]前言[content]距离上次写大模型应用已经过去了大半年这期间虽然AI新闻如火如荼,我个人感知大模型应用生态并没有太多变化,但还是想记录下近期在大模型应用上的现象观察和浅显见解。这篇文章的内容会有点杂,会从GPTs、大模型中间层(Dify/Coze)、大火的虚拟社交(Character.AI等)聊到AI Agent、大模型的多模态能力和产品推荐,涵盖了23年下半年至今大模型应用领域的最新进展。全文1w字,enjoy~

Others are asking
今日2月13日的AI新闻资讯
以下是 2 月 13 日的 AI 新闻资讯: 1. 在巴黎 AI 峰会上,斯坦福教授李飞飞强调当前是“真正的第一个 AI 时代”。她追溯五亿年生命演化,探讨现代 AI 的三大支柱:感知算法突破、认知科学启示和计算能力提升。李飞飞提到,“数据是让神经网络真正活起来的关键”,呼吁以人为本的 AI,维护尊严、增强能力、促进社区发展,构建健康的 AI 生态系统。另附《全球 AI 竞争白热化:巴黎峰会上,欧盟宣布 2000 亿欧元追赶,美国:全球技术规则听我的》。 2. 中美 AI 创业者的闭门讨论聚焦于 DeepSeekR1 的技术创新与行业趋势。DeepSeek 以其混合专家模型和强化学习优化推理能力,显著降低了成本,推动 AI 应用的普及。与传统模型不同,DeepSeek 将用户体验置于核心,未来的 AI 产品不再局限于语言交互,而是向更广泛的垂直应用扩展。 3. 雪佬精心撰写了一份超详细的 AI 配音工具教程,涵盖剪映、DubbingX、海螺 AI 三大主流配音工具的全流程实操指南,讲解了音频导入、AI 音色克隆、文本朗读、语速调整、情绪选择、背景音优化等核心功能,还分享了进阶操作。 4. 社区伙伴 Hua 投稿了在微软 Azure AI Foundry 平台上完成 DeepSeek R1(671B)模型的完整部署流程,包含环境准备、资源管理、模型测试及 API 调用说明。 5. Anthropic 正式发布 Anthropic AI Economic Index,聚焦 AI 对经济的长期影响。该指数从职业和具体工作任务两个维度,量化 AI 对劳动力市场的影响。 6. DeepSeekR1 的火爆现象背后,企业可以获得显著提升。其强化学习和联网搜索能力,改变了信息获取方式,从“检索—阅读—摘要”转变为“提问—获得答案”,大幅提升工作效率。同时,DeepSeek 的开源策略打破了技术垄断,让国内大模型能力迅速提升。
2025-02-13
今日二月13日的AI新闻资讯
以下是 2 月 13 日的部分 AI 新闻资讯: 在巴黎 AI 峰会上,斯坦福教授李飞飞演讲称当前是“真正的第一个 AI 时代”。她追溯五亿年生命演化,探讨现代 AI 的三大支柱:感知算法突破、认知科学启示和计算能力提升。李飞飞提到“数据是让神经网络真正活起来的关键”,呼吁以人为本的 AI,维护尊严、增强能力、促进社区发展,构建健康的 AI 生态系统。相关报道:《》 全球 AI 竞争白热化,巴黎峰会上,欧盟宣布 2000 亿欧元追赶,美国称全球技术规则听它的。相关报道:《》 《》介绍推理模型代表了一种新范式,专注于解决复杂、多步骤的问题。与传统模型不同,推理模型通过思考输入意图,逐步提供答案,擅长解谜和高级数学等挑战性任务。然而,其成本高昂且容易出错,适用场景有限。DeepSeek 推出的多种变体(如 R1Zero 和 R1Distill)展示了不同的训练策略和性能表现。
2025-02-13
新闻资讯场景可以和现在的ai能力结合出哪些新的应用场景
新闻资讯场景与当前 AI 能力结合可以产生以下新的应用场景: 1. 文本生成和内容创作:生成连贯、有逻辑的新闻报道、评论等文本内容。 2. 聊天机器人和虚拟助手:为用户提供新闻相关的咨询和服务。 3. 编程和代码辅助:辅助新闻资讯平台的开发和优化。 4. 翻译和跨语言通信:促进不同语言背景的用户获取新闻资讯。 5. 情感分析和意见挖掘:分析新闻评论中的用户情感和观点,为新闻报道提供参考。 6. 教育和学习辅助:创建与新闻相关的学习材料,辅助新闻知识的学习。 7. 图像和视频生成:根据新闻内容生成相应的图像和视频。 8. 游戏开发和互动体验:将新闻元素融入游戏,增强用户的沉浸式体验。 9. 医疗和健康咨询:提供与健康新闻相关的初步建议和信息查询服务。 10. 法律和合规咨询:帮助解读与新闻相关的法律文件和合规问题。 在专业创作者方面,AI 生成能够为新闻类作品赋予独特风格和想象力,为创作者提供灵感,降低后期制作的门槛和成本。目前该应用主要集中在新闻相关的音乐 MV、短篇电影、动漫等方向。 对于自媒体、非专业创作者,AI 可以帮助解决视频剪辑痛点,如为科技、财经、资讯类重脚本内容的视频生成分镜、视频,降低视频素材制作门槛,还能将文章高效转成视频内容,以及解决同一素材在不同平台分发的成本问题。 对于企业客户,AI 视频生成可以为没有足够视频制作资金的小企业、非盈利机构大幅缩减新闻相关视频的制作成本。
2024-12-17
整理新闻资讯的工具
整理新闻资讯的AI工具可以帮助用户高效地获取、分类和总结新闻内容。以下是一些高效的新闻资讯整理工具: 1. Feedly Feedly是一个广泛使用的新闻聚合工具,利用AI技术进行内容推荐和分类。用户可以订阅不同的新闻源,创建主题板块,并使用其AI助手Leo进行智能筛选和推荐。 功能: 新闻聚合、智能推荐、内容分类 链接: 2. Pocket Pocket是一款内容保存和管理工具,用户可以保存感兴趣的新闻文章,并使用其AI功能进行推荐和分类。它支持离线阅读,方便用户随时查看保存的内容。 功能: 内容保存、智能推荐、离线阅读 链接: 3. Inoreader Inoreader是一款功能强大的新闻阅读和聚合工具,支持订阅RSS源、关键字搜索和内容分类。其AI功能可以根据用户的阅读习惯进行个性化推荐。 功能: RSS订阅、智能推荐、内容分类 链接: 4. NewsBlur NewsBlur是一个个人新闻阅读器,结合AI技术提供个性化的新闻摘要和推荐。用户可以订阅各种新闻源,并使用其智能过滤功能筛选重要内容。 功能: 新闻聚合、智能过滤、个性化推荐 链接: 5. Flipboard Flipboard是一款视觉上非常吸引人的新闻聚合工具,用户可以根据兴趣创建“杂志”来收集和整理新闻资讯。其AI算法会根据用户的阅读习惯进行个性化推荐。 功能: 新闻聚合、个性化推荐、杂志创建 链接: 6. SmartNews SmartNews是一款基于AI的新闻聚合应用,可以从各种新闻源中提取最重要的新闻,并提供简洁的摘要。其AI技术可以根据用户兴趣和阅读习惯推荐新闻内容。 功能: 新闻聚合、智能推荐、新闻摘要 链接: 7. Nuzzel Nuzzel是一款社交新闻聚合工具,通过分析用户社交网络中的热门话题和新闻进行推荐。其AI功能可以自动整理和推荐与用户兴趣相关的新闻资讯。 功能: 社交新闻聚合、智能推荐、热门话题 链接: 8. Curata Curata是一款内容策划和管理工具,适用于企业用户。其AI功能可以自动收集、筛选和分类新闻资讯,帮助企业创建和管理内容营销策略。 功能: 内容策划、智能分类、内容管理 链接: 实际应用步骤 1. 选择工具: 根据需求选择合适的新闻聚合和整理工具。 2. 订阅新闻源: 添加感兴趣的新闻源和主题,设置关键字和过滤条件。 3. 使用AI推荐: 利用工具的AI推荐功能,获取个性化的新闻内容。 4. 分类和整理: 创建分类板块或“杂志”,整理和管理新闻资讯。 5. 定期查看和更新: 定期查看和更新订阅内容,保持资讯的时效性和相关性。 通过这些工具,用户可以高效地获取、整理和管理新闻资讯,确保在信息爆炸的时代能够快速找到和阅读最相关的内容。
2024-06-17
AI研报
以下是为您提供的一些 AI 研报: 2024 年 6 月 18 日: 《》:讨论了生成式人工智能的潜力和银行业的积极探索,预测 AI 将在提高支付处理效率和创造新收入流方面发挥关键作用。 华西证券:AIGC 行业深度报告(14)《》:英伟达新一代 GPU 架构将带来零部件升级,华为的昇腾 910C 芯片和 Atlas 900 SuperCluster 展示了国产算力集群的潜力。 《》:通过访谈 30 余位专家,分析了端到端技术的发展、主要参与者、驱动力和挑战。预计到 2025 年,模块化端到端系统将开始商业化应用,推动技术、市场和产业格局的变革。 《》:来自微软,英国拥有先进科技行业和数字优势,但与其他国家相比领先优势有限,面临基础设施、数字技能和数字技术采用的瓶颈。 2023 年 11 月 15 日: 《》:基于对 235 家企业数字化负责人的调研,其中 63.5%的企业已把 AIGC 列入企业发展战略之中。 《》:结合华为行业智能化实践及面向智能世界 2030 的展望,与业界专家学者进行万场以上座谈研讨,凝聚各方智慧与经验。 《》:从零开始介绍越狱、提示攻击、与传统安全的关系以及大语言模型的安全问题。 《AI50 年度关键词——腾讯研究院.pdf》: 基于全年研究积累的三十余万字 AI 进展数据库,对当前 AI 发展进行阶段性总结。精选 50 个年度关键词,覆盖大模型技术的八大领域,通过“快思考”与“慢思考”两种维度进行分析,形成 50 张 AI 技术图景卡片。 介绍了 DiT 架构,这是结合扩散模型和 Transformer 的架构,用于高质量图像生成的深度学习模型,并给出了核心观察。
2025-02-20
目前通过AI给自己擅长的领域赋能,且已经产生收益的案例有哪些
以下是一些通过 AI 给自己擅长的领域赋能且已经产生收益的案例: 在法律法规领域,AI 已在多个方面带来重大进展和效率提升,如交通监控、银行账户欺诈检测、工业大规模安全关键实践的控制,以及加速新药发现和应对气候变化的技术等。 在企业应用方面,工作流程自动化平台 ServiceNow 通过 AI 驱动的 Now Assist 实现了近 20%的事件避免率;Palo Alto Networks 利用 AI 降低了处理费用的成本;Hubspot 利用 AI 扩大了能够支持的用户规模;瑞典金融科技公司 Klarna 通过将 AI 融入用户支持,在运行率方面节省了 4000 多万美元。如今,成千上万的公司正在将 AI 整合到他们的工作流程中,以扩张规模和降低成本。
2025-02-20
你和市面上的AI产品有什么不同吗
市面上的 AI 产品多种多样,具有以下特点和差异: 为了以更低的门槛帮用户获得更高质量的 Prompt,从而更好地驱动模型,不同产品采取了多种方式,如 GPTs 用对话引导获取用户信息,Jasper 拆解场景流程按步骤收集信息,Leonardo 用画布和实时反馈加速 Prompt 提升,Novel 用交互式、渐进式续写,c.ai 卷生态卷模型,筑梦岛探索更多场景的对话玩法,FlowGPT 直接以 Prompt 的分享为核心,小悟空数据驱动优化 Prompt 等。 在这个过程中,还发现了一些现象:GUI、LUI 的结合会极大提高产品体验;随着模型能力提升,实时反馈会越发重要;模型能力在现阶段依旧是 AI 产品的核心竞争力;互联网产品的很多思维和方法论出现在大量的 AI 产品上;产品形式和模型能力还很接近,产品还在技术应用的阶段。当前阶段的 AI 产品还普遍体现出初级产品化、强行产品化的特征,与传统互联网产品中的佼佼者们对比,在需求和体验上存在巨大差距。或许等到用户无法直接感知这个 AI 产品是在使用什么模型,AI 产品的形态和范式才算真正成熟。 在开发者工具方面,这个选项更加技术化,能让用户对外形因素以及 AI 伴侣的个性有最大的控制权。用户可以组合多种工具创造理想中的伴侣,并通过短信、电话甚至实时视频聊天与其互动。具体包括: 个性(LLM 的文本):一些开源模型(尤其是 Vicuna 和 Pygmalion)经过微调,在特定个性到无审查的角色扮演等应用场景中表现出色。 记忆(向量存储):像 Pinecone 这样的向量存储系统可建立持续关系,配置代码存储长期记忆、背景故事等独特信息。 语音(语音合成):像 ElevenLabs 这样的产品可赋予伴侣声音,控制年龄、性别和口音。 外表(SD 模型作图):LoRAs(类似于 Civitai 上的那些)可精细控制 AI 伙伴的图像风格、细节和设置。 动画(视频动画):像 DID 和 HeyGen 这样的工具可使图像“说话”,但可用的高保真度生成说话人脸的模型不多。 平台:是伴侣的基础代码和内部逻辑执行的地方。如今大多数开发者在 GCP 和 AWS 上部署运行,像 Steamship(其中运行 GirlfriendGPT)这样的解决方案正迅速获得关注。 UI 层:一个前端界面,让用户能够与合作伙伴实际互动。SillyTavern、Agnaistic 和 KoboldAI 是受欢迎的选择。 还推出了用于开始构建人工智能应用的开源模板,包含从零开始编码伴侣所需的基本要素,后续还将发布文章和更多开源项目,详细介绍开发者创建人工智能伴侣的技术栈。
2025-02-20
如何运用ai生成短视频
以下是一些运用 AI 生成短视频的方法和工具: 1. ChatGPT + 剪映:ChatGPT 可生成视频脚本,剪映能根据脚本自动分析并生成所需素材和文本框架,实现从文字到画面的快速转化,节省时间和精力。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容,无需视频编辑或设计经验。 4. VEED.IO:提供 AI 图像和脚本生成器,帮助用户从图像制作视频,并规划视频内容。 5. Runway:AI 视频创作工具,能将文本转化为风格化视频内容,适用于多种场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,可根据文本脚本生成视频。 此外,在运营方面,腾讯运营可以通过 ChatGPT 生成文案,将其复制到支持 AI 文字转视频的工具内实现短视频自动生成。例如,市面上的一些手机剪辑软件,如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类工具操作相对简单,让大众更轻松地制作视频。但需注意,系统匹配的素材不符合要求时可手动替换。 以上内容由 AI 大模型生成,请仔细甄别。
2025-02-20
ai智能体是什么
AI 智能体是指类似于 AI 机器人小助手的存在。参照移动互联网,它类似 APP 应用的概念。简单来说,就是拥有各项能力来帮助人们做特定事情的“打工人”。 随着 ChatGPT 与 AI 概念的爆火,出现了很多相关新名词,如“智能体 Agent”“bot”和“GPTs”等。AI 大模型是一种技术,而面向用户提供服务的是产品,因此很多公司开始关注 AI 应用层的产品机会,出现了不少智能体开发平台,如字节的扣子、阿里的魔搭社区等。 在 C 端,比如社交方向,用户注册后先捏一个自己的智能体,然后让其与他人的智能体聊天,两个智能体聊到一起后再真人介入,这是一种有趣的场景;还有借 Onlyfans 入局打造个性化聊天的创业公司。在 B 端,如果字节扣子和腾讯元器是面向普通人的低代码平台,类似 APP 时代的个人开发者,那还有帮助 B 端商家搭建智能体的机会。 AI 智能体包含了自己的知识库、工作流,还可以调用外部工具,再结合大模型的自然语言理解能力,能够完成比较复杂的工作。其出现是为了解决如 GPT 或文心一言大模型存在的胡编乱造、时效性、无法满足个性化需求等问题,用户可以结合自己的业务场景和需求,创建自己的智能体来解决问题。
2025-02-20
有哪些AI网站是支持视频文字提取的?
以下是一些支持视频文字提取的 AI 网站及相关操作方法: 对于 B 站视频,如果视频有字幕,您可以安装油猴脚本“Bilibili CC 字幕工具”(https://greasyfork.org/zhCN/scripts/378513bilibilicc%E5%AD%97%E5%B9%95%E5%B7%A5%E5%85%B7 )。安装后刷新浏览器,点击字幕会多出一个“下载”按钮,可选择多种字幕格式,如带时间或不带时间的。然后将下载的字幕文字内容全选复制发送给 GPTs 进行总结。 需要注意的是,目前大部分用 AI 总结视频的工具、插件或应用都是通过提取视频字幕来实现的。
2025-02-20
模型微调是怎么实现的
模型微调是一种迁移学习技术,常用于深度学习中。其基本思路是先有一个在大量数据上预训练的模型,已学会一些基本模式和结构,然后在特定任务数据上继续训练以适应新任务。 以下是关于模型微调的具体实现步骤: 1. 准备和上传训练数据。 2. 训练新的微调模型: LoRA 微调: 脚本见:。 具体实现代码见。 单机多卡的微调可通过修改脚本中的include localhost:0 来实现。 全量参数微调: 脚本见:。 具体实现代码见。 3. 加载微调模型: LoRA 微调:基于 LoRA 微调的模型参数见基于 Llama2 的中文微调模型,LoRA 参数需和基础模型参数结合使用。通过加载预训练模型参数和微调模型参数。 全量参数微调:调用方式同模型调用代码示例,只需修改其中的模型名称或保存路径。 微调的优点包括: 1. 比即时设计更高质量的结果。 2. 能够训练比提示中更多的例子。 3. 由于更短的提示而节省了 Token。 4. 更低的延迟请求。 微调目前仅适用于以下基础模型:davinci、curie、babbage 和 ada。 以下是两个帮助理解微调概念的例子: 1. 情感分类:先使用大量语料库预训练模型,使其学会基本语法和单词语义,再收集标注过的电影评论(积极或消极)继续训练模型,使其学会判断评论情感。 2. 图像分类:先使用大量图片(如 ImageNet 数据集)预训练模型,使其学会识别图片中的基本形状和纹理,再收集标注过的猫和狗的图片继续训练模型,使其学会区分猫和狗。
2025-02-19
汇总一下现在的大语言模型都有哪些,国外和国内的模型分别列出来
以下是国内外的大语言模型汇总: 国外大语言模型: GPT4(OpenAI):目前最先进的自然语言生成模型,可用于回答问题、撰写文章等。 Gemini Ultra(Google):多模态人工智能模型,采用神经网络架构,对标 GPT4,可用于回答问题、生成代码、处理文本等。 Claude 3 Opus(Anthropic):多模态模型,能处理超过 1 百万 token 的输入,具有实时聊天、数据处理、分析预测等功能;实现了接近完美的召回率。 国内大语言模型: 文心一言(百度):大语言模型,可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。 讯飞星火:目前体验效果较好。 悟道・天鹰(北京智源人工智能研究院):首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。 清华 ChatGLM 。 此外,国内还有通用模型如通用模型如文心一言、讯飞星火等,处理自然语言;还有垂直模型,专注特定领域如小语种交流、临床医学、AI 蛋白质结构预测等。
2025-02-19
0到1使用大语言模型
以下是关于 0 到 1 使用大语言模型的相关内容: Ollama 框架: 1. 支持多种大型语言模型,如通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 2. 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 CPU 和 GPU。 3. 提供模型库,用户可从中下载不同参数和大小的模型,通过 https://ollama.com/library 查找。 4. 支持用户自定义模型,例如修改温度参数调整创造性和连贯性,或设置特定系统消息。 5. 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 6. 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 7. 安装完后,确保 ollama 后台服务已启动(在 mac 上启动 ollama 应用程序,在 linux 上通过 ollama serve 启动),可通过 ollama list 确认。 大模型安全: 1. 通过对齐(指令调优)使语言模型更好理解人类意图并增加安全保障,可拆解为监督微调、获取 reward model 和强化学习调整输出分布两部分。 2. LLAMA2 专门使用安全有监督微调确保语言模型安全。 3. 强化学习通过引入人类反馈数据调整模型输出分布,使模型面对训练分布外数据时能拒绝不当回答。 4. 但 Alignment 并不足以防护所有安全问题,存在越狱(Jailbreak)情况,导致模型对齐失效。 5. 还需关注隐私问题。 大模型架构与特点: 1. 包括 encoderonly、encoderdecoder 和 decoderonly 三种架构,目前熟知的 AI 助手多为 decoderonly 架构。 2. 大模型预训练数据量大,来自互联网,参数多,如 Open 在 2020 年发布的 GPT3 已达 170B 参数。 3. GPT3 可根据任务描述和示例完成任务,ChatGPT 则通过对话完成任务,二者在形式和安全性上有差别。
2025-02-19
deepseek的论文里面讲的混合专家模型怎么理解
混合专家(MoE)模型是一种在深度学习中提升计算效率的架构。以 DeepSeek 为例,其最新模型 V3 与 R1 采用了这种架构。 在 DeepSeek 的 V3 模型中,引入了多头潜注意力(MLA),将 KV 缓存压缩至新低,从而提升了计算性能。R1 模型则通过强化学习激活推理能力,首次验证无需监督微调即可实现推理。 DeepSeek 的 2360 亿参数的 DeepSeekV2 是 60 位专家混合开源模型,在数学、编码和推理方面表现出色,具有 236B 参数,21B 在生成过程中被激活,在 MTBench 上表现优异,中文能力强且性价比高。 您可以通过以下链接获取更详细的介绍:https://xiaohu.ai/p/7468 、https://zhuanlan.zhihu.com/p/21208287743 。
2025-02-19
我想做一个产品(生涯规划领域的垂直大模型),这个产品服务的对象是所有人:帮助所有人进行更好的职业规划。每个人都能通过使用这个产品更好地了解自己,了解自己的天赋、兴趣、优势,然后找到自己的热爱的领域和热爱的事业,并且能够个性化地推荐相关的行业和职业,包括职业的主要工作内容和核心能力要求等等。 请对这个产品进行可行性分析,并给出产品的发展规划,别忘了给这个项目起一个名字。
以下是对您提出的生涯规划领域垂直大模型产品的可行性分析和发展规划,并为项目取名为“生涯智途”。 可行性分析: 1. 需求广泛:帮助人们进行职业规划是一个普遍存在的需求,涵盖了各个年龄段和职业阶段的人群。 2. 数据可用性:可以通过各种渠道收集大量与职业相关的数据,包括行业报告、职位描述、人才需求等。 3. 技术支持:当前大模型技术的发展为实现这样的产品提供了可能,能够处理和分析大量复杂的数据。 发展规划: 1. 数据收集与整理:广泛收集各类职业数据,建立丰富的数据库,确保数据的准确性和完整性。 2. 模型训练与优化:利用收集到的数据进行模型训练,不断优化模型,提高预测和推荐的准确性。 3. 功能开发: 个性化测评:开发能够准确评估用户天赋、兴趣、优势的功能模块。 精准推荐:根据用户的特点,提供个性化的行业和职业推荐,并详细介绍职业的工作内容和核心能力要求。 持续学习与更新:随着行业变化,及时更新数据和模型,以提供最新的职业信息。 4. 用户体验优化:设计简洁、易用的界面,提供良好的用户交互体验。 5. 市场推广:通过线上线下多种渠道进行推广,提高产品的知名度和用户覆盖面。 希望以上分析和规划对您有所帮助。
2025-02-18
现在大语言模型的跑分对比
对比不同大语言模型的性能需要考虑多个维度,包括但不限于以下方面: 1. 理解能力:评估对语言的语法、语义、上下文和隐含意义的理解程度。 2. 生成质量:检查生成文本的流畅性、相关性和准确性。 3. 知识广度和深度:掌握广泛主题的知识程度,以及对特定领域或话题的理解深度。 4. 泛化能力:处理未见过的任务或数据时的表现。 5. 鲁棒性:应对错误输入、对抗性输入或模糊不清指令的能力。 6. 偏见和伦理:生成文本时是否存在偏见,是否遵循伦理标准。 7. 交互性和适应性:在交互环境中的表现,包括对用户反馈的适应性和持续对话的能力。 8. 计算效率和资源消耗:考虑模型大小、训练和运行所需的计算资源。 9. 易用性和集成性:是否易于集成到不同应用和服务中,提供的 API 和工具的易用性。 为了进行有效的比较,可以采用以下方法: 1. 标准基准测试:使用如 GLUE、SuperGLUE、SQuAD 等标准的语言模型评估基准,它们提供统一的测试环境和评分标准。 2. 自定义任务:根据特定需求设计任务,评估模型在特定领域的表现。 3. 人类评估:结合人类评估者的主观评价,特别是在评估文本质量和伦理问题时。 4. A/B 测试:在实际应用场景中,通过 A/B 测试比较不同模型的表现。 5. 性能指标:使用准确率、召回率、F1 分数、BLEU 分数等性能指标来量化比较。 当前领先的大型语言模型的排行榜,例如聊天机器人竞技场,由伯克利的团队管理,根据 ELO 评级对不同语言模型进行排名,计算方式与国际象棋中的类似。在排行榜中,顶部多为专有模型,下方有开放权重的模型。 大语言模型的特点包括: 1. 架构:有 encoderonly、encoderdecoder、decoderonly 等,如 BERT 是 encoderonly 模型,google 的 T5 是 encoderdecoder 模型,众多 AI 助手多为 decoderonly 模型。 2. 数据和参数:预训练数据量大,往往来自互联网,包括论文、代码、公开网页等,参数多,如 OpenAI 在 2020 年发布的 GPT3 已达到 170B 的参数。
2025-02-18
RAG最新进展
RAG(检索增强生成)是由 Lewis 等人于 2020 年中期提出的一种大语言模型领域的范式。 其发展经历了以下阶段: 1. 2017 年创始阶段,重点是通过预训练模型吸收额外知识以增强语言模型,主要集中在优化预训练方法。 2. 大型语言模型如 GPT 系列在自然语言处理方面取得显著成功,但在处理特定领域或高度专业化查询时存在局限性,易产生错误信息或“幻觉”,特别是在查询超出训练数据或需要最新信息时。 3. RAG 包括初始的检索步骤,查询外部数据源获取相关信息后再回答问题或生成文本,此过程为后续生成提供信息,确保回答基于检索证据,提高输出准确性和相关性。 4. 在推断阶段动态检索知识库信息能解决生成事实错误内容的问题,被迅速采用,成为完善聊天机器人能力和使大语言模型更适用于实际应用的关键技术。 RAG 在多个基准测试中表现出色,如在 Natural Questions、WebQuestions 和 CuratedTrec 等中表现抢眼。用 MSMARCO 和 Jeopardy 问题进行测试时,生成的答案更符合事实、具体和多样,FEVER 事实验证使用后也有更好结果。基于检索器的方法越来越流行,常与 ChatGPT 等流行大语言模型结合使用提高能力和事实一致性,在 LangChain 文档中有相关使用例子。 同时,对增强生成检索的兴趣增长促使了嵌入模型质量的提高,传统 RAG 解决方案中的问题也得到解决。
2025-02-20
哪里可以学习最新AI
以下是一些学习最新 AI 的途径和建议: 1. 持续学习和跟进:AI 是快速发展的领域,新成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。 2. 加入相关社群和组织:参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。例如“通往 AGI 之路”这样的中文知识库和社区平台,它汇集了上千个人工智能网站和工具,提供最新的 AI 工具、应用、智能体和行业资讯,还有丰富的学习资源、实践活动,并倡导开放共享的知识体系。 3. 参考学习日记:如《雪梅 May 的 AI 学习日记》,其中提到适合纯 AI 小白的学习模式,即输入→模仿→自发创造。但需注意学习内容可能因 AI 发展而变化,可在相关社区发现自己感兴趣的领域,学习最新内容。 4. 利用免费开源资源:很多学习资源是免费开源的,充分利用这些资源进行学习。
2025-02-18
最新的AI行业动态和进展有哪些,包含2025年
以下是关于最新的 AI 行业动态和进展(包含 2025 年)的内容: 2024 年: 图片超短视频的精细操控:包括表情、细致动作、视频文字匹配。 有一定操控能力的生成式短视频:风格化、动漫风最先成熟,真人稍晚。 AI 音频能力长足进展:带感情的 AI 配音基本成熟。 “全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货。 游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。 AI 男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。 实时生成的内容开始在社交媒体内容、广告中出现。 AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。 AI 的商业模式开始有明确用例:数据合成、工程平台、模型安全等。 可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功。 中国 AI 达到或超过 GPT4 水平;美国出现 GPT5;世界上开始现“主权 AI”。 华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)。 AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧。 AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年: AI 3D 技术、物理规则成熟:正常人无法区别 AI 生成还是实景拍摄。 全真 AI 虚拟人成熟:包含感情的 AI NPC 成熟,开放世界游戏成熟;游戏中几乎无法区别真人和 NPC。 AR/VR 技术大规模商用。 接近 AGI 的技术出现。 人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源。 具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破。 “人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉。 AI 引发的社会问题开始加重,结构性失业开始出现。 AGI 对于地缘政治的影响开始显露。 此外,还有以下相关动态: 算力瓶颈不只是单纯的技术和建设问题,而是影响整个行业竞争格局的重要变量。 逐渐进入多模态灵活转换的新时代,实现文本、图像、音频、视频及其他更多模态之间的互相理解和相互转换。 人类劳动形式逐步“软件化”,复杂劳动被抽象为可调用的软件服务,劳动流程被大幅标准化和模块化,劳动能力像“即插即用”的工具一样易于获取。 AI 行业目前仍处于严重亏损的阶段,商业化进程仍有巨大提升空间。 云厂商是产业链中毋庸置疑的“链主”。 2024 年,头部 AI 应用的品类变化并不显著。创意工具(如图像和视频内容创作)依然占据最大比重。To P(面向专业用户)应用展现出强大的市场潜力,ToB(面向企业)应用发展路径相对复杂,ToC 应用面临较大的挑战。 在 AI 应用领域,Copilot 和 AI Agent 是两种主要的技术实现方式。 北美和欧洲贡献了 AI 移动应用市场三分之二的份额,众多中国 AI 公司积极出海。 2024 年 10 月的大事记包括: Gartner 发布 2025 年十大战略技术趋势。 DeepSeek 开源多模态 LLM 框架 Janus。 司南开源大模型能力评估模型 CompassJudger。 Anthropic 发布新功能 computer use,发布 Claude 3.5 Haiku,更新 Claude 3.5 Sonnet。 Stability AI 发布 Stable Diffusion 3.5。 x.AI 正式推出 API。 ComfyUI V1 官方桌面版开放内测。 华为发布纯血操作系统鸿蒙 OS NEXT。 Jina AI 推出高性能分类器 Classifier API。 OpenAI 发布图像生成模型 sCM。 Midjourney 上线外部图片编辑器。 Runway 发布动画视频功能 ActOne。 Ideogram 推出 AI 画板工具 Canvas。 Genmo 开源视频生成模型 Mochi 1。 荣耀发布操作系统 MagicOS 9.0。 美国 14 岁少年与 C.AI 聊天后离世。 新华社发文表示警惕「AI 污染」乱象。 港中文&趣丸推出 TTS 模型 MaskGCT。 科大讯飞发布讯飞星火 4.0 Turbo。 阿里通义代码模式开始内测。 Anthropic Claude 新增数据分析功能。 北京市大中小学推广 AI 学伴和 AI 导学应用。 稚晖君开源「灵犀 X1」全套资料。 OpenAI 高管 Miles Brundage 离职。
2025-02-17
最新的AI行业动态和进展有哪些
以下是最新的 AI 行业动态和进展: 1. 《2024 年度 AI 十大趋势报告》发布,其中提到大模型创新方面,架构优化加速涌现,融合迭代大势所趋;Scaling Law 泛化方面,推理能力成皇冠明珠,倒逼计算和数据变革;AGI 探索方面,视频生成点燃世界模型,空间智能统⼀虚拟和现实;AI 应用格局方面,第⼀轮洗牌结束,聚焦 20 赛道 5 大场景;AI 应用竞争方面,多领域竞速运营大于技术,AI 助手兵家必争;AI 应用增长方面,AI+X 赋能类产品大干快上,原生 AI 爆款难求;AI 产品趋势方面,多模态上马,Agent 席卷⼀切,高度个性化呼之欲出;AI 智变千行百业,左手变革生产力,右手重塑行业生态;AI 行业渗透率方面,数据基础决定初速度,用户需求成为加速度;AI 创投方面,投融资马太效应明显,国家队出手频率提升。 2. 2024 年 9 月的 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 3. 2024 年,国内 AI 行业融资总金额增加,但事件数同比下降,马太效应越发明显,资本更青睐热点和高成熟度赛道。智能驾驶在各细分赛道中独占鳌头,AI+教育、AI+游戏、AI+医疗等赛道投资总额也有增长。政府积极推进 AI 原生行业发展,北京、上海、武汉等城市出台系列政策吸引人才和企业,国家队频繁投资体现政策支持。
2025-02-17
最新的AI行业动态和进展有哪些
以下是最新的 AI 行业动态和进展: 1. 《2024 年度 AI 十大趋势报告》发布,其中提到: 大模型创新方面,架构优化加速涌现,融合迭代大势所趋。 Scaling Law 泛化,推理能力成皇冠明珠,倒逼计算和数据变革。 AGI 探索中,视频生成点燃世界模型,空间智能统⼀虚拟和现实。 AI 应用格局方面,第一轮洗牌结束,聚焦 20 赛道 5 大场景。 AI 应用竞争中,多领域竞速运营大于技术,AI 助手兵家必争。 AI 应用增长方面,AI+X 赋能类产品大干快上,原生 AI 爆款难求。 AI 产品趋势为多模态上马,Agent 席卷一切,高度个性化呼之欲出。 AI 智变千行百业,左手变革生产力,右手重塑行业生态。 AI 行业渗透率方面,数据基础决定初速度,用户需求成为加速度。 AI 创投方面,投融资马太效应明显,国家队出手频率提升。 2. 2024 年 9 月的 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立,国家队来了。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 3. 从行业视角来看,2024 年国内 AI 行业融资总金额增加,但事件数同比下降,马太效应越发明显,资本更青睐热点和高成熟度赛道。智能驾驶在各细分赛道中独占鳌头,AI+教育、AI+游戏、AI+医疗等赛道投资总额也有增长。在政策方面,政府积极推进 AI 原生行业发展,北京、上海、武汉等城市出台系列政策吸引人才和企业,国家队频繁出手投资体现政策支持。
2025-02-17
配置最新的ai
以下是关于配置最新 AI 的相关内容: 1. Yaki:GPT/MJ 接入微信 检查环境 安装 Python 安装 git 克隆项目代码 安装 pip 环境 更改名称 配置文件:在 FinalShell 窗口下找到 root/chatgptonwechat/config.json 文件打开进行配置。 OpenAI API 的基础 URL(如果调用的不是官方的 key,需要更改这部分的内容):"open_ai_api_base":"https://api.gptapi.us/v1" 使用的模型版本(如果想要使用其他模型,记得需要更改这里):"model":"gpt4" 启动命令 注:扫码登录是模拟电脑登录微信号,需要保持在线才会触发,如果切换退出等,那么服务器中的微信也会掉线。 更详细内容参考:https://github.com/zhayujie/chatgptonwechat/tree/master 2. python 安装 FittenAI 编程助手 安装 python 的运行环境: 安装步骤:点击左上角的 FileSettingsPluginsMarketplace 注册:安装完成后左侧会出现 Fitten Code 插件图标,注册登录后即可开始使用 智能补全:按下 Tab 键接受所有补全建议;按下 Ctrl+→键接收单个词补全建议 AI 问答:通过点击左上角工具栏中的 Fitten Code–开始新对话打开对话窗口进行对话 自动生成代码:Fitten Code 工具栏中选择"Fitten Code生成代码",然后在输入框中输入指令即可生成代码 代码转换:Fitten Code 可以实现代码的语义级翻译,并支持多种编程语言之间的互译。选中需要进行翻译的代码段,右键选择"Fitten Code–编辑代码",然后在输入框中输入需求即可完成转换 3. 张梦飞:【知识库】FastGPT+OneAPI+COW 带有知识库的机器人完整教程 环境配置: 复制代码时注意复制全,每次只粘贴一行,然后点击一次回车。 回车后,只有最左边显示中括号时,才是上一个命令执行完毕。 1、第一步:cd/root||exit 1 2、第二步:下方两行粘贴进入,然后点击回车,等待下载完成。(如果有卡点,进行不下去,可能是服务器网络问题,去拉取时下载不全,可以复制网址,手动去下载到电脑上。然后进入文件夹,找到 root 文件夹,把下载的文件上传进去。) 2.2、再粘贴下方代码,出现下图,就代表在执行中了。 3、然后把下边这行粘贴进去,点击回车。rm f Anaconda32021.05Linuxx86_64.sh 4、继续粘贴:/root/anaconda/bin/conda create y name AI python=3.8 5、继续,一行一行依次粘贴,依次回车:echo 'source /root/anaconda/bin/activate AI' >> ~/.bashrc 6、执行完成后。刷新一下,重新进入终端,最左侧出现了(AI)的字符则配置完成。
2025-02-16