Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

目前国内主流的AGI有哪些?

Answer

目前国内还处在 AGI 的早期阶段,真正的 AGI 原生应用亮点较少。出圈的应用有“妙鸭相机”以及春节附近的“哄哄 AI 女朋友”类型的应用。

OpenAI 在其内部会议上分享了 AGI 的五个发展等级:

  1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。
  2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。
  3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品执行任务后仍需人类参与。
  4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。
  5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。
Content generated by AI large model, please carefully verify (powered by aily)

References

AGI 万字长文(下)| 2024,分叉与洪流

落到实际,我们还处在AGI的早期,2023年的“AI原生”应用也还很少。“上篇”也讲了,目前除了OpenAI/Google/MS官方应用之外,上文的“AI陪聊Character.ai”是唯一上榜前十的“AI原生应用”。除此之外,国内的真正AI原生的还有出圈的“妙鸭相机”,以及春节附近的“哄哄AI女朋友”类型的应用;基本可以说还没有什么亮点。那么,什么才是“AI原生”创新呢?真正划时代的创新都是创造并满足了新需求。因此,我们需要从AGI(未来)的能力出发来思考这个问题。不过,真正到商业模式/产品落地还要技术的成熟时间,今天也没有办法穷尽AI能做的事情。我也只能尝试提几个AI会持续发展的方向,希望能有所启发。(具体业务场景的咨询欢迎单聊)

问:AGI 的 5 个等级是什么?

OpenAI在其内部会议上分享了关于通用人工智能(AGI)的五个发展等级。OpenAI自2015年成立以来,一直将AGI作为其战略目标之一,随着ChatGPT、多模态大模型和AI Agent等技术的发展,我们似乎越来越接近实现这一目标。AGI的五个等级分别为:1.聊天机器人(Chatbots):具备基本对话能力的AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。2.推理者(Reasoners):具备人类推理水平的AI,能够解决复杂问题,如ChatGPT,能够根据上下文和文件提供详细分析和意见。3.智能体(Agents):不仅具备推理能力,还能执行全自动化业务的AI。目前许多AI Agent产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。4.创新者(Innovators):能够协助人类完成新发明的AI,如谷歌DeepMind的AlphaFold模型,可以预测蛋白质结构,加速科学研究和新药发现。5.组织(Organizations):最高级别的AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。

快速学习 AIGC,有料通俗易懂版!

人工智能:一种目标,让机器展现智慧,Artificial Intelligence,简称AI生成式人工智能GenAI:一种目标,让机器产生复杂有结构的内容,Generative AI简称GenAI机器学习:一种手段,让机器自动从资料中找到公式深度学习:一种更厉害的手段,类神经网络-非常大量参数的函数大语言模型:是一类具有大量参数的“深度学习”模型,Large Language Models,简称LLMsChatGPT:一个应用实例,形象比喻:通过投喂大量资料预训练后,ChatGPT会通过聊天玩“文字接龙游戏”了。英文解释:Chat聊天,G:Generative生成,P:Pre-trained预训练,T:Transformer类神经网络模型以上概念之间的关系如下图:AIGC(Artificial Intelligence Generated Content,人工智能生成内容)是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。AIGC技术可以用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。ChatGPT是AIGC技术的一个应用实例,它代表了AIGC在文本生成领域的进展。ChatGPT是美国OpenAI公司开发的一款基于大型语言模型(Large Language Model,简称LLM)的对话机器人,它能够根据用户的输入生成连贯且相关的文本回复。用户界面如下:AGI、GenAI、AIGC几个概念的区别与理解可参考下图:更多概念可问Kimi、通义千问、文心一言等大模型,也可以继续往下看,会逐步讲解更多概念。国内主要模型公司及地址如下:

Others are asking
AGI真能实现吗
通用人工智能(AGI)是 AI 领域的终极目标,也是人类发明机器计算后的终极进化方向。实现 AGI 面临诸多挑战,但也有一些积极的因素和迹象表明其有可能实现: 从模仿人类大脑的角度来看,机器学习在完成相关拼图方面,数据是相对容易实现的部分。例如,ImageNet 数据集的大小已接近人从出生到大学毕业视觉信号的数据量,Google 公司创建的新模型数据集大小也可与人一生所获取的数据量媲美。但神经网络需要像人类一样,使用更少的数据和更高的抽象来学习。 算力方面,人工神经网络与人脑的大小仍有数量级的差距,但在某些哺乳动物面前已具备竞争力。而且每花一美元所能得到的计算能力一直在呈指数级增长,大规模基础模型所用到的计算量每 3.5 个月就会翻一番。尽管有人认为计算能力会因物理学限制不能保持上升趋势,但过去的趋势和该领域的资金、资源投入以及人才涌入等因素,使得开发更好的软件和硬件成为可能,且物理学的限制同样约束人脑的能力极限。 关于 OpenAI 通用人工智能(AGI)的计划,有各种报道和推测。例如,有文件揭示 OpenAI 计划在 2027 年前创建人类水平的通用人工智能(AGI),也有相关预测提到图像和音频生成将在 2023 年第三季度进行训练等。同时,OpenAI 总裁曾表示计划在五年内构建一个与人类大脑大小相当的模型来实现 AGI。 综上所述,虽然 AGI 的实现仍存在不确定性,但有多种因素和迹象表明其有可能实现。
2025-01-04
如何使用WaytoAGI这个网站
WaytoAGI 网站具有以下功能: 1. 和 AI 知识库对话:您可以在此询问任何关于 AI 的问题。 2. AI 网站:集合了精选的 AI 网站,能按您的需求找到适合的工具。 3. AI 提示词:集合了精选的提示词,可复制到 AI 对话网站使用。 4. 知识库精选:将每天知识库的精华内容呈现给大家。 WaytoAGI 于 2023 年 4 月 26 日诞生,在没有任何推广的情况下,一年时间已有超过 70 万用户和超千万次的访问量。它是由一群热爱 AI 的专家和爱好者共同建设的开源知识库,是很多 AI 爱好者知识的源头,社群的口号是让更多的人因 AI 而强大,有很多学社和共学共建的活动。打开“waytoagi.com”即可找到社群。总之,WaytoAGI 网站和 WaytoAGI 知识库相互关联,希望成为您学习 AI 路上的好助手。
2025-01-03
AGI是什么
AGI 即 artificial general intelligence,指通用人工智能,能够做任何人类可以做的事。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 目前,AI 分为 ANI 和 AGI,ANI 得到巨大发展但 AGI 还没有取得巨大进展。ANI 即 artificial narrow intelligence 弱人工智能,只可做一件事,如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等。
2025-01-03
waytoagi中的AI提示词要如何使用
以下是关于 waytoagi 中 AI 提示词使用的相关内容: 1. 提示词的重要性:与大语言模型对话的基础认知是提示词,通过详细结构化的提示词能获得更优质的解释内容。 2. 最佳实践中的提示词:收录了很多写好的提示词,如李继刚老师的结构化提示词,可复制使用并改变形成自己的见解和应用。 3. 提示词的创作思路:李继刚老师会在 13 号带领大家学习提示词的创作思路。 4. 让输出更拟人化:介绍了如何让大语言模型的输出更加拟人化,但有些可能不适合发在社交媒体上。 5. 提示词的应用场景:涵盖产品经理、工程、游戏等领域,可用提示词写游戏、做互动游戏等。 6. 利用提示词做小项目:AIPO 项目不要求宏大,可做小项目,如用提示词做油猴脚本代码的小插件,也可尝试写化妆机等小方案做线下路演。 7. 多模态识别与测试:很多大语言模型可多模态识别,如测试两人是否有夫妻相,准确率较高。 8. 学习提示词的资源:包括方法论、论文精读、博主的 6 大策略、社区共学课程及直播回放等。 9. 操作过程中的有趣提示词:如“酷老师”“抬杠高手”等,可点开并复制这些提示词,将复制内容丢进大语言模型对话效果会不同。近期提示词有升级,李金刚老师将提示词玩到新高度,cloud 等大语言模型可直接显示编译结果内容。 10. 从工程视角看 AI 提示词在游戏创作及优化中的应用。 11. 拟人提示词:通过情绪体感轮子创建具有人物灵魂的提示词,输入 GPT 知道的人物名称即可生成。例如选择罗永浩作为角色扮演对象生成提示词。 12. 微调提示词:包括限制回答内容长度、防止回答出现逻辑错误、强化语言风格、防止输出多余回复等。
2025-01-03
我想在waytoAGI学习,我是小白,我应该怎么做?
对于小白在 waytoAGI 学习,以下是一些建议: 1. 参与准备: 可以关注 waytoAGI 的“周周黑客松”活动,这是一个初级教程介绍较多的活动。 参加共学,比如 cursor 共学(十一之后),可以获得手把手的指导。 2. 环境准备: 参加 wayToAGI 共学或线下黑客松,会有小伙伴热情帮助搞定环境。 如果条件不允许,可自行准备。预计用时 5 10 分钟,基础需求是需要魔法。网址为 https://www.cursor.com ,下载安装软件后在页面中注册即可。 3. 学习心态和方法: 像彭青云学习 ComfyUI 一样,把大目标拆解成小目标,遇到困难时不断拆解,反复学习,单拎问题去搜索、提问,直到搞透知识点。 记录学习过程,分享遇到的问题及解决方法,先吃透老师讲的知识点,再逐步深入。
2025-01-02
如何学习AGI
以下是关于学习 AGI 的一些建议: 对于新手学习 AGI: 1. 澄清学习前的状态:可能不理解 AI 和提示词工程,不懂代码和英语较差,在学习前会尝试各种 AI 工具并走弯路。 2. 明确学习后的现状:例如能够创建多 Agent 智能体、进行营销文案创作、应用 SQL 代码、创建图像流智能体等,还能在公司中实践智能客服等。 3. 掌握学习路径:关键词包括“少就是多”“先有个初识”“目录索引推荐”“兴趣最重要”“先动手”,学习路径如同游戏通关,有主线和支线。 4. 个人经验分享:像 yoyo 一样,通过学习、分享和实践不断填补知识缝隙来成长。 学习 AI 是一个长期的过程,需要耐心和持续努力,不要害怕犯错。完整的学习路径建议参考「通往 AGI 之路」知识库首页(https://waytoagi.feishu.cn/wiki/QPe5w5g7UisbEkkow8XcDmOpn8e)的布鲁姆分类法来设计自己的学习路径。 对于纯 AI 小白,可以参考《雪梅 May 的 AI 学习日记》,其学习模式是输入→模仿→自发创造。学习内容可在 waytoAGI 社区发现自己感兴趣的 AI 领域并学习最新内容。学习资源免费开源,可利用空闲时间进行学习。 总之,找到适合自己的学习方式和路径,学以致用,不断成长。
2025-01-02
国外比较主流的大模型有哪些
国外比较主流的大模型有: 1. GPT4Turbo:OpenAI 于 2023 年 11 月 7 日发布的 GPT4 的升级版本。 2. GPT4(网页版):OpenAI GPT4 官方网页版本,支持联网功能。 3. GPT4(API):OpenAI GPT4 官方 API 版本,不支持联网功能。 4. Claude2:Anthropic 官方发布的模型。 5. Geminipro:Google 官方发布的模型。 6. GPT3.5Turbo:OpenAI 的模型。 7. Llama_2_13B_Chat:Meta 发布的模型。
2025-01-03
ai换装,目前主流工具有哪些
目前主流的 AI 换装工具包括:InterAlia(https://interalia.vcflab.org/)。需要注意的是,虽然底层都是大模型,但 AI 工具各有侧重,不同公司也会进行各自的优化。关于每一种工具的详细入门、讲解和应用,WayToAIG 已经分好了类目。
2025-01-02
国内主流AI辅助编程工具,比较优缺点
以下是国内主流的 AI 辅助编程工具及其优缺点: GitHub Copilot: 优点:由全球最大的程序员社区和代码托管平台 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,帮助开发者更快、更少地编写代码。 缺点:暂未明确。 通义灵码: 优点:阿里巴巴团队推出,基于通义大模型,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力。 缺点:暂未明确。 CodeWhisperer: 优点:亚马逊 AWS 团队推出,由机器学习技术驱动,可为开发人员实时提供代码建议。 缺点:暂未明确。 CodeGeeX: 优点:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,可快速生成代码,提升开发效率。 缺点:暂未明确。 Cody: 优点:代码搜索平台 Sourcegraph 推出,借助 Sourcegraph 强大的代码语义索引和分析能力,了解开发者的整个代码库,不止是代码片段。 缺点:暂未明确。 CodeFuse: 优点:蚂蚁集团支付宝团队为国内开发者提供智能研发服务的免费 AI 代码助手,基于蚂蚁集团自研的基础大模型进行微调的代码大模型。 缺点:暂未明确。 Codeium: 优点:由 AI 驱动的编程助手工具,通过提供代码建议、重构提示和代码解释来帮助软件开发人员,提高编程效率和准确性。 缺点:暂未明确。 需要注意的是,每个工具的功能和适用场景可能会有所不同,您可以根据自己的需求来选择最适合您的工具。更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。 此外,Cursor 作为一款 AI 编程助手,具有以下核心功能和优势: 核心功能: 全语言支持,包括但不限于 Python、JavaScript、Java、C++、Go 和 Rust 等。 能够快速构建完整的项目框架。 在 IDE 环境中实时提供代码建议、自动补全和错误修正等功能。 支持多项目管理。 能够理解和分析技术文档,并基于文档内容生成相应的代码实现。 优势: 开发效率显著提升,能在短时间内完成功能性演示项目。 降低入门门槛,加速初学者学习过程。 跨语言开发支持,方便开发者切换语言。 减少重复性工作,让开发者集中精力于创造性任务。 实时学习新技术,更新知识库。
2024-12-30
目前主流的AI大模型有哪些
目前主流的 AI 大模型主要有以下几种: 1. GPT 系列:例如 GPT3 等,其基于 Transformer 算法,擅长自然语言生成任务。 2. BERT:属于 encoderonly 模型,通常适用于自然语言理解任务,如分类和情感分析。 3. T5:是 encoderdecoder 模型,可用于翻译和摘要等任务。 4. ChatGPT:用户通过像和人类一样对话即可完成任务。 大模型具有以下特点: 1. 预训练数据非常大,往往来自互联网上的论文、代码、公开网页等,通常用 TB 级别的数据进行预训练。 2. 参数非常多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。 大模型的应用场景广泛,包括: 1. 文本生成和内容创作,如撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手,提供客户服务、日常任务提醒和信息咨询等服务。 3. 编程和代码辅助,用于代码自动补全、bug 修复和代码解释。 4. 翻译和跨语言通信,促进不同语言背景用户之间的沟通和信息共享。 5. 情感分析和意见挖掘,为市场研究和产品改进提供数据支持。 6. 教育和学习辅助,创建个性化学习材料、自动回答学生问题和提供语言学习支持。 7. 图像和视频生成,如 DALLE 等模型可根据文本描述生成相应图像。 8. 游戏开发和互动体验,创建游戏中的角色对话、故事情节生成和增强玩家沉浸式体验。 9. 医疗和健康咨询,理解和回答医疗相关问题,提供初步健康建议和医疗信息查询服务。 10. 法律和合规咨询,帮助解读法律文件,提供合规建议。
2024-12-30
帮我查一下这四家主流大模型的应用能力评测报告吧,通用能力和单项能力都可,数据需要权威一些文心一言 文心一格 通义千问 通义万相 讯飞星火 ai小科 智谱
以下是为您找到的关于主流大模型应用能力评测的相关报告: 小七姐的测评: 测评机制:以同组提示词下 ChatGPT 4.0 生成的内容做对标参照,对智谱清言、文心一言 4.0、Kimi Chat 进行测评。 能力考量:包括复杂提示词理解和执行(结构化提示词)、推理能力(CoT 表现)、文本生成能力(写作要求执行)、提示词设计能力(让模型设计提示词)、长文本归纳总结能力(论文阅读)。 测评轮次:共分为五轮,分别针对不同的任务和模型进行多次测试。 中文大模型基准测评 2023 年度报告: 优秀模型:文心一言 4.0 API(百度)。 模型特点:在计算、逻辑推理、生成与创作、传统安全这 4 大基础能力上排名国内第一,在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三,各项能力表现均衡且水平较高。 适合应用:能力栈广泛,可应用于查询搜索知识应用、任务拆解规划 Agent、文案写作、代码编写及纠错等方面,在逻辑推理方面表现不俗,可关注在科学研究、教育、工业方面的落地能力。 观点文章中的测评: 目前体验效果比较好的有科大星火模型、清华 ChatGLM、百度文心一言。 星火目前感觉最接近 GPT3.5(0301 版本)的 80%90%,但 GPT3.5 进化到 6 月版本效果更强。 对大模型的评估可从基础能力、职场能力、探索对话三个方面判断,基础能力包括语言(文本)生成和语言理解,如常识类问题和分词类问题。
2024-12-27
文生视频目前最新最主流好用的有哪些,国内外均可
以下是一些国内外最新且主流好用的文生视频工具: 1. Pika:擅长动画制作,支持视频编辑。 2. SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 3. Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 4. Kaiber:能将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多的文生视频网站可查看:https://www.waytoagi.com/category/38 。 以生成方式划分,当前视频生成可分为文生视频、图生视频与视频生视频。视频生成涉及深度学习技术,如 GANs 和 Video Diffusion,主流生成模型为扩散模型。一些具有代表性的海外项目如: 1. Sora(OpenAI):以扩散 Transformer 模型为核心,能生成长达一分钟的高保真视频,支持多种生成方式,在文本理解方面表现出色,能在单个生成的视频中创建多个镜头,保留角色和视觉风格。 2. Genie(Google):采用 STtransformer 架构,包括潜在动作模型、视频分词器与动力学模型,拥有 110 亿参数,被定位为基础世界模型,可通过单张图像提示生成交互式环境。
2024-12-26
国内有哪些AI可以做好看的表格
目前国内有以下一些可以用于生成好看表格的 AI 工具: 1. Highcharts:在表格类 AI 产品中排行第一,6 月访问量达 235 万次,相对 5 月变化为 0.389。 2. Fillout.com:排行第二,6 月访问量为 186 万次,相对 5 月变化为 0.147。 3. Coefficient:排行第三,6 月访问量为 46 万次,相对 5 月变化为 0.251。 此外,还有以下与 Excel 相关的 AI 工具和功能: 1. Excel Labs:是一个 Excel 插件,新增了基于 OpenAI 技术的生成式 AI 功能,可用于数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的整合了 Word、Excel、PowerPoint、Outlook、Teams 等办公软件的 AI 工具,能通过聊天形式完成用户需求,如数据分析或格式创建。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,可通过自然语言交互式地进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,能生成公式、相关文本内容、执行情感分析、语言翻译等任务。 随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。但请注意,部分内容由 AI 大模型生成,请仔细甄别。
2025-01-04
罗列一下中国国内能用的,好用的AI网站和工具
以下是中国国内一些好用的 AI 网站和工具: 1. 墨刀 AI:设计工具。 2. 无限画:图像生成。 3. autoDL 云服务租用:Agent。 4. 百度 Chat:AI ChatBots。 5. 360AI 搜索。 6. AIbot ai 工具集:导航网站。 7. 创客贴 AI:设计工具。 8. MasterGo:设计工具。 9. 美图设计室:图像编辑。 10. 魔搭社区 阿里达摩院:AI 训练模型。 11. 即时 AI 设计:设计工具。 12. Boardmix 博思 AI 白板:PPT。 13. 百度飞桨 AI Studio:AI 学习。 14. 字节扣子。 15. 提示工程指南:Prompts。 16. toolsdar:导航网站。 17. 同花顺问财:金融。 18. 即梦 AI(剪映):其他视频生成。 19. 可灵 AI:其他视频生成。 20. 360 快剪辑:视频编辑。 21. Dify.ai:Agent。 22. Vast(算力)。 23. 图虫网:AI 摄影作品销售平台。 24. 网易云音乐音乐人平台:AI 音乐作品发布平台。 25. 好好住 APP:AI 家居用品推荐平台。 26. 东方财富网投资分析工具:AI 金融投资分析平台。
2025-01-04
国内最好的AI工具
以下是一些国内较好的 AI 工具: 1. 图像类: 可灵:由快手团队开发,可生成高质量的图像和视频,但价格相对较高,重度用户年费可达几千元,轻度用户有每日免费点数和较便宜的包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,操作界面简洁,用户友好度高,目前免费,每天签到获取灵感值即可,但存在一些局限性,如某些类型图像无法生成,处理非中文语言或国际化内容可能不够出色。 2. PPT 类: Gamma:在线 PPT 制作网站,支持输入文本和想法提示快速生成幻灯片,可嵌入多媒体格式。 美图 AI PPT:由美图秀秀团队推出,通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。 Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,简化设计流程。 讯飞智文:由科大讯飞推出,利用语音识别和自然语言处理技术优势,提供智能文本生成等功能。 3. 视频生成类: 可灵:在与国外 AI 生成工具的竞争中表现出色。 即梦、智谱清影等:生成结果甚至远超国外。
2025-01-04
目前国内好的识图AI
目前国内较好的识图 AI 产品有以下几种: 1. 可灵:由快手团队开发,主要用于生成高质量的图像和视频,图像质量高,但价格相对较高,重度用户年费可达几千元,轻度用户有免费点数和较便宜的包月选项。 2. 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,生成图像质量高、细节丰富,操作界面简洁直观,用户友好度高,且目前免费,每天签到获取灵感值即可。但存在一些局限性,如某些类型图像因国内监管要求无法生成,处理非中文语言或国际化内容可能不够出色,处理多元文化内容时可能存在偏差。 此外,国内还有一些其他类型的 AI 产品,如用于制作 PPT 的: 1. Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。 2. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。 3. Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等。 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。
2025-01-02
国内有哪些AI
以下是国内的一些 AI 产品和大模型: 图像类产品: 可灵:由快手团队开发,可生成高质量的图像和视频,最初采用内测邀请制,现向所有用户开放,价格相对较高,重度用户年费可达几千元,轻度用户有每日免费点数和较便宜的包月选项。 通义万相:国产 AI 工具,在中文理解和处理方面表现出色,可选择多种艺术和图像风格,操作界面简洁直观,用户友好度高,现免费,每天签到获取灵感值即可,但存在一些局限性,如某些类型图像因监管要求无法生成,处理非中文语言或国际化内容可能不够出色。 国内总榜 Top80 中的部分产品: Kimi 智能助手:AI ChatBots 类。 百度文心一言:AI ChatBots 类。 360AI 搜索(接 GA):搜索类。 秘塔 Metaso:搜索类。 阿里通义千问:AI ChatBots 类。 昆仑万维天工 AI 搜索:搜索类。 抖音豆包 AI:AI ChatBots 类。 火山方舟:AI 训练模型类。 ChatGLM 智谱清言:AI ChatBots 类。 讯飞星火:AI ChatBots 类。 稿定设计:设计工具类。 processon:思维导图类。 bigjpgAI 图片无损放大:图片增强类。 liblib.art:图像生成类。 沉浸式翻译:翻译类。 8 月正式上线的国内大模型: 北京企业机构:百度(文心一言)https://wenxin.baidu.com 、抖音(云雀大模型)https://www.doubao.com 、智谱 AI(GLM 大模型)https://chatglm.cn 、中科院(紫东太初大模型)https://xihe.mindspore.cn 、百川智能(百川大模型)https://www.baichuanai.com/ 上海企业机构:商汤(日日新大模型)https://www.sensetime.com/ 、MiniMax(ABAB 大模型)https://api.minimax.chat 、上海人工智能实验室(书生通用大模型)https://internai.org.cn 特色功能:智谱清言、商量 Sensechat、MiniMax 能生成 Markdown 格式;昇思能生图,MiniMax 能语音合成。 受限制使用:MiniMax 无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值。 阿里通义千问、360 智脑、讯飞星火等不在首批获批名单中。广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。
2025-01-01
请问国内Gen AI赋能电商平台的案例有哪些?
以下是一些国内 Gen AI 赋能电商平台的案例: 电商:带货本地生活,AI 数字人上岗,带货本地生活电商,一个月多赚 3 万。 电商:婴儿的四维彩超 AI 预测,通过 AI 工具,提前把宝宝的四维彩超还原出现实中模样进行变现。 电商:小红书 AI 绘画变现,分享小红书最火的三种 AI 绘画类的商品。 此外,在国外,像 Flair、Booth 和 Bloom 这样的工具帮助品牌创建引人注目的产品照片。AdCreative 和 Pencil 可以制作用于电子邮件或社交媒体的营销材料,Frase 或 Writesonic 可以编写经过 SEO 优化的产品描述。未来,用户有望仅通过描述期望的审美并点击按钮,就能创建一个完整的电商商店以及用于市场营销的材料。
2024-12-31
我想知道目前最新、效果最好、代码和模型开源的动作捕捉算法,也叫做人体姿态估计,是哪篇文章
目前最新、效果较好且代码和模型开源的人体姿态估计(动作捕捉算法)相关的研究有以下两篇: 1. 【SD】最强手部识别,controlnet 新预处理器 dw openpose 作者:白马少年|公众号:【白马与少年】 发布时间:20230813 20:00 原文网址:https://mp.weixin.qq.com/s/_RiKxWy9MXt4DUJIKH5w 介绍:在 controlnet 中,手部识别一直使用的是 openpose 预处理器,但复杂手势有时无法识别。新的 dw openpose 预处理器能完美解决手部识别问题,将其放入特定目录即可使用。但需说明的是,目前这个 DW Pose 只是更精确的 openpose 预处理器,未对 ControlNet 的 openpose 模型做改动。 2. YOLONAS Pose:一个开源的实时人体姿态估计模型 应用场景:基于骨骼标记为基础,适用于智慧体育等场景,可对训练过程的姿态、数据、状态等进行统计和管理。 技术类型:视频、AI 学习模型 简介:主要功能是识别图片和视频中人的姿势,能快速处理图像并实时返回姿态数据,适应不同场景和设备。 主要特点: 实时性能:旨在提供实时的姿态估计,适用于需要即时反馈的应用。 高精度:利用神经网络架构搜索(NAS)提高姿态估计的准确性。 优化的网络结构:NAS 自动测试不同网络结构,找到最优模型。
2024-12-31
AI目前可以做汽车底盘的CAE仿真分析吗
目前 AI 在汽车底盘的 CAE 仿真分析方面的应用还处于不断发展和探索的阶段。虽然 AI 技术在一些工程领域展现出了潜力,但在汽车底盘 CAE 仿真分析这一特定领域,其应用尚未完全成熟和广泛普及。不过,随着技术的不断进步,未来 AI 有可能在这方面发挥更重要的作用。
2024-12-29
目前的AI插件产业实践有哪些,需要收费的又有哪些
目前的 AI 插件产业实践中,以开发 AI Share Card 插件为例: 技术方案:将模板生成功能设计为固定的代码组件,让大模型专注于内容总结的功能。若用户需要其他模板,可通过增加更多模板选项或自定义模板代码功能实现。 对 AI 大模型的要求:处理纯文本总结任务,仅需 13B 或更小参数的模型,加上精调的提示词就能产生很好结果。 AI API 服务的选型要求: 较长的上下文窗口,因为内容总结类任务需要较大的上下文长度。 响应速度要快、并发支持要高,以在多人使用插件时保持良好性能表现。 免费或尽量低价,以减少模型 token 费用。例如选用的 GLM4flash(截至 202412,长达 128k 的上下文窗口,完全免费的调用价格,200 RPM 高并发支持)。 需要收费的 AI 插件因具体应用和服务提供商而异,常见的收费方式包括按使用量计费、订阅制等。但像上述提到的 GLM4flash 在特定时间内是免费的。
2024-12-28