直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

国内AI行业最新发展状况

回答

以下是关于国内 AI 行业最新发展状况的介绍:

OpenAI 的 o1 模型主导:OpenAI 最新推出的 o1 模型正在重新定义 AI 在数学、科学和推理方面的极限,使竞争对手困惑甚至“破产”。

中国的 AI 崛起:无视制裁,中国的模型凭借坚韧和战略智慧正在“屠榜”,证明他们仍在牌桌之上。

生成式 AI 的数十亿繁荣:AI 初创公司正赚得盆满钵满,但可持续性难以捉摸。

AI 产业链中的机会分析

  1. 基础设施层:布局投入确定性强,但资金投入量大,入行资源门槛高,未来更多由“国家队”负责,普通人可考虑“合作生态”切入机会。
  2. 技术层:技术迭代迅速,小规模团队或个人须慎重考虑技术迭代风险,基础通用大模型非巨无霸公司不建议考虑,竞争激烈,最终赢家通吃。
  3. 应用层:是广阔蓝海,当前成熟应用产品不多,“杀手级”应用凤毛麟角,普通个体和小团队推荐重点布局,发展空间巨大。

AI 产品发展的未来展望

  1. 更深度的行业整合:AI 技术将与各行各业更紧密结合。
  2. 用户体验的持续优化:易用性和稳定性将进一步提升。
  3. 新兴应用场景的出现:可能在智能家居、自动驾驶等领域找到新突破口。

相关报告及解读链接:

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

2024 年人工智能现状:辉煌、戏谑和“牛市”

探索人工智能的过山车之旅,充满着《让子弹飞》(嗯,中文世界的非物质文化遗产)中那些越品越有的梗,过度解读?低估还是唱衰唯有时间这条长河可以给予我们终极答案……[heading2]太长不看![content]但如果有空!还是请看我顶着高烧,在抖包袱又表面平和、不断搜寻脑海中的词汇、尝试用滑稽的幽默来博君一笑努力吧!again,以下内容anti-AI!人工撰写by 🦄ChaXOpenAI的o1模型主导:OpenAI最新推出的o1模型正在重新定义AI在数学、科学和推理方面的极限,使竞争对手困惑甚至“破产”。中国的AI崛起:无视制裁,中国的模型凭借坚韧和战略智慧正在“屠榜”,证明他们也仍然在牌桌之上……生成式AI的数十亿繁荣:AI初创公司正赚得盆满钵满,但可持续性仍然像一个能理解细微差别的聊天机器人一样难以捉摸。报告链接:[The State of AI 2024](https://www.stateof.ai/)(友情提示,报告212页)|[报告的中文翻译版](https://waytoagi.feishu.cn/record/QdFmrUoueeS3Tucpm8Icntf1nJh)英文解读链接:[The State of AI 2024:Brilliance,Banter,and Bull Runs](https://esg4lgjwa43v.sg.larksuite.com/wiki/RXn1wNWgJifxcDkgsDWl8UjAgFb?from=from_copylink)

走入AI的世界

我们来简要概括说说这张图中每一层的商机洞察(以下内容仅代表个人观点,供参考):1.目前来看,基础设施层布局投入的确定性最强,以发展的眼光看,当前算力缺口巨大,但这部分涉及到海量的资金投入,入行资源门槛较高,作为关键的基础设施,国内未来更多的将会由“国家队”扛起重任。普通人如果没有强资源需谨慎入局,因为很可能你无法快速对接到客户资源,等不到赚钱就现金流断裂,可以更多的考虑“合作生态”的切入机会。2.技术层当前仍然处于技术爆炸时刻,相关技术的迭代速度可以夸张点用“日新时异”来形容,迭代进步飞速,如果你或你的团队规模不大,但又有志于做这一层相关的事情,须慎重考虑“技术迭代风险”的问题(例如基于某种开源模型更进一步训练垂直领域模型,很可能等你训练出来的时候,更强更新的开源模型已经发布,让你的工作意义大打折扣),至于基础的通用大模型,非巨无霸公司就不是很建议考虑了,搞基础大模型的研发是一件十分烧钱的事情,且众多互联网大厂,AI独角兽,知名高校都已悉数下场神仙打架,完成了布局,开启了“百模大战”,但竞争的终局,只会有少数赢家。应用界不需要那么多同质化的大模型,最后多半是赢家通吃的局面。3.应用层是一片时代赋予我们的广阔蓝海,尽管2024年这个方向的从业者在飞速增加,也涌现出一批做垂直产业/行业/细分领域垂直模型或大模型应用的产品,但坦诚的讲,以我们自身的深度实践和用户的切实需求来看,当前针对行业/细分领域的成熟应用产品并不多,让人哇塞的“杀手级”应用更是凤毛麟角。对于普通个体和小团队,强烈推荐重点思考和布局应用层,这一层拥有超级机会和巨大发展空间。

2024年AI产品设计和商业化思路的一些变化及讨论

基于当前趋势,我们可以对AI产品的未来发展做出以下预测:更深度的行业整合:AI技术将更紧密地与各行各业的专业知识和工作流程结合。用户体验的持续优化:随着技术的成熟,AI产品的易用性和稳定性将进一步提升。新兴应用场景的出现:随着5G、IoT等技术的普及,AI可能在智能家居、自动驾驶等领域找到新的突破口。讨论内容:samueli:我就简单聊一下,感觉最近也没看到特别好玩的,最近的话就是也是经常写写小红书,所以对这种什么信息获取创作这种工具看的比较多。感觉比较有趣的还是杨哥的那个ReadPo,严格来说的话,它是一个toB的工具,服务各种创作者。顺着这个的话,其实也可以去看了一下。我感觉其实目前的话就是在ai这一块的话大家现在有点陷入一个低潮吧,基本上各种群里面或者大家都在关注的要么就是效率工具,要么就是这种类似于吐槽类的,就比如说前几天那个妙刷火了。这是我自己的一个体感吧,然后可能有点意思,其实它探索了一些商业模式。这一块的话可能对后面的一些AI产品有一些启发吧,另外像这两天天宫的那个搜索的一个更新,我老早就关注了,最近大家也在聊。它里面的宝典彩页,你可以去认领一些主题词搜索的时候给你广告流量,然后变现。我感觉也是商业模式上的一些创新点吧!但是制约因素也挺多的,它首先没流量对我自己就感觉的话就是一个toC的话,要么一些大家都能想到的东西,其实刷刷屏可能很快就过去了。Brad:对,其实我们可以观察一下,最近一段时间AI的产品的发展趋势,跟一年前或者说跟上半年确实有一些不太一样的地方,这一块我们可以展开来聊一下。我先说一下我自己的看法,就除了刚才说的那个情况确实。

其他人在问
年终汇报及活动方案最好用的ai
以下是为您提供的一些关于年终汇报及活动方案的 AI 相关信息: 在智能纪要方面,有多种相关技术和活动,如 AI 音乐创作,通过输入更高级词汇与 AI 音乐对话能产生更好效果,有相关版块、挑战、分享会和教程,可加入 AI 音乐社区;数字人语音合成,介绍了声音克隆技术及微软、阿里等的成果,常用 JPT service;config UI 的应用能降低成本、提高效率,在图书出版、引流等方面有应用,社区有相关共学课程。 社区共创项目丰富,包括东京的 confii 生态大会、AI 文旅视频、娃卡奖、李普村共创故事、AI 春晚等活动。 作业是询问对 AI 方向的兴趣和想做的项目,活动报名可通过填写名字和申请新增学校参与。 线下寄送物料组织活动,会给大家寄送线下活动物料,在学校内组织。 AIPO 活动及相关挑战,如 10 月 20 日的 AIPO 活动,可提前构思展示项目,有会话和视频相关的挑战赛。 共学活动与技能提升,接下来 10 天有从零基础到建站等内容的讲解,回放会放在链接里,可先从练习提示词入手。 硬件机器人部分材料需尽快购买。 在自媒体发布与流量扶持方面,在小红书发布活动内容带特定标签有流量扶持,作品也可发布在 GitHub 等平台。 活动奖项与历史玩法,设最佳创业奖和最佳投资奖各四个,有线下摆摊展示交流、IPO 路演等玩法,之前在多个城市举办过 AI 切磋大会。 工具使用与新大赛预告,可使用多种 AI 工具,新的大赛即将开启,有百万奖金池,相关动态会在社区活动栏目公布。 同时,为您提供一些会议总结相关的 AI 工具: 但目前没有直接针对年终汇报及活动方案最好用的 AI 的明确推荐。
2024-11-14
天工AI有哪些使用场景
天工 AI 的使用场景较为广泛,包括但不限于以下方面: 搜索领域:采用生成式搜索技术,支持自然语言交互和深度追问,未来还将支持图像、语音等多模态搜索。 数字内容创作:为艺术家和创作者提供高效、创新的方法来生成相关内容。 游戏开发和动画制作:能够快速、高质量地创建 3D 模型。 教育和培训:利用 3D 内容提供更具吸引力和互动性的学习体验。 医疗行业:为诊断、治疗规划和患者教育提供精确的 3D 模型支持。 建筑和工程:用于设计、可视化和项目规划中的 3D 模型创建。
2024-11-14
即梦AI的主要功能
即梦 AI 是一款强大的视频生成工具,具有以下主要功能: 1. 视频生成:可根据用户提供的图片(首帧/首尾帧)、prompt(文字指令)和各种参数设置生成高质量、稳定且高动态的视频。 2. 生成时长: 全面提升单次生成时长,并提供标准模式和流畅模式两种选择。 标准模式适用于通用场景,支持时长有 3s、6s、9s、12s。 流畅模式适用于运动强度高的场景,如赛车飞驰,支持时长有 4s、6s、8s。 视频延长:全面提升延长效果,可基于选择的模式选择二次生成的时长,并支持 prompt 控制,同一个素材支持两次延长。 3. 可控性: 首尾帧权重超强优化,输入 prompt 可精准控制过渡效果。 运镜控制:新增移镜、摇镜,并支持三档运镜幅度设定。 4. 智能画布:提供多种创意案例,如 LOGO 玩法等。 优点: 动效方面采取激进策略,在需要很强动效表现时可考虑使用。 对画面识别非常准确。 在人物微表情、汽车行驶等画面的表现出色。 具有首尾帧相连的功能。 对于简单画面有不错的表现力,能让主体完成超出预期的流畅动效,尤其是简单的三维物体。 人物的面部特写表现惊艳。 缺点: 精度不太够,后期需要用到 topaz video 等超分工具再放大。 丰富的动效带来画面容易“出轨”的问题,导致画面稳定性不足。 为了更丰富的动效,视频的输出存在掉帧等问题。 运动幅度不能开得太过,否则会有用力过猛的感觉,且画面容易崩塌。 总体 3 6s 的生成长度一般。 即梦 AI 官网:https://jimeng.jianying.com/
2024-11-14
AI 网站哪一个写文章好
以下是一些在写文章方面表现较好的 AI 网站和工具: 1. 对于文章排版: Grammarly:不仅是语法和拼写检查工具,还提供排版功能,可改进文档风格和流畅性。 QuillBot:AI 驱动的写作和排版工具,能改进文本清晰度和流畅性。 Latex:常用于学术论文排版,使用标记语言描述格式,有许多 AI 辅助的编辑器和插件。 PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 Wordtune:AI 写作助手,可重新表述和改进文本。 Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的工具取决于具体需求,如文档类型、出版标准和个人偏好。学术论文常选 Latex 和 Overleaf,一般文章和商业文档可选 Grammarly 和 PandaDoc 等。 2. 辅助写邮件的 AI 工具: Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能,易于使用,支持多平台和多种语言。 Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句,界面简洁。 ProWritingAid:全面的语法和风格检查,提供详细写作报告和建议,功能强大,支持多平台和集成。 Writesonic:基于 AI 生成各种类型文本,包括电子邮件,生成速度快。 Lavender:专注邮件写作优化,提供个性化建议和模板,帮助提高邮件打开率和回复率。 3. 利用 AI 打造爆款公众号文章: 关键在于提供清晰且具有指导性的提示词(prompt)。好的提示词能让 AI 更准确理解需求并生成符合预期的内容。如“请根据我们收集的关于 OpenAI 回应马斯克言论的资讯,创作一篇既深入又易于理解的科技资讯文章。文章应该有一个吸引人的标题,开头部分要概述事件的背景和重要性,主体部分详细分析 OpenAI 的回应内容及其可能产生的影响,结尾处提出一些引人深思的问题或观点。”这样的提示词能为 AI 提供明确指导和设定文章基本结构、内容要求。最终产出的内容可能需要微调以符合预期和公众号风格。
2024-11-14
如何系统性的学习如何使用ai
以下是关于如何系统性学习使用 AI 的建议: 一、了解 AI 基本概念 1. 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 2. 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 1. 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 2. 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。同时,一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 1. 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 2. 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI 的建议: 1. 从编程语言入手学习,比如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等体验 AI 的应用场景,也可以探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识,包括了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等,以及学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目,比如参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态,关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展,思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 总之,无论是新手还是中学生,都可以从编程基础、工具体验、知识学习、实践项目等多个方面入手,全面系统地学习 AI 知识和技能。
2024-11-14
怎么学习AI
以下是关于新手学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-11-14
最新的文生视频/图生视频能力是什么
以下是关于最新的文生视频/图生视频能力的介绍: PIKA1.0 启用了全新的模型,文生视频质量大幅提升,例如输入“Cinematic,happy laughing girl in office,Pixar style”的 Prompt 能瞬间生成匹配皮克斯水平的镜头,且稳定性和神情表现出色,爆杀市面上所有的 AI 视频。在文生图方面,新模型也极其稳定。同时,图生视频效果很棒,人的一致性逆天,语义理解强,动作幅度大。此外,还有一些小技巧,如在右下角第三个设置里,负面提示(Negative prompt)可以常驻“blurry,out of focus,twisted,deformed”,提示词相关性别设 5 15 之间效果较好。 这半年来,除传统的文生视频、图生视频能力迭代外,主要技术发展还围绕着通过转绘改变画风、视频内人物识别和替换方向。在服务头部创作者方面,未来产品会强化编辑器能力和视频细节可控性,并智能化后期制作任务。影视后期方向,可将动捕演员表演转化为虚拟角色提高特效制作效率。专业领域,创作者能通过草图分镜验证效果。在 C 端大众消费侧,AI 视频有望在小说、网文阅读、短情景剧等内容消费方向发挥潜力,人物识别和替换可衍生电商平台虚拟试衣间能力。Viggle、DomoAI 的产品中的模板套用能力若低成本开放在短视频产品中,可能带来新的爆发周期。 Stable Video Diffusion 1.1 新模型以及 stablevideo.com 开始内测,清晰度、控制方式和效果都有很大提升,目前提供文生视频、图生视频两种方式,文生视频先生成 4 张图像选一张用于生成视频,图生视频提供几种控制方式(仅开放了一部分),另外目前提供 17 种风格。
2024-11-10
ChatGPT最新的版本是什么
目前 ChatGPT 官网主要有以下版本: 1. GPT3.5:免费版本,拥有 GPT 账号即可使用,但智能程度相对较低,无法使用 DALL.E3(AI 画图功能)、GPTs 商店和高级数据分析等插件,知识更新到 2022 年 1 月。 2. GPT4:智能程度较高,知识更新到 2023 年 12 月。想要使用更多功能需要升级到 PLUS 套餐,收费标准为 20 美金一个月,还有团队版和企业版,费用更贵,一般推荐使用 PLUS 套餐。 3. ChatGPT 4o:5.13 发布,可免费体验,但免费体验次数有限,知识更新到 2023 年 10 月。想要更多功能也需要升级到 PLUS 套餐。
2024-11-09
最新AI搜索相关产品总结
以下是关于最新 AI 搜索相关产品的总结: 自今年二月份以来,AI 搜索赛道不断有新的产品出现,市场定位有所差异。 在国内,有大模型厂商推出的 ChatBot 产品,如智谱清言、Kimi Chat、百小应、海螺 AI 等;也有搜索厂商或创业团队推出的 AI 搜索产品,如 360 AI 搜索、秘塔、博查 AI、Miku 等。 在海外,有很多成熟的和新出的泛 AI 搜索产品,如 Perplexity、You、Phind 等。中国公司和团队也有面向全球市场的出海产品,如 ThinkAny、GenSpark、Devv 等。 ThinkAny 选择出海做全球市场,主要考虑国内竞争激烈、用户付费意愿不高、存在政策风险等因素。 从解决的需求或面向的群体分类,可分为通用搜索和垂直搜索两类。通用搜索如 Perplexity、ThinkAny,没有明显的受众倾向,任何人可以搜任何问题,都能得到相对不错的搜索结果。垂直搜索如 Phind、Devv、Reportify,一般面向特定人群或特定领域,在某类问题的搜索上会有更好的结果。 AI 搜索目前主要有两类产品形态: 1. 大模型厂商或第三方推出的 ChatBot,主要交互是一个对话框+RAG 联网检索,这类产品包括 ChatGPT、Kimi Chat 等。 2. 专门做 AI 搜索的产品,主要交互是一个搜索框+搜索详情页,这类产品包括 Perplexity、秘塔等。 以下是一些推荐的 AI 搜索引擎: 1. 秘塔 AI 搜索:由秘塔科技开发,提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能,旨在提升用户的搜索效率和体验。 2. Perplexity:一款聊天机器人式的搜索引擎,允许用户用自然语言提问,使用生成式 AI 技术从各种来源收集信息并给出答案。 3. 360AI 搜索:360 公司推出的 AI 搜索引擎,通过 AI 分析问题,生成清晰、有理的答案,并支持增强模式和智能排序。 4. 天工 AI 搜索:昆仑万维推出的搜索引擎,采用生成式搜索技术,支持自然语言交互和深度追问,未来还将支持图像、语音等多模态搜索。 5. Flowith:一款创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,提供插件系统和社区功能。 6. Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 7. Phind:专为开发者设计的 AI 搜索引擎,利用大型语言模型提供相关的搜索结果和动态答案,特别擅长处理编程和技术问题。 这些 AI 搜索引擎通过不同的技术和功能,为用户提供更加精准、高效和个性化的搜索体验。但内容由 AI 大模型生成,请仔细甄别。
2024-11-07
最新AI资讯
以下是为您提供的最新 AI 资讯: 对于新手学习 AI,要持续学习和跟进,关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 AIGC Weekly 32 中的部分资讯: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器: 2024 年人工智能现状: OpenAI 的 o1 模型占据主导地位:OpenAI 的 o1 在数学、科学和推理方面重新定义了 AI 的极限,让竞争对手感到困惑和挫败。 中国的 AI 崛起:中国模型不顾制裁,凭借强大的韧性和战略智慧在排行榜上名列前茅,证明了其主导地位。 生成式 AI 的数十亿美元繁荣:AI 初创公司大赚,但可持续性仍像能理解细微差别的聊天机器人一样难以捉摸。报告链接:
2024-11-06
AI加教育的最新进展
以下是 AI 加教育的最新进展: 案例方面: “AI 赋能教师全场景”,来自 MQ 老师的投稿贡献。 “未来教育的裂缝:如果教育跟不上 AI”,揭示了人工智能在教育领域从理论走向实际应用带来的颠覆性改变。 “化学:使用大型语言模型进行自主化学研究”。 “翻译:怎么把一份英文 PDF 完整地翻译成中文?”,介绍了 8 种方法。 对未来的预判: 个性化学习时代已到来,AI 将作为教育生态系统的一部分与人类教师协作,为孩子提供不同的学习体验,如混合式教学、定制学习路径等。 教育工作者将成为学习的引导者和伙伴,更多关注孩子的全人发展,如创造力和社交智慧。 未来 3 年,提升人机协作效率的领域,如 AI 作业批改、备课、定制教育规划、学前启蒙等,对教育从业者蕴藏着巨大机遇。 探索实践: 过去半年多,梳理教学和育儿工作流,每个环节与 AI 协作可大幅提升效率,但也加剧了知识获取的不平等。从家长的“育”、老师的“教”和学生的“学”进行了落地实践的拆解。
2024-11-05
最新的开源数字人项目
以下是一些最新的开源数字人项目: 1. 项目地址:https://github.com/wanh/awesomedigitalhumanlive2d ,选择了 live2d 作为数字人躯壳,其驱动方式相比 AI 生成式更可控和自然,相比虚幻引擎更轻量和简单,卡通二次元形象接受度更高。Live2D 的 SDK 驱动方式可参考官方示例:https://github.com/Live2D 。 2. 开源数字人组合方案: 第一步:先剪出音频,使用 https://elevenlabs.io/speechsynthesis 或使用 GPTsovits克隆声音,做出文案的音频。 第二步:使用 wav2lip 整合包,导入视频和音频,对口型得到视频。基础 wav2lip+高清修复整合包下载地址:https://github.com/Rudrabha/Wav2Lip 。产品:https://synclabs.so/ 。 3. 构建数字人灵魂:可借助开源社区的力量,如 dify、fastgpt 等成熟的高质量 AI 编排框架。在开源项目中使用了 dify 的框架,可利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,具体部署过程参考 B 站视频:https://www.bilibili.com/video/BV1kZWvesE25 。如有更高度定制的模型,也可在 Dify 中接入 XInference 等模型管理平台部署自己的模型。数字人 GUI 工程中保留了 LLM、ASR、TTS、Agent 等多个模块,便于扩展。
2024-11-01
Ai技术现在的发展状况
AI 技术的发展状况如下: 发展历程: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现机器学习算法如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前前沿技术点: 1. 大模型:如 GPT、PaLM 等。 2. 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:例如元学习、一次学习、提示学习等。 5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。 6. 机器人学:涵盖强化学习、运动规划、人机交互等。 7. 量子 AI:包含量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 学习路径: 偏向技术研究方向: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 偏向应用方向: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 需要注意的是,无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。
2024-11-09
有没有模仿语音的(国内的)
以下是一些国内模仿语音的工具: 出门问问的魔音工坊,可以使用情绪调节控件。 需要说明的是,对于国内的语音模仿工具,目前了解和使用经验相对有限。
2024-11-14
国内都有哪些类似于文心一言类的AIGC应用?
国内类似于文心一言的 AIGC 应用有: 语言文字类:百度的文心一言、阿里云的通义千问等。 语音声音类:Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits。 图片美术类:早期有 GEN 等图片识别/生成技术,去年大热的扩散模型又带火了我们比较熟悉的、生成质量无敌的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion。
2024-11-14
现在国内比较好的AIGC应用都有哪些?
以下是一些国内比较好的 AIGC 应用: “悟道・天鹰”(北京智源人工智能研究院):“悟道・天鹰”(Aquila)是首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。
2024-11-14
国内有哪些AI出海产品
国内的 AI 出海产品有 ThinkAny、GenSpark、Devv 等。 在图像类 AI 产品方面,国内有可灵和通义万相。可灵由快手团队开发,用于生成高质量的图像和视频,图像质量高,但价格相对较高;通义万相是阿里旗下的工具,在中文理解和处理方面表现出色,用户可选择多种艺术和图像风格,操作界面简洁直观,且目前免费,但在某些方面存在局限性。 在 PPT 类 AI 产品方面,国内推荐爱设计 PPT,其背后有强大的团队,能敏锐把握市场机遇,已确立市场领先地位,能提高制作效率并保证高质量输出。
2024-11-12
国内文生图大模型,有哪些?
以下是一些国内的文生图大模型: 百度的文心一言:https://wenxin.baidu.com 抖音的云雀大模型:https://www.doubao.com 智谱 AI 的 GLM 大模型:https://chatglm.cn 中科院的紫东太初大模型:https://xihe.mindspore.cn 百川智能的百川大模型:https://www.baichuanai.com/ 商汤的日日新大模型:https://www.sensetime.com/ MiniMax 的 ABAB 大模型:https://api.minimax.chat 上海人工智能实验室的书生通用大模型:https://internai.org.cn 此外,真人效果卓绝的大模型 lofi.v2 也可用于生成真实场景下的字体。在使用 SDXL 大模型时,其分为 base+refiner 以及配套的 VAE 模型,base 用于文生图操作,refiner 用于细化生成的模型,VAE 用于调节图片效果和色彩。要在 webUI 中使用,需将秋叶启动器中 webUI 的版本升级到 1.5 以上,并将模型放入对应文件夹。
2024-11-12
像midjournal这样的国内外AI绘画社区
以下是为您介绍的像 Midjourney 这样的国内外 AI 绘画社区相关内容: Midjourney 是 AI 绘图领域家喻户晓的产品。其优点在于模型强大,能生成高质量图像,且支持充分的个性化设置。但使用过程不太便捷,需要通过 Discord 应用加入其频道或创建自己的频道并邀请 Midjourney 机器人才能生成图片。从学习难度来看,它的学习曲线较陡峭,在用户体验和易用性方面有待改进。 在“学社说明”中提到,大家一起收集和测试 AI 绘画提示词中的核心关键词,让新手规避无效探索,为相关从业人员节省时间。招募有 Midjourney 账号且喜欢 AI 绘画的人员,扫飞书二维码进群。根据关键词做创意,收录不错的作品。 在“AI 线上绘画教程”中提到,工作中需要大量图片时,AI 生图是高效的解决办法。主流的 Midjourney 付费成本高,Stable Diffusion 硬件门槛不低,但有像这样的免费在线 SD 工具网站。本教程旨在让入门玩家在半个小时内自由上手创作绘图。
2024-11-12