Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

最近国内外 有什么新出的AI产品

Answer

以下是国内外新出的一些 AI 产品:

  • 图像类产品:
    • 国内:
      • 可灵:由快手团队开发,用于生成高质量的图像和视频,图像质量高,最初采用内测邀请制,现向所有用户开放,价格相对较高,重度用户年费可达几千元,平均每月使用成本在 400 到 600 元,也有临时或轻度使用的免费点数和较便宜包月选项。
      • 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,生成图像质量高、细节丰富,操作界面简洁直观、用户友好度高,能与阿里其他产品和服务无缝整合,重点是现在免费,每天签到获取灵感值即可,但存在某些类型图像无法生成、处理非中文语言或国际化内容不够出色、处理多元文化内容可能存在偏差等局限性。
  • 搜索类产品:
    • 国内:大模型厂商推出的 ChatBot 产品(智谱清言、Kimi Chat、百小应、海螺 AI 等),搜索厂商或创业团队推出的 AI 搜索产品(360 AI 搜索、秘塔、博查 AI、Miku 等)。
    • 海外:Perplexity、You、Phind 等。
    • 中国公司和团队的出海产品:ThinkAny、GenSpark、Devv 等。
  • PPT 类产品:
    • 国内:爱设计 PPT,背后有实力强大的团队,对市场需求有敏锐洞察力,把握住了 AI 与 PPT 结合的市场机遇,已确立市场领先地位,代表了当前国内 AI 辅助 PPT 制作的最高水平,能提高制作效率并保证高质量输出。
Content generated by AI large model, please carefully verify (powered by aily)

References

给小白的AI产品推荐

在图像AI领域,我们见证了一场引人注目的变革。不久前,国外产品还是这个舞台上的独角戏,风靡全球。国内产品似乎还在后台默默追赶,努力缩小差距。今天,我们看到的是一幅截然不同的画面。国内的图像AI产品不再甘居人后,而是以惊人的速度赶超,甚至在某些方面开始引领潮流。所以谈到图像类AI产品的时候就有国内的产品可以讲一讲了。[heading2]3.1国内[heading3]3.1.1可灵[content]首先介绍的是"可灵",这是一款由快手团队开发的AI应用。可灵主要用于生成高质量的图像和视频。它的一大特点是生成的图像质量非常高。可灵最初采用内测邀请制,但现在已经向所有用户开放使用。然而,可灵的价格相对较高。与其他AI应用相比,它的费用要贵一些。对于重度用户,最高档的年费可能达到几千元人民币,如果平均到每个月,使用成本在400到600元人民币之间。但如果临时使用或轻度使用的话,仍然有每日免费点数和60多元单月的最便宜包月选项,对轻度用户来说还是值得一试的。[heading3]3.1.2通义万相[content]通义万相作为国产AI工具,它在中文理解和处理方面表现出色,这一特点使其在国内市场具有独特优势。用户可以从多种艺术风格和图像风格中进行选择,满足不同创作需求。生成的图像质量较高,细节丰富,能够满足大多数用户的期望。操作界面设计简洁直观,用户友好度高,降低了使用门槛。作为阿里生态系统的一部分,该工具可以与阿里其他产品和服务无缝整合,为用户提供更全面的解决方案。重点是现在免费,每天签到获取灵感值就可以。然而,这个应用也存在一些局限性。为了符合国内监管要求,某些类型的图像可能无法生成,这在一定程度上限制了创作自由度。在处理非中文语言或国际化内容方面,它可能不如一些国际AI图像生成工具那样出色。由于模型训练数据可能主要基于中文环境,在处理多元文化内容时可能存在偏差。

工具:我做了一个 AI 搜索引擎

从今年二月份以来,AI搜索赛道不断有新的产品出来,在市场定位有所差异。我们看到的,大部分聚焦在国内。比如大模型厂商推出的ChatBot产品(智谱清言/Kimi Chat/百小应/海螺AI等),比如搜索厂商或创业团队推出的AI搜索产品(360 AI搜索/秘塔/博查AI/Miku等)海外也有很多成熟的和新出的泛AI搜索产品(Perplexity/You/Phind等)中国公司和团队也有面向全球市场的出海产品(ThinkAny/GenSpark/Devv等)关于市场定位的问题,跟创始团队的背景或认知有关,没有绝对的好坏。ThinkAny选择出海做全球市场,主要考虑的是:1.国内竞争太激烈,卷不过2.国内用户付费意愿不高,不太好做商业化3.国内有些政策风险,没有成熟的法务合规团队,不太敢尝试通用搜索与垂直搜索除了市场定位,从解决的需求或面向的群体分类,可以分成通用搜索和垂直搜索两类。比如Perplexity/ThinkAny是通用搜索。Phind/Devv/Reportify是垂直搜索。通用搜索一般可以认为,没有明显的受众倾向,任何人可以搜任何问题,都能得到一个相对还不错的搜索结果。垂直搜索跟通用搜索比,一般会面向特定的人群或特定的领域,对特定的信息源做索引和优化,在某类问题的搜索上会有更好的结果。比如Devv主要面向的是开发者人群,问编程相关的问题,搜索结果和回复准确度都比较高,问旅游或其他类型的问题,回答质量则不如通用搜索。通用搜索和垂直搜索的好坏,也没有客观的评判标准。普遍的认知是:

给小白的AI产品推荐

当谈到PPT类AI产品时,不得不提的是,无论国内还是国外,这类产品都非常丰富。市场上的PPT类AI产品通常是在传统PPT设计和生成工具的基础上,融入了生成式AI的新功能。这种融合带来了许多创新,但同时也造成了产品种类的繁多,可能会让用户在选择时感到困惑。考虑到这一点,我决定基于个人使用经验,为大家筛选出一些我认为值得推荐的产品。[heading2]5.1国内[heading3]5.1.1爱设计PPT[content]在国内AI辅助制作PPT的产品领域中,有一款产品脱颖而出,成为我唯一推荐的选择——爱设计PPT。这款产品在众多国内PPT类AI产品中独树一帜,其卓越的性能和用户体验让人不得不为之赞叹。几个月前,我有幸与爱设计PPT背后公司"爱设计"的CEO进行了深入交流。这次交流让我对他们产品的成功有了更深入的理解:首先,这款产品背后拥有一支实力强大的团队。这支团队不仅技术过硬,还对市场需求有着敏锐的洞察力。正是这样的团队才能持续推动产品的创新和进步。其次,他们成功把握住了AI与PPT结合的市场机遇。在AI技术迅速发展的背景下,他们敏锐地察觉到了将AI应用于PPT制作的巨大潜力,并迅速开发出了这款产品。这种前瞻性的市场洞察力和快速的执行能力,是爱设计PPT成功的关键因素之一。最后,这款产品已经在国内AI生成PPT产品中确立了市场领先地位。这不仅证明了产品的优秀品质,也反映了用户对爱设计PPT的高度认可。基于以上原因,我强烈推荐国内用户使用爱设计PPT。它不仅代表了当前国内AI辅助PPT制作的最高水平,还在不断进步,为用户提供越来越好的体验。爱设计PPT的成功不仅仅是一款产品的成功,更是AI技术在实际应用中的一次重要突破。对于那些经常需要制作PPT的人来说,无论是商务人士、教育工作者还是学生,爱设计PPT都是一个值得尝试的工具。它能够大大提高PPT制作的效率,同时保证高质量的输出。随着AI技术的不断进步,我们有理由相信爱设计PPT会在未来带来更多令人惊喜的功能和性能提升,继续引领AI辅助PPT制作领域的发展。

Others are asking
斯坦福大学新出的AI工具storm,storm的主要功能有哪些,如何使用
STORM 是斯坦福大学开发的创新写作系统,主要功能包括: 1. 自动化编写具有维基百科深度的长篇文章。 2. 通过模拟人类写作过程中的预写、起草和修订阶段,实现自动化信息收集和大纲创建。 关于如何使用,目前提供的信息中未明确提及具体的使用方法。但您可以通过以下途径获取更多使用相关的信息: 1. 访问相关链接:https://arxiv.org/abs/2402.14207 、https://x.com/xiaohuggg/status/1762308686259929162?s=20 。 此外,还有一种用于语音增强和去发声的随机再生模型 StoRM : 1. 代码获取:https://github.com/spuhh/storm 2. 演示查看:https://www.inf.unihamburg.de/en/inst/ab/sp/publications/storm 3. 论文查阅:https://arxiv.org/abs/2212.11851 其核心在于随机再生方法,能够结合预测模型和基于扩散的生成模型的优势,生成更清晰、更自然的语音输出。在实际应用中,可从受损的语音信号中恢复出干净的语音,且通过减少逆向扩散步骤的数量和避免使用复杂的修正器,显著降低了计算负担。在实验中,其在多个标准数据集上的表现均超过了现有的预测性和生成性语音增强方法。源代码和音频示例已公开,方便研究人员和开发者进一步探索和应用。
2025-01-03
斯坦福大学新出的AI工具storm
以下是关于斯坦福大学新出的 AI 工具 STORM 的相关信息: STORM 是斯坦福大学开发的创新写作系统,能够自动化编写具有维基百科深度的长篇文章。它通过模拟人类写作过程中的预写、起草和修订阶段,实现自动化的信息收集和大纲创建。相关链接:https://arxiv.org/abs/2402.14207 ,https://x.com/xiaohuggg/status/1762308686259929162?s=20
2025-01-03
openAI新出的o1是什么
OpenAI 于北京时间 9 月 13 号凌晨 1 点多宣布推出模型 o1perview 与 o1mini(真正的 o1 版本将在后续开放),拥有 Plus 版本的用户会陆续收到新模型权限,并可在 Web 客户端中尝鲜体验。 在评估结果方面: o1 在 2024 美国数学奥林匹克竞赛(AIME)资格赛中跻身美国前 500 名学生之列。 o1 在竞争性编程问题(Codeforces)中排名第 89 个百分位(这个版本的模型还没发布),而 o1perview 拿到了 62 个百分位。 在物理、生物和化学问题的基准(GPQA),o1 与 o1perview 都超过了人类博士水平的准确性。 关于“超过人类博士水平”的测试,OpenAI 在新 page 中答复:“我们还在 GPQA diamond 上评估了 o1,这是一个困难的智力基准测试,用于测试化学、物理和生物学方面的专业知识。为了将模型与人类进行比较,我们招募了拥有博士学位的专家来回答 GPQAdiamond 的问题。我们发现 o1 的表现超越了这些人类专家,成为第一个在这个基准测试上做到这一点的模型。”但 OpenAI 也表示“这些结果并不意味着 o1 在所有方面都比博士更有能力——只是说明该模型在解决一些预期博士能够解决的问题上更加熟练。在其他几个机器学习基准测试上,o1 改进了最先进的水平。” 推理模型的准确率不断攀升,这意味着 AI 技术可以渗透到更多行业、更多高精尖业务中去。OpenAI 推出的新模型为整个行业注入了强心剂,带来了新的活力和希望。从 OpenAI 提出的通往 AGI(通用人工智能)的分级来看,我们正在从第一级向第二级迈进,未来可能会见证 AI 从单纯的生成工具向真正的智能体转变。此外,4o 模型和 o1 在推理方面差距较大,红色线代表 4o 的得分,绿色线代表 o1 的得分,o1 在各项得分结果上均优于 4o。
2024-09-18
有没有ai制作海报的软件或者网站,最好能理解案例图片的
以下是一些可以用 AI 制作海报的软件和网站,并为您附上相关案例和使用方法: 1. 无界 AI: 网址:https://www.wujieai.cc/ 做图逻辑类似于 SD,优势在于国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。 应用场景示例:朋友圈 po 图,画幅比例选择 1:1。 皮克斯卡通模型位置:二次元模型》模型主题》皮克斯卡通。 关键词类别:场景(如向日葵花田、面包店等)、氛围(如温馨、温暖等)、人物(如父亲和女儿、父亲和儿子)、造型(如发型、发色、服饰、配饰)、情绪(如笑得很开心、大笑、对视等)、道具(如童话书等)、构图(如半身、中景等)、画面(色彩明艳)。 2. Canva(可画): 网址:https://www.canva.cn/ 是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,用户可通过简单拖放操作创建海报,其 AI 功能可帮助选择合适颜色搭配和字体样式。 3. 稿定设计: 网址:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 4. VistaCreate: 网址:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 5. Microsoft Designer: 网址:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子和其他视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,大大简化设计流程。 此外,还有东阿阿胶的海报设计案例分享: 1. 拆解步骤:得到需求 提取元素 绘制线稿 用 controlnet 转绘上色 ps 优化 定稿。 2. 需求元素:风格要潮流插画,还要有唐代元素和国潮(前期基本上是沟通成本,主要定线稿)。 3. 提取元素:获取的信息需要体现产品图,需要体现唐代元素,需要 logo 在中心位置,按照需求开始绘制线稿。 4. 线稿绘制:沟通的元素是牡丹花,驴子(最后换成了琵琶),人参和产品图和 logo,所以进行线稿调整绘制(中间很多细节沟通)最终定下线稿(里面很多元素都是拼接的)。 5. 拆分元素线稿:这一步非常重要,因为会涉及到后续元素替换等问题,比如单个 logo,产品等,提取出单独元素,进行绘制,最后进行替换。 6. 单个元素绘制:这样会让单个元素更加精致,也方便后期替换。 7. 然后利用拼接好的线稿进行大量跑图抽卡,选出一张最合适的进行 ps 优化。 8. 整体拼接上色后的效果(将单独跑的元素在 ps 里替换优化,再过一遍 sd 进行溶图放大)得到以下效果。 9. 最终客户把驴子去掉了,换成了一把琵琶,也是同产品图一样的做法,最后把琵琶替换掉驴子,得到定稿图。 上色运用的大模型:GhostMix 鬼混_V2.0 lora 模型:"盒子系列——平面国潮插画_v1.0:182ba9e2f576 controlnet 模型:"Module:lineart_coarse,Model:contr"
2025-01-07
哪个AI工具可以对音频内容进行总结
以下是一些可以对音频内容进行总结的 AI 工具: 1. 飞书妙记(https://www.feishu.cn/product/minutes):飞书的办公套件之一。 2. 通义听悟(https://tingwu.aliyun.com/home):阿里推出的 AI 会议转录工具。 3. 讯飞听见(https://www.iflyrec.com/):讯飞旗下智慧办公服务平台。 4. Otter AI(https://otter.ai/):转录采访和会议纪要。 5. BibiGPT·AI 音视频内容一键总结(https://b.jimmylv.cn/) 6. 15 个值得一试的 YouTube 视频摘要 AI 工具(https://nealschaffer.com/youtubevideosummarizerai/) 7. summarize.tech:AIpowered video summaries(https://www.summarize.tech/) 8. NotebookLM:最早主打的是智能笔记,上传文件之后会自动生成概览性的总结。用户可以在对话框里,根据上传文本的内容,直接用文字提问。支持长文本,语言目前只支持英文。
2025-01-07
哪个AI可以对音频进行总结
以下是一些可以对音频进行总结的 AI 工具和公司: 声音检测方面: :通过更强的听觉感知创造卓越的人类体验。 :先进的声音识别解决方案,能够分类如尖叫、枪声、咳嗽和哭泣等声音。 :下一代声音 AI 平台,能够像人类一样理解任何声音。 :语音控制的家庭自动化系统。 :世界上首个智能家居听觉系统。 :可用于从音频源中提取隐藏数据的 AI 模型。 :无需键盘、按钮或触摸屏,无缝融合物理世界和数据世界。 :为手机、VR/AR 头戴设备、智能手表、扬声器和笔记本电脑提供上下文感知。 :智能音频穿戴设备。 :我们将声音转化为信息。 :使用先进的深度学习技术进行声音事件检测和上下文识别,为世界上的每一个声音赋予意义。 语音增强与操作方面: :实时语音和口音转换流媒体服务。 :为高效在线会议提供的 AI 驱动软件解决方案。 :免费的实时语音变换器。 :为创作者、开发者和虚拟会议提供的降噪产品。 :软件在复杂声学环境中提升语音的清晰度和可懂度。 :不制作音频,让音频更好。 :会议和音频的降噪。 :采用最先进的 AI 技术消除视频会议通话中的所有背景噪音。 :一套 AI 驱动的音频质量增强工具。 :将智能手机变成高级语音增强设备的应用程序。 :去除干扰性背景噪音的智能手机应用程序。 :用于音频和语音产品的智能音频解决方案。 :通过引入机器学习功能来革新麦克风。 :生成式 AI 音频增强。 音视频总结方面:
2025-01-07
我想要设计一个以班级期末总结为主题的40分钟班会课,请你帮我推荐一下有哪些AI软件可以完成这项任务
目前没有专门针对设计班级期末总结主题班会课的特定 AI 软件。但您可以借助一些通用的工具来辅助您完成,例如: 1. 文字处理工具,如 Microsoft Word 或 WPS,帮助您撰写班会课的流程和内容。 2. 思维导图工具,如 XMind 或百度脑图,用于梳理班会课的框架和要点。 3. 演示文稿工具,如 Microsoft PowerPoint 或 Keynote,制作展示用的 PPT 来辅助讲解。 希望这些建议对您有所帮助。
2025-01-07
怎么学习ai
以下是新手学习 AI 的方法和建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-07
普通人怎么用AI赚钱
普通人可以通过以下方式利用 AI 赚钱: 1. 艺术创作:生成式 AI 使内容创作成为可能,从肖像画开始,涵盖各种媒介。做得好时,可通过创作内容实现盈利。但要注意,目前一些 AI 工具可能存在幻觉或处理请求时间长的问题,对于试图通过内容盈利的高级用户,许多公司会推出如 ChatGPT 那样的“专业版”套餐以提供更高质量服务。 2. 数字克隆体:成为数字克隆体的本体,基于克隆体的费率和被使用时长与平台结算。越多人使用,收益越多。用户还可通过订阅平台使用多个克隆体,月费或额外小时费可与获取的收益相抵扣。这样,每个人都能在体系中既是消费者又是生产者,只要数字克隆体受欢迎,就能实现“数字克隆体自由”。
2025-01-07
我想用AI制作一个帮助自己及时获得某细分工业领域国内外信息的工具,应该如何开始?
以下是使用 AI 制作帮助自己及时获得某细分工业领域国内外信息工具的步骤: 1. 让 AI 阅读学习一篇您认为优秀的行业调研报告,总结其中的方法论,输出一份“行业调研报告”的研究方法和操作框架。 2. 询问 AI 该文章在收集行业数据时使用了哪些一手数据和二手数据,并请其推荐一些靠谱的行业资料收集网站。 3. 要求 AI 参考上述内容,为您写一份“XXX 行业调研报告”,并请其作为“行业调研报告撰写专家”,推荐 10 个“XXX 行业”信息网站和 5 个“XXX 行业”研究微信公众号,然后输出一份“XXX 行业调研报告”框架。 4. 要求 AI 针对上述“XXX 行业调研报告”框架,丰富每一章节内容,每章内容字数大于 200 字。 5. 完成以上 4 个步骤后,AI 会为您写出一个“XXX 行业调研报告”的初稿。接下来,您可以根据自己的需求,让 AI 进一步完善每一个章节的内容。然后结合您自己的独特经验和知识,对文章内容进行润色和调整。 需要注意的是,要使调研报告有深度,可以通过以下两个路径: 1. 自己对行业比较了解,整理深度洞察和见解。 2. 一步一步深度咨询 AI,借助 AI 的海量知识,一边学习、一边研究、一边洞察总结。(通过借助 AI,可以加速我们的学习和研究能力) 操作示例如下:获取“kimi 对话原文”链接: 欢迎与 JessieZTalk 交流,在 AIGC 的路上共同进步!
2025-01-07
国内外最好的来源大模型有哪些 对比介绍一下
以下是国内外一些较好的大模型及其对比介绍: 国外大模型: GPT4 Turbo 总分 90.63 分遥遥领先,在各项能力上表现出色。 国内大模型: 文心一言 4.0(API)总分 79.02 分,过去 1 年有长足进步。 通义千问 2.0(阿里云):在代码、上下文对话基础能力上排名国内第一,各项能力较为均衡,位于国内大模型第一梯队,适合应用于金融、医疗、汽车等垂直专业场景及代码生成与纠错等场景。 AndesGPT(OPPO):在语言理解与抽取、角色扮演能力上排名国内前一,在代码、生成与创作、上下文对话能力上排名国内前三,各项能力较为均衡,聚焦在移动设备端的应用。 百川智能的 Baichuan213BChat:是中文开源模型的主导力量,在中文上表现优于国外开源模型。 在 SuperCLUE 测评中,国外模型的平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右,但国内外的平均水平差距在缩小。另外,国内开源模型在中文上表现要好于国外开源模型。
2024-12-28
文生视频目前最新最主流好用的有哪些,国内外均可
以下是一些国内外最新且主流好用的文生视频工具: 1. Pika:擅长动画制作,支持视频编辑。 2. SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 3. Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 4. Kaiber:能将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多的文生视频网站可查看:https://www.waytoagi.com/category/38 。 以生成方式划分,当前视频生成可分为文生视频、图生视频与视频生视频。视频生成涉及深度学习技术,如 GANs 和 Video Diffusion,主流生成模型为扩散模型。一些具有代表性的海外项目如: 1. Sora(OpenAI):以扩散 Transformer 模型为核心,能生成长达一分钟的高保真视频,支持多种生成方式,在文本理解方面表现出色,能在单个生成的视频中创建多个镜头,保留角色和视觉风格。 2. Genie(Google):采用 STtransformer 架构,包括潜在动作模型、视频分词器与动力学模型,拥有 110 亿参数,被定位为基础世界模型,可通过单张图像提示生成交互式环境。
2024-12-26
国内外所有虚拟数字人影响力及诞生时间
以下是国内外部分虚拟数字人的相关信息: 报告类: ,发布者为中国网络视听协会、人民日报智慧媒体研究院、中国传媒大学动画与数字艺术学院、元力趋势网,发表日期为 2024 年 1 月 1 日。 ,发布者为上海市人工智能技术协会、零壹智库、增强现实核心技术产业联盟、商汤科技,发表日期为 2024 年 4 月 11 日。 ,发布者为国盛证券,发表日期为 2023 年 11 月 21 日。 ,发布者为中航证券,发表日期为 2023 年 12 月 5 日。 ,发布者为招商证券,发表日期为 2023 年 10 月 29 日。 数字科技有限公司,发表日期为 2021 年 1 月 1 日。 ,发布者为清华大学新闻与传播学院,发表日期为 2023 年 2 月 21 日。 市场竞争类: 井英科技:CreativeFitting 专注打造“AI+人工”的商业短视频创作新模式,从创意发现到脚本创作,再到视频生产,均引入了 AI 辅助创作,大幅降低了优质短视频生产的边际成本,显著提高了生产效率和产能,网站为,成立于 2020 年 4 月 16 日,地点在上海,融资阶段为 A 轮。 铭顺科技:数字人私有化部署方案提供商,网站为,成立于 2022 年 7 月 15 日,地点在长沙,融资阶段为 A 轮。 八点八数字科技:虚拟人全链路服务公司,网站为,成立于 2014 年 9 月 1 日,地点在南京,融资阶段为 PreA 轮。 慧夜科技:虚拟生命 AI 驱动技术服务商,网站为,成立于 2019 年 5 月 30 日,地点在北京,融资阶段为 PreA 轮。 深锶科技:XR 内容创作平台,网站为,成立于 2021 年 12 月 1 日,地点在北京,融资阶段为 PreA 轮。 拟仁智能:AI 虚拟人解决方案提供商,网站为,成立于 2020 年 9 月 1 日,地点在杭州,融资阶段为天使轮。 心识宇宙:人工智能赋能虚拟人大脑,让虚拟人具有思维、意识和人格,网站为,成立于 2022 年 1 月 1 日,地点在杭州,融资阶段为天使轮。 跳悦智能:AI 数字人技术研发商,如虚拟主播带货,网站为,成立于 2021 年 6 月 1 日,地点在北京,融资阶段为天使轮。 延伸阅读类: ,发布者为汉坤,发表日期为 2022 年 6 月 22 日,类别为文章。 ,发布者为浙江省发展和改革委员会,发表日期为 2022 年 12 月 25 日,类别为政策。
2024-12-08
像midjournal这样的国内外AI绘画社区
以下是为您介绍的像 Midjourney 这样的国内外 AI 绘画社区相关内容: Midjourney 是 AI 绘图领域家喻户晓的产品。其优点在于模型强大,能生成高质量图像,且支持充分的个性化设置。但使用过程不太便捷,需要通过 Discord 应用加入其频道或创建自己的频道并邀请 Midjourney 机器人才能生成图片。从学习难度来看,它的学习曲线较陡峭,在用户体验和易用性方面有待改进。 在“学社说明”中提到,大家一起收集和测试 AI 绘画提示词中的核心关键词,让新手规避无效探索,为相关从业人员节省时间。招募有 Midjourney 账号且喜欢 AI 绘画的人员,扫飞书二维码进群。根据关键词做创意,收录不错的作品。 在“AI 线上绘画教程”中提到,工作中需要大量图片时,AI 生图是高效的解决办法。主流的 Midjourney 付费成本高,Stable Diffusion 硬件门槛不低,但有像这样的免费在线 SD 工具网站。本教程旨在让入门玩家在半个小时内自由上手创作绘图。
2024-11-12
类似堆友,吐司这样的国内外AI生图
以下是为您整理的类似堆友、吐司的国内外 AI 生图产品: 国内: 阿里堆友 AI 反应堆:图像生成类产品。 图怪兽:资源类,4 月访问量 48.3 万 Visit,相对 3 月变化 0.299 。 美图秀秀 Meitu:图像编辑类,4 月访问量 47.9 万 Visit,相对 3 月变化 0.061 。 AI 抠图 pixian.ai:图像编辑类,4 月访问量 44 万 Visit,相对 3 月变化 0.176 。 佐糖:图像编辑类,4 月访问量 43.3 万 Visit,相对 3 月变化 0.071 。 我图网:图像生成类,4 月访问量 41.8 万 Visit,相对 3 月变化 0.012 。 文心一格:图像生成类,4 月访问量 41.5 万 Visit,相对 3 月变化 0.086 。 标智客 Ai Logo:图像生成类,4 月访问量 37.8 万 Visit,相对 3 月变化 1 。 可灵:由快手团队开发,主要用于生成高质量的图像和视频,图像质量高,最初采用内测邀请制,现向所有用户开放,价格相对较高,重度用户年费最高可达几千元,临时或轻度使用有免费点数和较便宜包月选项。 通义万相:在中文理解和处理方面表现出色,可从多种艺术和图像风格中选择,生成图像质量高、细节丰富,操作界面简洁直观,用户友好度高,可与阿里其他产品和服务无缝整合,目前免费,每天签到获取灵感值,但存在一定局限性,如某些类型图像因国内监管要求无法生成,处理非中文语言或国际化内容可能不够出色,处理多元文化内容可能存在偏差。 国外:暂无相关具体产品信息。
2024-11-12
最近Agent方面的场景案例
以下是一些关于 Agent 方面的场景案例: 1. 吴恩达最新演讲中提到的四种 Agent 设计范式: Reflection(反思):例如让用 Reflection 构建好的 AI 系统写代码,AI 会把代码加上检查正确性和修改的话术再返回给自己,通过反复操作完成自我迭代,虽不能保证修改后代码质量,但效果通常更好。 Tool Use(工具使用):大语言模型调用插件,极大拓展了 LLM 的边界能力。 Planning(规划):属于比较新颖且有前景的方式。 Multiagent(多智能体):也具有发展潜力。 2. Ranger 文章中的相关内容: Agent 被认为是大模型未来的主要发展方向。 中间的“智能体”通常是 LLM 或大模型,通过为其增加工具、记忆、行动、规划这四个能力来实现。 行业里主要用到的是 langchain 框架,它在 prompt 层和工具层完成主要的设计,将 LLM 与 LLM 以及 LLM 与工具进行串接。 3. 从词源和历史变迁来看: 在不同时期,“Agent”在商业、政府、情报、娱乐、体育等领域都有重要角色,涵盖贸易代理、公司代理商、情报特工、艺人经纪人等多种职业。 “Agent”一词具有行动和替身的含义,多数情况下指“拥有行动的替身,替代他人做某事”。
2025-01-07
最近有什么 AI 资讯,给我总结出来
以下是为您总结的近期 AI 资讯: 简报: TLDR AI: The Sequence: Deep Learning Weekly: Ben’s Bites: Last week in ai: Your guide to AI: 播客: No Priors podcast hosted by Sarah Guo and Elad Gil Robot Brains Podcast hosted by Pieter Abbeel Lex Fridman Podcast hosted by Lex Fridman The Gradient podcast hosted by Daniel Bashir Generally Intelligent hosted by Kanjun Qiu Last Week in AI 会议: 工业界:World AI Cannes Festival 其他资讯: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器: 12 月 26 日资讯: Meta:AI 建模技术 PartGen,一种从各种模态(包括文本、图像、3D 模型)进行组合/零件级 3D 生成和重建的新方法。地址: Threejs ai:生成极简 3D 场景工具,由网友@vidythatte 开发的根据文字/图片提示生成极简 3D 场景工具,输入提示文字即可迭代构建这样的场景,可以用它制作简单的故事交互应用。地址:
2025-01-03
最近有什么新的AI工具
以下是一些新的 AI 工具: 游戏方面: Unity 推出了两款 AI 工具,包括提供新 Copliot 工具,可通过与 Muse Chat 聊天快速启动创建游戏项目,如一键生成塔防类游戏基础框架、创建人物角色动作,还能协助编码和创建 3D 材质、动画等内容。Muse Chat 现已经开放 Waiting list,可通过 https://create.unity.com/aibeta 申请加入,官方提示这个暑假会进一步开放。 Unity Sentis 是第一个将 AI 模型嵌入到实时 3D 引擎中的跨平台解决方案,能在终端用户平台上增强游戏玩法和其他功能,目前还在封测阶段。 思维导图方面: GitMind:免费跨平台,支持多种模式,可通过 AI 自动生成思维导图。 ProcessOn:国内思维导图+AIGC 工具,能利用 AI 生成思维导图。 AmyMind:轻量级在线工具,无需注册登录,支持自动生成节点。 Xmind Copilot:基于 GPT 的 AI 思维导图助手,可一键拓展思路、生成文章大纲。 TreeMind:输入需求由 AI 自动完成思维导图生成。 EdrawMind:提供包括 AI 驱动的头脑风暴功能等一系列 AI 工具。 建筑设计审核规划平面图方面: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster。 Maket.ai:面向住宅行业,能根据输入自动生成户型图。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,可引入标准和规范约束设计结果。 Fast AI 人工智能审图平台:形成全自动智能审图流程,能实现数据汇总与管理。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。每个工具都有其特定的应用场景和功能,建议根据具体需求选择合适的工具。
2024-12-25
最近一周AI在B端有什么新闻吗
以下是最近一周 AI 在 B 端的部分新闻: 一位投资人分享了其用于深化人工智能/机器学习知识的工具和资源,包括简报(如 TLDR AI、The Sequence 等)、播客(如 No Priors podcast 等)、会议(如工业界 World AI Cannes Festival)。 AIGC Weekly32 提到:Netflix 列出年薪 90 万美元的机器学习平台产品经理岗位;Shopify 的 AI 助手 Sidekick 上线;Artifact 推出自定义内容阅读语音功能;OpenAI、谷歌、微软和 Anthropic 组建前沿模型论坛;OpenAI 下线 ChatGPT 生成内容的检测器。 XiaoHu.AI 日报中:Hebbia 获得近 1 亿美元 B 轮融资,其 AI 技术能一次处理多达数百万份文档,主要面向金融服务公司等专业领域;Character AI 推出与 AI 角色通电话的新功能,支持多种语言且可在通话和短信间无缝切换;微软文本转语音虚拟数字人上线,支持 GPT4o 的集成。
2024-12-24
最近最好用的ai编程软件有哪些
以下是一些最近好用的 AI 编程软件: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,助其更快、更少地编写代码。 2. 通义灵码:阿里巴巴团队推出,基于通义大模型,提供多种编程辅助能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,可提升开发效率。 5. Cody:代码搜索平台 Sourcegraph 推出,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供的免费 AI 代码助手,基于自研基础大模型微调。 7. Codeium:由 AI 驱动,通过提供代码建议、重构提示和代码解释等帮助软件开发人员提高编程效率和准确性。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可以根据自身需求选择最适合的工具。 另外,Cursor 也是一款好用的 AI 编程工具,它是一个专为人工智能辅助编程设计的现代化集成开发环境,具有 AI 辅助编码、代码自动补全、实时代码分析、多语言支持、集成终端、Git 集成、自定义主题、跨平台、性能优化和实时协作等特点。您可以通过 https://www.cursor.com/ 链接进入其产品主页,在右上角点击下载,下载后解压安装即可使用。 到 2024 年 9 月,大多数程序员使用 Cursor 搭配 Anthropic Sonnet 3.5 或 OpenAI o1 可以获得最佳效果。
2024-12-23
🚀接着上期SOP+AI:打造职场高效能人士的秘密武器的分享,今天继续聊聊SOP+AI的应用,🎯今天的主题是“怎样利用AI节约10倍内容创作时间?”📚最近跟团队有开始运营小红书账号,就想着先给自己打造点顺手的工具,于是乎「小红书文案专家」就出生啦~🎉[heading1]一、先介绍下我们小Bot[content]🛺BOT名称:小红书文案专家功能价值:见过多个爆款文案长啥样,只需输入一个网页链接或视频链接,就能生成对应的小红书文案,可以辅助创作者生成可以一键复制发布的初稿,提供创意和内容,1
以下是关于“SOP+AI”的相关内容: 怎样利用 AI 节约 10 倍内容创作时间? 最近团队开始运营小红书账号,于是打造了“小红书文案专家”。 BOT 名称:小红书文案专家 功能价值:见过多个爆款文案,输入网页或视频链接就能生成对应的小红书文案,辅助创作者生成可一键复制发布的初稿,提供创意和内容,节约 10 倍文字内容创作时间。 应用链接:https://www.coze.cn/s/ij5C6LWd/ 设计思路: 痛点:个人时间有限,希望有人写初稿并生成配图。 实现思路:为自己和团队设计工作流,让 AI 按运营思路和流程工作。 一期产品功能: 1. 提取任何链接中的标题和内容。 2. 按小红书平台文案风格重新整理内容。 3. 加入 emoji 表情包,使文案更有活力。 4. 为文案配图片。 二期计划功能:持续优化升级,增加全网搜索热点功能,提炼热点新闻或事件关键信息,结合用户想要生成的内容方向输出文案和配图。 SOP+AI:打造职场高效能人士的秘密武器 案例分享:X 公司客服团队引入 SOP 和 AI 助手后,工作效率显著提升。引入 SOP 前,客服工作流程混乱,效率低下,客户满意度不高。引入 SOP 标准化操作后,效率提高。进一步引入 AI 助手,自动回复常见问题、处理简单请求,减少客服工作量,还能及时发现问题帮助优化。结果客服团队工作效率提升 30%以上,客户满意度显著提高。SOP 能提升效率、减少失误、促进协作,借助 AI 助手,SOP 制定和优化更高效智能。
2024-12-20