Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

文生图模型打分的排行榜

Answer

以下是关于文生图模型打分的排行榜相关信息:

  • SuperCLUE-Image 测评基准首次公布,DALL-E 3 以 76.94 分高居榜首,显示其在图像生成质量、多样性和文本一致性方面的卓越表现。百度文心一格和 vivo 的 BlueLM-Art 位列国内前列,但与国际领先模型仍有差距。
  • 在包含人工评估、机器评估的全面评测中,Kolors 具有非常有竞争力的表现,达到业界领先水平。构建了包含 14 种垂类、12 个挑战项、总数量为一千多个 prompt 的文生图评估集 KolorsPrompts。
    • 人工评测方面,邀请了 50 个具有图像领域知识的专业评估人员对不同模型的生成结果进行对比评估,衡量维度为画面质量、图文相关性、整体满意度三个方面。Kolors 在整体满意度方面处于最优水平,其中画面质量显著领先其他模型。具体平均分如下:
      • Adobe-Firefly:整体满意度平均分 3.03,画面质量平均分 3.46,图文相关性平均分 3.84。
      • Stable Diffusion 3:整体满意度平均分 3.26,画面质量平均分 3.5,图文相关性平均分 4.2。
      • DALL-E 3:整体满意度平均分 3.32,画面质量平均分 3.54,图文相关性平均分 4.22。
      • Midjourney-v5:整体满意度平均分 3.32,画面质量平均分 3.68,图文相关性平均分 4.02。
      • Playground-v2.5:整体满意度平均分 3.37,画面质量平均分 3.73,图文相关性平均分 4.04。
      • Midjourney-v6:整体满意度平均分 3.58,画面质量平均分 3.92,图文相关性平均分 4.18。
      • Kolors:整体满意度平均分 3.59,画面质量平均分 3.99,图文相关性平均分 4.17。所有模型结果取自 2024.04 的产品版本。
Content generated by AI large model, please carefully verify (powered by aily)

References

模型能力简介

Kolors可以说是最近开源的文生图模型中最给力的一个了。从技术报告来看,改进也是很全面的,更强的中文文本编码器、机造的高质量文本描述、人标的高质量图片、强大的中文渲染能力,以及巧妙的noise schedule解决高分辨率图加噪不彻底的问题。可以说是目前主流的文生图训练技巧都用上了,实测效果也确实很不错。在看到Kling视频生成的强大表现,不得不让人赞叹快手的技术实力。

2024 年历史更新(归档)

《[探讨大模型未来:从Scaling Law到数据红利再到终极Token工厂](https://mp.weixin.qq.com/s/aoyqyAgOIfd3TW5QCewONw)》作者祝威廉,文章探讨了大模型的未来,包括规模化法则(Scaling Law)、数据红利和Token工厂概念。指出大模型发展受限于算力成本,数据红利尚未充分利用,最终目标是构建高效的Token生产体系。《[【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)](https://waytoagi.feishu.cn/wiki/JKORwNJdfiB0J7kI9PucCoWcn3d)》《[智变时代/全面理解机器智能与生成式AI加速的新工业革命](https://mp.weixin.qq.com/s/vQVXlfqbn8lDW9P6uLmppw)》Indigo的雄文,时隔一年半,他用这篇《智变时代》来温故下AI领域波澜壮阔的一年,尝试抓住生成式AI变革的本质,带大家拨开喧嚣与迷雾,追寻科技巨头与AI机构们在更高智能道路上的探索,以及变革会如何全面改变人机交互、世界的产业、经济还有我们自己……《[文生图大模型基准测评首期榜单公布,DALL-E 3取得最高76.94分](https://mp.weixin.qq.com/s/XWaNljbcs-1qd-nkqUJayg)》SuperCLUE-Image测评基准首次公布,DALL-E 3以76.94分高居榜首,显示其在图像生成质量、多样性和文本一致性方面的卓越表现。百度文心一格和vivo的BlueLM-Art位列国内前列,但与国际领先模型仍有差距。

延伸阅读

为了全面比较Kolors与其他模型的生成能力,我们构建了包含人工评估、机器评估的全面评测内容。在相关基准评测中,Kolors具有非常有竞争力的表现,达到业界领先水平。我们构建了一个包含14种垂类,12个挑战项,总数量为一千多个prompt的文生图评估集KolorsPrompts。在KolorsPrompts上,我们收集了Kolors与市面上常见的SOTA级别的开源/闭源系统的文生图结果,并进行了人工评测和机器评测。[heading3]人工评测[content]我们邀请了50个具有图像领域知识的专业评估人员对不同模型的生成结果进行对比评估,为生成图像打分,衡量维度为:画面质量、图文相关性、整体满意度三个方面。Kolors在整体满意度方面处于最优水平,其中画面质量显著领先其他模型。|模型|整体满意度平均分|画面质量平均分|图文相关性平均分||-|-|-|-||Adobe-Firefly|3.03|3.46|3.84||Stable Diffusion 3|3.26|3.5|4.2||DALL-E 3|3.32|3.54|4.22||Midjourney-v5|3.32|3.68|4.02||Playground-v2.5|3.37|3.73|4.04||Midjourney-v6|3.58|3.92|4.18||Kolors|3.59|3.99|4.17|所有模型结果取自2024.04的产品版本

Others are asking
推荐文生图的工具,我需要生成一个logo
以下为您推荐一些文生图的工具及相关操作流程: Tusiart 1. 定主题:明确您需要生成的图片的主题、风格和要表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. ControlNet:可用于控制图片中特定的图像,如人物姿态、生成特定文字、艺术化二维码等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:选择 840000 即可。 7. Prompt 提示词:用英文写想要 AI 生成的内容,使用单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 8. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,同样用单词和短语组合,用英文半角逗号隔开,不用管语法。 9. 采样算法:一般选择 DPM++2M Karras,也可参考模型作者推荐的采样器。 10. 采样次数:选择 DPM++2M Karras 时,采样次数在 30 40 之间。 11. 尺寸:根据个人喜好和需求选择。 SD(Stable Diffusion) 1. 制作思路 将中文字做成白底黑字,存成图片样式。 使用文生图的方式,使用大模型真实系,如 realisticVisionV20_v20.safetensorsControlNet 预设置。 输入关键词,如奶油的英文单词“Cream+Cake”(加强质感),反关键词“Easynegative”(负能量),反复刷机,得到满意的效果。 同理可输出 C4D 模型,可自由贴图材质效果,如 3d,blender,oc rendering。 如果希望有景深效果,也可以打开 depth(增加阴影和质感)。 打开高清修复,分辨率联系 1024 以上,步数:29 60。 Liblibai 1. 定主题:明确生成图片的主题、风格和信息。 2. 选择 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,控制图片效果和质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设成 2。 6. Prompt 提示词:用英文写想要 AI 生成的内容,单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 7. 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开,不用管语法。 8. 采样方法:一般选择 DPM++2M Karras,参考模型作者推荐的采样器更有保障。 9. 迭代步数:选择 DPM++2M Karras 时,迭代步数在 30 40 之间。 10. 尺寸:根据个人喜好和需求选择。 11. 生成批次:默认 1 批。 希望这些信息对您有所帮助,祝您生成满意的 logo!
2025-02-20
免费好用的文生视频软件 做小说漫画推文
以下是一些免费好用的文生视频软件,可用于将小说做成漫画推文视频: 1. Stable Diffusion(SD):这是一种 AI 图像生成模型,能够基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个适用于创建小说中场景和角色图像的 AI 图像生成工具。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 将小说转换成 AI 视频通常包括文本分析、角色与场景生成、视频编辑与合成等多个步骤。您可以根据具体需求选择合适的工具来完成您的小说漫画推文视频制作。
2025-02-20
免费的文生视频软件 做小说推文
以下是一些免费的可用于将小说做成视频的文生视频软件及相关网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 将小说转换成 AI 视频通常包括文本分析、角色与场景生成、视频编辑与合成等多个步骤。您可以根据自己的需求选择合适的工具来进行操作。
2025-02-20
有免费的文生图,而且效果很好的ai软件
以下为一些免费且效果较好的文生图 AI 软件及相关简易上手教程: Liblibai: 1. 定主题:明确生成图片的主题、风格和要表达的信息。 2. 选择 Checkpoint:根据主题选择贴近的,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora 以控制图片效果和质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设成 2。 6. Prompt 提示词:用英文写需求,单词和短语组合,用英文半角逗号隔开。 7. 负向提示词 Negative Prompt:同样用英文单词和短语组合。 8. 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 9. 迭代步数:选 DPM++2M Karras 时,在 30 40 之间。 10. 尺寸:根据个人喜好和需求选择。 Dreamina 即梦: 1. 定主题:确定生成图片的主题、风格和信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的,如麦橘、墨幽的系列模型。 3. 选择 lora:参考广场上好看的帖子选择合适的 lora。 Tusiart: 1. 定主题:明确生成图片的主题、风格和信息。 2. 选择基础模型 Checkpoint:选择贴近主题的,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找重叠内容的 lora 控制图片效果和质量。 4. ControlNet:可控制图片中特定图像,如人物姿态、特定文字、艺术化二维码等。 5. 局部重绘:后续学习。 6. 设置 VAE:选择 840000 。 7. Prompt 提示词:用英文写需求,单词和短语组合,用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文单词和短语组合。 9. 采样算法:一般选 DPM++2M Karras,参考模型作者推荐的采样器更稳妥。 10. 采样次数:选 DPM++2M Karras 时,在 30 40 之间。 11. 尺寸:按需选择。 此外,还有一些其他的文生图工具,如: Runway:网址 https://runwayml.com/ ,有网页和 app ,方便使用。 Pika:网址 https://pika.art/ 、https://discord.gg/pika ,已收费。 PixVerse:网址 https://pixverse.ai/ ,人少不怎么排队,还有换脸功能。 GigaStudio:网址 https://studio.gigaai.cc/ ,10 个免费极光,创作者可申请免费会员,文生视频效果好。 Heygen:网址 https://www.heygen.com/ ,最近不好注册使用。 Krea:网址 https://www.krea.ai/ ,12 月 13 日免费公测。 Kaiber:网址 https://kaiber.ai/ 。 Moonvalley:网址 https://moonvalley.ai/ 。 Mootion:网址 https://discord.gg/AapmuVJqxx ,3d 人物动作转视频。 美图旗下:网址 https://www.miraclevision.com/ 。 Neverends:网址 https://neverends.life/create ,2 次免费体验,操作傻瓜。 SD:Animatediff SVD deforum 。 Morph Studio:网址 https://app.morphstudio.com/ ,还在内测。 七火山:网址 https://etna.7volcanoes.com/?ref=pidoutv.com 。
2025-02-19
文生图什么ai软件好
以下是一些较好的文生图 AI 软件: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因其高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 此外,还有以下文生视频的 AI 产品: 1. Pika:出色的文本生成视频 AI 工具,擅长动画制作,支持视频编辑。 2. SVD:若熟悉 Stable Diffusion,可安装此最新插件,在图片基础上直接生成视频,由 Stability AI 开源。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 4. Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多的文生图和文生视频工具及相关信息,您可以查看以下网站: 1. https://www.waytoagi.com/category/104 2. https://www.waytoagi.com/category/38 以上工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。内容由 AI 大模型生成,请仔细甄别。
2025-02-19
有哪些免费的文生图中文软件
以下是一些免费的文生图中文软件: 1. 豆包 App 支持文生图中文文字生成。 2. Stability AI 推出的基于 Discord 的媒体生成和编辑工具可用于文生图,您可以通过以下步骤使用: 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 进入 ARTISAN 频道,任意选择一个频道。 输入/dream 会提示您没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。输入/dream 提示词,这部分和 MJ 类似,可选参数有五类,包括提示词(必填项)、负面提示词(选填项)、种子值(选填项)、长宽比(选填项)、模型选择(选填项)、张数(选填项)。完成后选择其中一张。 3. 您还可以参考以下教程: SD 做中文文字生成的教程: 找到一款喜欢的字体,写上主题例如“端午”。 打开 SD,选择文生图,输入关键词咒语。 打开 Controlnet,启用 lineart 和 canny 固定字体,如果希望有景深效果,也可以打开 depth(增加阴影和质感)。 打开高清修复,分辨率联系 1024 以上,步数:29 60 。 直接生成。这里可以举一反三,选择一些水果模型,珠宝模型,毛毡等等快来试一试吧,附免费参数。
2025-02-16
给文生图ai模型打分的权威标准是什么
给文生图 AI 模型打分的权威标准通常包括以下方面: 1. 图像生成质量:如清晰度、细节丰富程度、色彩准确性等。 2. 多样性:生成图像的风格、主题和表现形式的丰富程度。 3. 文本一致性:生成的图像与输入的文本描述的匹配程度。 在具体的测评中,会构建包含人工评估和机器评估的全面评测内容。人工评测方面,会邀请具有图像领域知识的专业评估人员,从画面质量、图文相关性、整体满意度等维度为生成图像打分。例如,在对 Kolors 与其他模型的比较中,就从这些维度进行了评估。 此外,像 SuperCLUEImage 测评基准首次公布的结果中,DALLE 3 以 76.94 分高居榜首,显示其在图像生成质量、多样性和文本一致性方面的卓越表现。百度文心一格和 vivo 的 BlueLMArt 位列国内前列,但与国际领先模型仍有差距。
2025-01-07
怎么制定模型打分标准
制定模型打分标准可以从以下方面考虑: 1. 对于通用人工智能模型: 模型的参数数量。 数据集的质量或大小,例如通过词元来衡量。 训练模型所用的计算量,以浮点运算数衡量,或由其他变量组合表示,如估计的训练成本、估计的训练所需时间或估计的训练能耗。 模型的输入和输出模式,如文本到文本(大型语言模型)、文本到图像和多模态,以及确定每种模式的高影响能力的先进水平阈值,以及输入和输出的具体类型(如生物序列)。 模型能力的基准和评估,包括考虑无需额外训练的适配任务数量、学习新的独特任务的可适应性、其自主程度和可扩展性、可使用的工具。 由于其覆盖范围,而对内部市场的影响很大,如已提供给至少 10000 个设立在联盟之内的注册商业用户,则应加以推定。 注册的终端部署者数量。 与使用通用人工智能模型有关的相关软件版本,如适用。 结构和参数数量。 输入和输出的模态(如文本、图像)和格式。 模型许可。 模型要件及其开发过程的说明,包括将通用人工智能模型纳入人工智能系统所需的技术手段(如使用说明、基础设施、工具)。 2. 对比不同大型语言模型的性能: 理解能力:评估模型对语言的理解程度,包括对语法、语义、上下文和隐含意义的理解。 生成质量:检查模型生成的文本的质量,包括文本的流畅性、相关性和准确性。 知识广度和深度:评估模型对广泛主题的知识掌握程度,以及它对特定领域或话题的理解深度。 泛化能力:测试模型在处理未见过的任务或数据时的表现,这反映了模型的泛化能力。 鲁棒性:检查模型对错误输入、对抗性输入或模糊不清的指令的应对能力。 偏见和伦理:评估模型生成文本时是否存在偏见,以及模型是否遵循伦理标准。 交互性和适应性:评估模型在交互环境中的表现,包括对用户反馈的适应性和持续对话的能力。 计算效率和资源消耗:考虑模型的大小、训练和运行所需的计算资源。 易用性和集成性:评估模型是否易于集成到不同的应用和服务中,以及提供的 API 和工具的易用性。 为了进行有效的比较,可以采用以下方法:标准基准测试,使用标准的语言模型评估基准,如 GLUE、SuperGLUE、SQuAD 等,这些基准提供了统一的测试环境和评分标准。
2024-09-02
模型打分
评估模型输出通常需要一个“黄金标准”的答案。假设我们清楚某个问题的正确答案应包含哪些事实(得分点),就可以使用模型查询和计算的方法总结这些得分点来为模型输出质量打分。这是监督学习的一部分,能让模型在人类指导下改善性能。评估过程通常由另一个模型执行,以降低人力成本。 例如,杨志磊对各模型的答辩状 prompt 进行了评测,按照满分 10 分的标准,各模型得分如下:ChatGPT 为 6 分,Bard 为 5.5 分,Kimi chat 为 6.5 分,智谱清言为 5 分,讯飞星火为 5 分,文心一言 3.5 为 4 分,通义千问为 6.5 分,腾讯混元为 5 分,百川大模型为 7 分,豆包 AI 为 5 分,Copilot 为 9 分,Claude 2.0 为 6 分。 斯坦福发布的大模型排行榜 AlpacaEval 相比其他 LLM 自动评测器,如 alpaca_farm_greedy_gpt4、aviary_gpt4、lmsys_gpt4 及人类评估,有其特别之处。在 AlpacaEval set 上,通过与 2.5K 条人工标注结果对比,其采用的 GPT4 评测方式取得了最高的人类一致性、较低的误差,且只需约 1/22 的人类标注成本。另外,团队还从统计角度研究了什么评估数据能最好地区分模型,并发现 SelfInstruct 数据集产生的统计能力最小,可从评估集中删除。AlpacaEval 支持两种模式的模型评估方式。
2024-09-02
2024 AI工具排行榜
以下是 2024 年部分 AI 工具的相关信息: 开发者工具: 23 年 12 月至 24 年 3 月的访问量排行榜中,非大厂的 Top1 公司是 Langchain,其 3 月 PV 为 356 万,单 PV 价值为 56.18 美元。 赛道方面,天花板潜力 TAM 为 120 亿美元,总体趋势平稳增长,月平均增速为 82 万 PV/月,原生产品占比高。 竞争方面,Top1 占 19%,Top3 占 54%,马太效应弱,网络效应强,大厂已入局,技术门槛中。 教育工具: 23 年 12 月至 24 年 3 月的访问量排行榜中,非大厂的 Top1 公司是 Quizlet,其 3 月 PV 为 1.3 亿。 赛道方面,天花板潜力 TAM 约为 30 亿,总体趋势快速增长,月平均增速为 1793 万 PV/月,原生产品占比低。 竞争方面,Top1 占 45%,Top3 占 76%,马太效应弱,网络效应弱,大厂未入局,技术门槛中。 此外,在展望 2025 时,AI 行业的创新机会方面,2024 年 9 月 OpenAI 发布了新一代语言模型 o1,业界推测其采用了全新的训练与推理方案,结合强化学习技术,显著增强了推理能力,可能借鉴了下围棋的 AlphaGo Zero 的技术思路。
2025-01-26
中国的国产ai排行榜
以下是关于中国国产 AI 排行榜的相关信息: 根据《2024 年度 AI 十大趋势报告》,在 APP 端,截至 2024 年 10 月,共 56 款产品的历史下载量超百万,8 款产品历史下载量超千万,夸克和豆包的历史总下载量已过亿。从单月新增来看,夸克、豆包和 Kimi 智能助手月增长可达到千万级,10 款产品可达百万级;DAU 方面,夸克 DAU 超过 2600 万,豆包、Kimi、天天跳绳和文小言 DAU 超百万;用户粘性方面,夸克和叨叨三日留存率超过 30%。 在 Web 端,AI 智能助手赛道外的所有赛道都基本处于停滞状态,用户规模方面,月总访问量超千万的共 7 款产品,包括夸克、腾讯文档、百度文库、Kimi 智能助手、文心一言、豆包和通义。在用户活跃度上,共 3 款产品——夸克、Notion 和百度文库的 MAU 超过千万,19 款产品 MAU 超过百万。仅有 14 款产品人均每月访问超过 5 次,13 款产品平均访问时长超过 10 分钟。 9 月的 AI 智库月度榜单中,部分产品如美趣 AI、说得相机提词器、AI 智能写作、创客贴 AI、360AI 搜索、图趣 AI、Molica AI、文案宝等在列,同时还有开拍、妙笔工坊、TalkAI 练口语、美图设计室、秘塔 AI 搜索、X Eva、快问 AI、我在 AI 等产品。
2024-12-29
目前ai工具排行榜
以下是一些目前常见的 AI 工具排行榜: 1. 创作方面: AI 研究工具:Claude、ChatGPT、Bing Chat、Perplexity 图片处理:DallE、Leonardo、BlueWillow、Midjourney 版权写作:Rytr、Copy AI、Wordtune、Writesonic 设计:Canva、Clipdrop、Designify、Microsoft Designer 网站搭建:10Web、Framer、Hostinger、Landingsite 视频处理:Klap、Opus、Invideo、Heygen 音频处理:Murf、LovoAI、Resemble、Eleven Labs SEO 优化:Alli AI、BlogSEO、Seona AI、Clearscope Logo 设计:Looka、LogoAI、Brandmark、Logomaster 聊天机器人:Droxy、Chatbase、Voiceflow、Chatsimple 自动化工具:Make、Zapier、Bardeen、Postman 市场营销 2. 访问量较大的工具: ChatGPT 以 140 亿次访问量领先,占分析流量的 60%以上。 Character AI 排名第二,访问量达到 38 亿次。 QuillBot 访问量达到 11 亿次。 过去一年,人工智能行业平均每月访问量为 20 亿次,过去 6 个月激增至 33 亿次。 分析的 50 个人工智能工具经历了 10.7 倍的增长率,平均每月访问量增加 2.363 亿次。 ChatGPT、Character AI 和 Google Bard 的净流量分别增长了 18 亿次、4.634 亿次和 6800 万次访问量。 Craiyon、MidJourney 和 Quillbot 在此期间面临最大的流量下降。 美国贡献了 55 亿人次访问量,占总访问量的 22.62%,而欧洲国家合计贡献了 39 亿人次访问量。 AI 聊天机器人工具最受欢迎,访问量达到 191 亿次。 超过 63%的 AI 工具用户通过移动设备访问。 性别数据揭示了一种差异:69.5%是男性用户,而 30.5%是女性用户。
2024-12-19
目前中国内地AI智能聊天应用排行榜
以下是中国内地部分 AI 智能聊天应用的排行榜信息: 移动应用榜单: ChatGPT 在移动领域占据榜首,月活跃用户数大约是排名紧随其后第二名微软 Edge 和第三名 Photomath 的 2.5 倍。 移动应用前五强还包括微软基于 AI 技术全新打造的搜索引擎 Bing,以及照片美化和虚拟形象制作工具 Remini。 有五家 AI 公司实现“双线作战”,其网页端、移动端应用双双跻身前 50 强榜单,包括 ChatGPT、Character.AI、chatbot 平台 Poe,以及图片编辑应用 Photoroom、Pixelcut。 国内月活榜(11 月): 绘影字幕:视频编辑,网址 huiyingzimu.com,活跃用户 9 万人,环比变化 0.2476,所属公司蓝色脉动。 360 智脑 Chat:原生聊天机器人,网址 chat.360.com,活跃用户 9 万人,环比变化 5.5675,所属公司 360。 阿里通义听悟:原生效率工具,网址 tingwu.aliyun.com,活跃用户 9 万人,环比变化 0.0561,所属公司阿里巴巴。 Reecho 睿声:原生文本转声音,网址 reecho.cn,活跃用户 9 万人。 GitMind 思乎:功能思维导图,网址 gitmind.cn,活跃用户 8 万人,环比变化 0.1791,所属公司网旭科技。 AI 改图神器:功能图片生成,网址 img.logosc.cn,活跃用户 8 万人,环比变化 0.011,所属公司个人开发者。 百川智能:原生聊天机器人,网址 baichuanai.com,活跃用户 8 万人,环比变化 0.1059。 钉钉宜搭:功能智能体,网址 aliwork.com,活跃用户 8 万人,环比变化 0.2724,所属公司阿里巴巴。 360 智图:功能图片编辑,网址 pic.360.com,活跃用户 8 万人,环比变化 0.434。 给小白的聊天对话类 AI 产品推荐: Kimi:具有超长上下文能力,最初支持 20 万字上下文,现已提升到 200 万字,适合处理长文本或大量信息任务,但文字生成和语义理解、文字生成质量方面可能不如国内其他产品,且不支持用户自定义智能体。 智谱清言:背后技术源自清华大学研发团队的科研成果转化,模型质量出色,以 ChatGPT 为对标打造用户体验,是国内首批开放智能体应用的 AI 公司之一,在逻辑推理和处理复杂提示词方面表现优势。
2024-12-13
国内AI排行榜
以下是 9 月国内的部分 AI 产品排行榜: |排名|产品|特性|分类|应用名称|下载量(万)|环比变化|所属公司| ||||||||| |A75+1|异世界回响|原生|情感陪伴|异世界回响AI 虚拟好友聊天对话|<10|0.2302|Soul| |A76+1|沉浸式翻译|功能|翻译|沉浸式翻译 Safari 扩展|<10|0.0994|书同文网络| |A77+1|美趣 AI|原生|图片生成|美趣 AIAI 绘画&视频&写作生成神器|<10|0.2002|兴利和| |A78+1|说得相机提词器|功能|写作软件|说得相机提词器文案生成&口播短视频美颜拍摄|<10|0.8782| | |A79+1|AI 智能写作|原生|写作软件|AI 智能写作|<10|0.0453|汉酷网络| |A80+1|创客贴 AI|功能|平面设计|创客贴设计海报、宣传广告图片制作软件|<10|0.2632|艺源酷科技| |A81+1|360AI 搜索|功能|智慧搜索|360AI 搜索生成式 AI 答案引擎|<10|0.1017|360| |A82+1|图趣 AI|原生|图片生成|图趣AI 绘画图生图软件|<10|0.4896| | |A83+1|Molica AI|原生|图片生成|Molica AI|<10|0.1007| | |A48+1|秘塔 AI 搜索|原生|智慧搜索|秘塔 AI 搜索|10|0.3259|秘塔网络| |A49+1|X Eva|原生|情感陪伴|X EvaAI 克隆人|<10|0.5208|小冰公司| |A50+1|快问 AI|原生|教育|快问 AI学习有问题快问 AI|<10|0.6738|作业帮| |A51+1|我在 AI|原生|情感陪伴|我在 AI|<10|0.0279|有零科技| |A52+1|玖安全能 AI 助手|原生|个人助理|玖安全能 AI 助手 app 官方版|<10|0.0715|玖安网络| |A53+1|WOW|原生|情感陪伴|Wow有趣又懂你的 AI 社区|<10|0.5911|美团| |A54+1|幕布|原生|思维导图|幕布大纲笔记&思维导图|<10|0.7643|字节跳动| |A55+1|Muse AI|原生|音乐生成|Muse AIAI 音乐创作|<10|0.2367|特赞| |A56+1|Glow|原生|聊天机器人|Glow|<10|0.2374|MiniMax| |A84+1|文案宝|原生|个人助理|文案宝AI Bot 智能 nearing 生成器&一键 AI 识图|<10|0.0946| | |A85+1|独响|原生|情感陪伴|独响你的 AI 朋友圈|<10|0.6229|毛线球科技| |A86+1|Cos Love|原生|情感陪伴|Cos Love 虚拟情感聊天|<10|0.7398|探途网络| |A87+1|毒霸姬|原生|个人助理|毒霸姬您的专属 AI 助手|<10|0.4755|海鸟科技| |A88+1|名人朋友圈|原生|情感陪伴|名人朋友圈|<10|0.5807|华中时讯| |A89+1|AI Genie|原生|情感陪伴|AI Genie虚拟社交元宇宙|<10|0.0097|卡瓦科技| |A90+1|AI 人工智能助手|原生|个人助理|AI 人工智能助手|<10|0.0023| | |A91+1|万能 AI 盒子|原生|个人助理|万能 AI 盒子AI 人工智能创作助理|<10|0.0157|杰爱歪| |A92+1|虚拟恋人 AI|原生|情感陪伴|虚拟恋人 AI|<10|0.5661| |
2024-10-30
国产AI排行榜
以下是国产 AI 的月度排行榜: |排名|产品|特性|分类|应用名称|下载量(万)|环比变化|所属公司| ||||||||| |A87+1|Molica AI|原生|图片生成|Molica AI|<10|0.3888| | |A88+1|创客贴AI|功能|平面设计|创客贴设计海报、宣传广告图片制作软件|<10|0.3037|艺源酷科技| |A89+1|脸猫|原生|图片生成|脸猫AI绘画,AI写真,智能换装特效视频一键制作|<10|0.6221| | |A90+1|AiU|原生|小说生成|AiUAI互动小说&虚拟恋人陪伴|<10|0.3845|聆心智能| |A91+1|AI Genie|原生|情感陪伴|AI Genie虚拟社交元宇宙|<10|0.1167|卡瓦科技| |A92+1|Chat Bot|原生|聊天机器人|ChatBot:AI4.0 人工智能绘画写小说 sora 视频|<10|0.131| | |A93+1|图趣 AI|原生|图片生成|图趣AI 绘画图生图软件|<10|0.6398| | |A38+1|秘塔写作猫|原生|写作软件|秘塔写作猫|14|0.3975|秘塔网络| |A39+1|冒泡鸭|原生|情感陪伴|冒泡鸭在 AI 开放世界探索角色故事|14|0.2724|阶跃星辰| |A40+1|秘塔 AI 搜索|原生|智慧搜索|秘塔 AI 搜索|14|0.0981|秘塔网络| |A41+1|开拍|功能|视频生成|开拍提词器·口播神器·高清画质|14|1.7319|美图公司| |A42+1|TalkAI 练口语|原生|教育|TalkAI 练口语AI 视频、对话背单词|13|0.4406|惊叹科技| |A43+1|造梦次元|原生|情感陪伴|造梦次元|13|0.4417|想法流科技| |A44+1|美图设计室|功能|图片生成|美图设计室电商人必备的 AI 设计工具|12|1.4848|美图公司| |A74+1|无界 AI|原生|图片生成|无界 AI二次元 AI 生成艺术 创作无限以致涌现 AI 绘画工具|<10|0.464|杭州超节点| |A75+1|美趣 AI|原生|图片生成|美趣 AIAI 绘画&视频&写作生成神器|<10|0.3573|兴利和| |A76+1|万卷|原生|个人助理|万卷你的智能助理|<10|0.6724|MiniMax| |A77+1|虚拟恋人 AI|原生|情感陪伴|虚拟恋人 AI|<10|0.3173| | |A78+1|MJ 中文极速版|原生|图片生成|MJ 中文极速版全能 AI 绘画创作工具|<10|0.1119| | |A79+1|AI 写作鱼|原生|写作软件|AI 写作鱼智能写作&伪原创改写|<10| | | |A80+1|AI 智能写作|原生|写作软件|AI 智能写作|<10|0.6026|汉酷网络|
2024-09-24
生成3d模型可以让模型动起来吗?
生成 3D 模型后是可以让模型动起来的。例如,通过以下工具和流程可以实现: 工具链:Midjourney(生成等距图像)→Trellis(图像转 3D 模型)→Browser Lab(浏览器内 3D 编辑器)。 步骤: 使用 Midjourney 生成等距 3D 场景,提示词示例:3D isometric bedroom with a bed and desk。(DALLE 3 也可测试) 用 Trellis 工具将图像转为 3D 模型(支持 Tripo 3D 等其他工具)。工具地址: 下载生成的 3D 模型(GLB 文件或高斯分布文件),然后导入 Browser Lab 编辑器中进一步编辑。编辑器地址: 结合可灵 AI、Hailuo AI、Runway 等工具可让场景中的人物动起来。 对于文物雕塑上色,可使用 runway 让固有想法的物体变得动态,runway gen3 的 V2V 可以让物体重新建模、重新上色,再把背景上个色,传到剪映,加上 BGM。 先上传图片,运用提示词,只要让物体动起来就行,一次可能不成功,可以多次抽卡(分够的话)。 生成好的视频的左下方,点击“Reuse”,再点击上方出现的“Video to Video”,视频就会跳转到我们的工作台。 再在下方输入提示词“3D modeling with vibrant colors”等待生成。 再重复上面一个步骤,把提示词换成“Changing the background to the universe,the body emits light”。 最后导入剪映,按照自己喜欢的风格,剪成一个小短片。 另外,可以用即梦 S2.0(或其他可以动效的工具)出动态视频,在剪映提前转成 9:16 或 16:9 的大小,否则 runway 会裁剪尺寸。
2025-02-20
你用的是什么ai模型
以下是关于所使用的 AI 模型的相关信息: 我使用的是 GPT4,其他模型的效果不太好。如果您使用 GPT4 总结的内容质量不行,可以点击“重试”按钮让其重新总结。 默认情况下,Cursor Chat 将 OpenAI 的 GPT4(具体为 GPT4Turbo 实例)用于其 AI 模型,您可以通过选择喜欢的 AI 模型,且为 Chat 选择的模型会保存供未来使用。 有实例中使用的是阿里千问模型。
2025-02-20
你是基于什么模型?
我调用的是抖音集团的云雀大模型。 Gemini 模型是基于 Transformer 解码器构建的,对模型结构进行了优化,主要为大规模稳定训练及在 Google 的 TPU 上推理优化。它能适应与各种音频和视觉输入交织的文本输入,并生成文本和图像输出,经过训练支持 32k 的上下文长度,采用高效的注意机制。 麦橘超然 MajicFlus 是一款基于 flux.dev 微调融合的模型,专注于高质量人像生成,尤其擅长亚洲女性,有卓越人像生成能力、广泛适用性、简单易用等特点。多位社区成员基于模型制作的 LoRA 一同发布,扩展了功能与表现力,但它对社区大部分的 lora 不完美兼容,需降低权重至 0.5 以下。
2025-02-20
模型微调是怎么实现的
模型微调是一种迁移学习技术,常用于深度学习中。其基本思路是先有一个在大量数据上预训练的模型,已学会一些基本模式和结构,然后在特定任务数据上继续训练以适应新任务。 以下是关于模型微调的具体实现步骤: 1. 准备和上传训练数据。 2. 训练新的微调模型: LoRA 微调: 脚本见:。 具体实现代码见。 单机多卡的微调可通过修改脚本中的include localhost:0 来实现。 全量参数微调: 脚本见:。 具体实现代码见。 3. 加载微调模型: LoRA 微调:基于 LoRA 微调的模型参数见基于 Llama2 的中文微调模型,LoRA 参数需和基础模型参数结合使用。通过加载预训练模型参数和微调模型参数。 全量参数微调:调用方式同模型调用代码示例,只需修改其中的模型名称或保存路径。 微调的优点包括: 1. 比即时设计更高质量的结果。 2. 能够训练比提示中更多的例子。 3. 由于更短的提示而节省了 Token。 4. 更低的延迟请求。 微调目前仅适用于以下基础模型:davinci、curie、babbage 和 ada。 以下是两个帮助理解微调概念的例子: 1. 情感分类:先使用大量语料库预训练模型,使其学会基本语法和单词语义,再收集标注过的电影评论(积极或消极)继续训练模型,使其学会判断评论情感。 2. 图像分类:先使用大量图片(如 ImageNet 数据集)预训练模型,使其学会识别图片中的基本形状和纹理,再收集标注过的猫和狗的图片继续训练模型,使其学会区分猫和狗。
2025-02-19
汇总一下现在的大语言模型都有哪些,国外和国内的模型分别列出来
以下是国内外的大语言模型汇总: 国外大语言模型: GPT4(OpenAI):目前最先进的自然语言生成模型,可用于回答问题、撰写文章等。 Gemini Ultra(Google):多模态人工智能模型,采用神经网络架构,对标 GPT4,可用于回答问题、生成代码、处理文本等。 Claude 3 Opus(Anthropic):多模态模型,能处理超过 1 百万 token 的输入,具有实时聊天、数据处理、分析预测等功能;实现了接近完美的召回率。 国内大语言模型: 文心一言(百度):大语言模型,可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。 讯飞星火:目前体验效果较好。 悟道・天鹰(北京智源人工智能研究院):首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。 清华 ChatGLM 。 此外,国内还有通用模型如通用模型如文心一言、讯飞星火等,处理自然语言;还有垂直模型,专注特定领域如小语种交流、临床医学、AI 蛋白质结构预测等。
2025-02-19
0到1使用大语言模型
以下是关于 0 到 1 使用大语言模型的相关内容: Ollama 框架: 1. 支持多种大型语言模型,如通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 2. 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 CPU 和 GPU。 3. 提供模型库,用户可从中下载不同参数和大小的模型,通过 https://ollama.com/library 查找。 4. 支持用户自定义模型,例如修改温度参数调整创造性和连贯性,或设置特定系统消息。 5. 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 6. 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 7. 安装完后,确保 ollama 后台服务已启动(在 mac 上启动 ollama 应用程序,在 linux 上通过 ollama serve 启动),可通过 ollama list 确认。 大模型安全: 1. 通过对齐(指令调优)使语言模型更好理解人类意图并增加安全保障,可拆解为监督微调、获取 reward model 和强化学习调整输出分布两部分。 2. LLAMA2 专门使用安全有监督微调确保语言模型安全。 3. 强化学习通过引入人类反馈数据调整模型输出分布,使模型面对训练分布外数据时能拒绝不当回答。 4. 但 Alignment 并不足以防护所有安全问题,存在越狱(Jailbreak)情况,导致模型对齐失效。 5. 还需关注隐私问题。 大模型架构与特点: 1. 包括 encoderonly、encoderdecoder 和 decoderonly 三种架构,目前熟知的 AI 助手多为 decoderonly 架构。 2. 大模型预训练数据量大,来自互联网,参数多,如 Open 在 2020 年发布的 GPT3 已达 170B 参数。 3. GPT3 可根据任务描述和示例完成任务,ChatGPT 则通过对话完成任务,二者在形式和安全性上有差别。
2025-02-19