直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

目标检测领域最新sota模型

回答

以下是目标检测领域的一些最新模型:

  • YOLOv8 目标检测跟踪模型:快速准确的多对象识别和定位,支持实例分割、人体姿态估计等,多平台兼容,是一站式视觉识别解决方案。详细介绍:https://docs.ultralytics.com/models/ ,GitHub:https://github.com/ultralytics/ultralytics 。
  • OpenAI 在 2024 年 2 月发布的 Sora 模型,是一个文本到视频的生成式 AI 模型,能够根据文本提示生成现实或想象场景的视频,在目标检测方面也有一定的应用和潜力。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

OpenAI联创:RLHF是超级智能的秘密武器

[title]OpenAI联创:RLHF是超级智能的秘密武器[heading1]模型将解锁哪些新能力?Dwarkesh Pa tel:从宏观角度来看,pre-training和post-training的主要任务分别是什么?二者的主要区别是?John Schulman:pre-training阶段主要是让模型学习互联网上的网页、代码等等各种内容,并且让模型做到能模仿这些内容,模型在预训练后已经能生成很仿真的网页。同时这个模型还需要做最大化对数概率(maximize log probability)的训练,主要是为了让模型能在给定一系列token之后准确地预测下一个token。因为我们的训练目标是最大化这些预测的对数概率,所以这个模型在概率分配上会非常精确。也就是说,它不仅可以生成网络上的各种内容,还能为这些内容赋予相应的概率值。pre-training阶段后的基础模型能够扮演各种角色,生成多种不同类型的内容。进入到post-training阶段之后,我们通常就会针对一个更具体的应用场景进行优化,比如让模型做聊天助手。在这个场景下,模型的目标不再是简单地模仿一个人,而是要能够回答用户的问题或执行用户的指令,提供帮助。我们优化的目标也变成了生成用户会喜欢并且觉得有用的输出,而不仅仅是复制网络上的原始内容。是GPT-4.5和GPT-5比预期的来得慢,之前以为Claude-3发布之后OpenAI就会发新模型了,但现在SOTA模型已经易主一个月了,所以AGI的战线可能会被拉长。第二点是Sora比预期来的要早,这意味着今年大家对多模态的理解和生成的进步幅度都会很大,将会解锁很多新东西,但多模态能不能带来智能和AGI还是一个很强的非共识。第三点就是Elon Musk加入了开源,开源模型能力的水位线会被提升很多,xAI的人才密度很强,GPU也足,这会决定了很多后面模型公司的生死线。

Sora:大型视觉模型的背景、技术、局限性和机遇综述 【官方论文】

[title]Sora:大型视觉模型的背景、技术、局限性和机遇综述【官方论文】[heading1]1引言自从2022年11月ChatGPT发布以来,人工智能技术的出现标志着一个重大的转变,重塑了交互方式,并深入融入日常生活和行业的各个方面[1,2]。基于这一势头,OpenAI在2024年2月发布了Sora,一个文本到视频的生成式AI模型,能够根据文本提示生成现实或想象场景的视频。与之前的视频生成模型相比,Sora的特点是能够在遵循用户文本指令的同时,生成长达1分钟的高质量视频[3]。Sora的进步体现了长期以来人工智能研究任务的实质,即赋予AI系统(或AI代理)理解和与运动中的物理世界互动的能力。这涉及到开发不仅能解释复杂用户指令,而且能将这种理解应用于通过动态和富有上下文的模拟解决现实世界问题的AI模型。图2:Sora在文本到视频生成中的示例。文本指令被给予OpenAI Sora模型,它根据指令生成三个视频。Sora展示了准确解释和执行复杂人类指令的显著能力,如图2所示。该模型能生成包含多个执行特定动作的角色以及复杂背景的详细场景。研究人员将Sora的熟练程度归因于不仅处理用户生成的文本提示,而且还能辨别场景内元素之间复杂的相互作用。Sora最引人注目的方面之一是其生成长达一分钟的视频的能力,同时保持高视觉质量和引人入胜的视觉连贯性。与只能生成短视频片段的早期模型不同,Sora的一分钟长视频创作具有进展感和从第一帧到最后一帧的视觉一致性之旅。此外,Sora的进步在于其生成具有细腻运动和互动描绘的扩展视频序列的能力,克服了早期视频生成模型所特有的短片段和简单视觉呈现的限制。这一能力代表了AI驱动创意工具向前的一大步,允许用户将文本叙述转换为丰富的视觉故事。总的来说,这些进步展示了Sora作为世界模拟器的潜力,为描绘场景的物理和上下文动态提供了细腻的见解。[3]。

XiaoHu.AI日报

[title]XiaoHu.AI日报[heading2]2月21日🔗 https://x.com/xiaohuggg/status/1760191358298710370?s=205⃣️🎯 YOLOv8目标检测跟踪模型:快速准确的多对象识别和定位。支持实例分割、人体姿态估计等。多平台兼容,一站式视觉识别解决方案。🔗详细介绍:https://docs.ultralytics.com/models/🔗 GitHub:https://github.com/ultralytics/ultralytics🔗 https://x.com/xiaohuggg/status/1760149057249636570?s=206⃣️🎥 Sora工作原理解析:结合扩散模型和Transformer架构。采用空间时间补丁和时空立方体。利用知识图谱组合视频,显示巨大潜力。🔗 https://x.com/xiaohuggg/status/1760139842783248609?s=207⃣️🚀 OpenAI技术人员的一天...🔗 https://x.com/xiaohuggg/status/1760130189932265553?s=20

其他人在问
音频质量检测方面SOTA模型有?
Gemini 模型在音频质量检测方面达到了 SOTA 水平。该模型是天生多模态的,在文本、图像、音频和视频上进行联合训练,在广泛的音频基准测试中表现出色。
2024-10-16
开源音频质量检测模型有哪些?
以下为一些开源音频质量检测模型: 此外,还有: VALLEX:一个开源的多语言文本到语音合成与语音克隆模型。它支持多种语言(英语、中文和日语)和零样本语音克隆,具有语音情感控制和口音控制等高级功能。 智谱·AI 自 2019 年成立以来推出并开源的多款模型,具体可参考。但请注意,Token 数代表了模型支持的总 Token 数量,包括了输入+输出的所有 token,且一个 token 约等于 1.8 个汉字。
2024-10-16
请阐述对比学习在图像分类和检测中的应用
在计算机视觉中,对比学习在图像分类和检测中有重要应用。 图像分类方面:图像分类是根据图像中的语义信息对不同类别的图像进行区分。对比学习通过让模型学习区分相似和不同的图像样本,从而更好地捕捉图像中的语义特征,提高分类的准确性。 目标检测方面:目标检测需要找出图像或视频中的目标物体,并检测出其位置和大小。对比学习可以帮助模型学习到更具判别性的特征表示,从而更准确地定位和识别目标物体。在多类别目标检测中,对比学习有助于区分不同类别的物体,提高检测的精度和效率。 总之,对比学习为图像分类和检测任务提供了有效的特征学习方法,有助于提升计算机视觉系统的性能。
2024-10-15
我计划检测一张图片中的玉米。我使用python怎么实现这个目的。
要使用 Python 检测一张图片中的玉米,您可以考虑使用一些图像处理和机器学习的库,比如 OpenCV 和 TensorFlow 等。 使用 OpenCV 可以进行图像的读取、预处理和特征提取。首先读取图片,然后可能需要进行一些图像增强、滤波等操作来改善图像质量,以便后续的检测。 如果使用 TensorFlow 等深度学习框架,可以构建一个卷积神经网络(CNN)模型来进行玉米的检测。您需要准备包含玉米和非玉米的大量图片数据集,并对数据进行标注,然后训练模型。 但具体的实现会比较复杂,需要您具备一定的图像处理和机器学习知识。
2024-09-18
请介绍聚类分析、异常检测算法
聚类分析是一种将数据集中相似的数据点分组在一起的方法。当数据集中的簇不是明显的球形或高斯分布时,KNN 算法也可用于聚类任务。 异常检测算法用于识别数据集中偏离常态的异常数据点。KNN 算法由于可以识别与大多数邻居不同的点,常用于异常检测。此外,大语言模型(LLM)在识别模式和趋势方面表现出色,也适用于异常检测任务,能够基于一个或多个列值来识别异常数据点。
2024-08-23
基于边缘检测的分割
基于边缘检测的分割,以下是相关信息: 在 Controlnet 中,可用的预处理/模型包括: canny:用于识别输入图像的边缘信息。 depth:用于识别输入图像的深度信息。 hed:用于识别输入图像的边缘信息,但边缘更柔和。 mlsd:用于识别输入图像的边缘信息,是一种轻量级的边缘检测,对横平竖直的线条非常敏感,更适用于室内图的生成。 normal:用于识别输入图像的法线信息。 openpose:用于识别输入图像的动作信息,OpenPose Editor 插件可以自行修改姿势,导出到文生图或图生图。 scribble:将输入图像作为线稿识别,如果线稿是白色背景,务必勾选“Invert Input Color”。 fake_scribble:识别输入图像的线稿,然后再将它作为线稿生成图像。 segmentation:识别输入图像各区域分别是什么类型的物品,再用此构图信息生成图像。如果想绘制一张符合 segmentation 规范的图像,可以使用以下色表绘制: 在 ComyfUI 蒙版中,关于 Segment Anything 语言分割转蒙版,SAM 和 GDino 有以下区别: SAM: 主要用途:图像分割,即识别和分割图像中的各种对象。 技术特点:支持通过各种输入提示(如点击、框选或文本)来快速生成分割掩码,适用于多种图像分割任务。 应用场景:从简单的对象边缘检测到复杂的场景分析,SAM 都能提供支持。 GDino: 主要用途:零样本物体检测,能够识别训练数据中未明确出现的对象类别。 技术特点:结合了自然语言处理,能够根据文本提示识别和定位图像中的特定对象。 应用场景:除了标准的物体检测任务,还能进行复杂的引用表达理解(REC),即根据给定的文本描述定位图像中的对象。 这两个模型在功能和应用上互补:SAM 更侧重于图像的像素级处理和分割,适用于需要精确图像分割的应用;GroundingDino 则侧重于通过文本描述理解和识别图像内容,适用于需要语言交互的对象检测场景。
2024-08-15
我的app应用想要对接大语言模型,结合APP用户自身的数据,实现更精准的对话,是否有行业比较成功的案例可以借鉴
以下是一些在 APP 应用对接大语言模型方面比较成功的案例,可供您借鉴: 1. Poe: 由 Quora 开发,有 APP 版本,支持跨端使用。 集成了 Chat GPT、GPT4、Claude+、Claude、Dragonfly 等模型,同时支持用户自建 Chatbot。 不同语言模型回复效果有差异,适合需要调用多种大语言模型的用户。 Dragonfly 擅长给出较短的回答,并擅长在输入中给出示例时遵循指示。 Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时使用。 支持分享用户和模型的对话内容,但 GPT4、Claude+产品需要付费订阅使用。 访问地址: Poe 中的提问引导真的能够启发到用户,midjourney prompt 扩写 Chatbot 能力很惊人。 2. Perplexity.ai: 本质是个可联网的搜索引擎,完全免费,支持网页版、APP(目前支持 iOS,安卓即将推出)、Chrome 插件。 网页版能力全面,能够根据提问从互联网上搜寻信息并给出总结后的答案。 很多 Chat GPT 中调用插件才能解决的事情(联网查询、旅行、住宿、商品推荐)靠 Perplexity 就可以解决。 能给出信息来源网址,并根据搜索内容给出继续对话的问题建议。 最新推出的 Copilot 能力支持根据搜索内容进行信息补充,每 4h 内使用 5 次,调用 GPT4。 支持分享聊天内容到多渠道。 首页推荐当下流行的新闻、搜索内容。 支持筛选 Academic(包含不同领域的学术研究论文)、Wolfram|Alpha(包含数学、科学、经济学、语言学、工程学、社会科学、文化等领域的知识库)、Wikipedia(维基百科)、Youtube、Reddit(娱乐、社交和新闻网站)、News 进行搜索。 Chrome 插件可针对当前页面给出即时摘要。 访问地址:
2024-10-18
大模型合规
大模型的安全问题包括以下方面: 1. 对齐保障:通过对齐(指令调优),如 ChatGPT 从 GPT3 经过对齐而来,使其更好地理解人类意图,增加安全保障,确保不输出有害内容。对齐任务可拆解为监督微调及获取奖励模型和进行强化学习来调整输出分布。例如 LLAMA2 使用安全有监督微调确保安全,强化学习能让模型根据人类反馈更细粒度思考答案的安全性,面对训练分布外数据也能拒绝不当回答。 2. 数据过滤:在预训练阶段对数据进行过滤,如 baichuan2 采用此技术减少有害输出,但因数据关联性,仅靠此方法可能不够,模型仍可能从关联中学到有害内容,且面对不良信息时可能因缺少知识而处理不当。 3. 越狱问题:用户可能通过越狱(Jailbreak)使模型的对齐失效,重新回答各种问题。 大模型的特点包括: 1. 架构:分为 encoderonly、encoderdecoder、decoderonly 三类,目前熟知的 AI 助手多为 decoderonly 架构,由 transformer 衍生而来。 2. 规模:预训练数据量大,来自互联网的多种来源,且参数众多,如 GPT3 已达 170B 的参数。 GPT3 与 ChatGPT 相比,除形式不同外,安全性也有差别。
2024-10-18
大模型安全相关资料
以下是关于大模型安全的相关资料: 大模型的架构:包括 encoderonly、encoderdecoder 和 decoderonly 三种类型。其中,我们熟知的 AI 助手基本采用 decoderonly 架构,这些架构都是由谷歌 2017 年发布的“attention is all you need”论文中提出的 transformer 衍生而来。 大模型的特点:预训练数据量大,往往来自互联网上的论文、代码、公开网页等,通常用 TB 级别的数据进行预训练;参数非常多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。 大模型的安全性保障:通过对齐(指令调优),包括监督微调、获取 reward model 与进行强化学习来调整语言模型的输出分布,以保证语言模型不会输出有害内容和信息。例如 LLAMA2 专门使用了安全有监督微调确保安全。但 Alignment 并不足以防护所有安全问题,存在越狱(Jailbreak)现象,会使模型对齐失效。此外,还有隐私问题。 相关资源:如果想进一步了解大语言模型安全,可以访问 Github awesomellmsafety 项目:https://github.com/ydyjya/AwesomeLLMSafety
2024-10-18
目前最好用的机关公文写作大模型或智能体
目前在机关公文写作方面表现较好的大模型或智能体有: 智谱清言:由智谱 AI 和清华大学推出,基础模型为 ChatGLM 大模型。在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三。更擅长专业能力,但在代码能力上还有优化空间,知识百科方面稍显不足。可应用场景广泛,在 AI 智能体方面相关的应用,包括任务规划、工具使用及长文本记忆相关场景表现出色,在较复杂推理应用上效果不错,也适用于广告文案、文学写作等。 此外,在大模型中,智能体是大模型的一个重要发展方向。智能体可以理解为在大模型(如 LLM)基础上增加了工具、记忆、行动、规划等能力。目前行业里主要用到的如 langchain 框架,能通过代码或 prompt 的形式将 LLM 与 LLM 之间以及 LLM 与工具之间进行串接。
2024-10-18
你知道有支持个性化训练的大预言模型么
以下是一些支持个性化训练的大语言模型: 1. Character.ai:更注重人格属性,试图满足社交、情感、陪伴等需求,与 ChatGPT 侧重不同,后者注重提高效率和解放生产力。 2. Midjourney:今天发布了模型个性化 Personalization 或 'p'的早期测试版本。模型个性化会学习用户的喜好,以便更可能用用户的口味来填补空白。其要求包括目前从成对排名中的投票和喜欢的探索页面上的图像中学习,需要大约 200 个成对排名/喜欢才能生效。使用时只需在提示后输入 'p',或使用提示栏中的设置按钮为所有提示启用个性化功能,还可以使用 's 100'控制个性化效果的强度。但需注意个性化目前不是一个稳定的功能,会随着进行更多的成对排名而变化,且可能会在接下来的几周内推出算法更新。
2024-10-18
我该如何利用文心一言、kimi等已有的大语言模型去作个性化训练?
已有的大语言模型如文心一言、kimi 等通常不支持个人进行个性化训练。 大语言模型的相关知识包括: 国内大模型有通用模型如文心一言、讯飞星火等,处理自然语言;还有垂直模型,专注特定领域。 大语言模型工作原理包括训练数据、算力、模型参数,在训练数据一致情况下,模型参数越大能力越强。 Transformer 是大语言模型训练架构,具备自我注意力机制能理解上下文和文本关联。 大模型可能因错误数据导致给出错误答案,优质数据集对其很重要。 Prompt 分为 system prompt、user prompt 和 assistant prompt,写好 prompt 的法则包括清晰说明、指定角色、使用分隔符、提供样本等。 Fine tuning 是基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 学习大型语言模型(LLM)的开发是一个系统性的过程,需要涵盖多个方面的知识和技能: 掌握深度学习和自然语言处理基础,包括机器学习、深度学习、神经网络等基础理论,以及自然语言处理基础,如词向量、序列模型、注意力机制等。 理解 Transformer 和 BERT 等模型原理,掌握相关论文。 学习 LLM 模型训练和微调,包括大规模文本语料预处理,使用预训练框架,以及微调 LLM 模型进行特定任务迁移。 掌握 LLM 模型优化和部署,包括模型压缩、蒸馏、并行等优化技术,模型评估和可解释性,以及模型服务化、在线推理、多语言支持等。 进行 LLM 工程实践和案例学习,结合行业场景,进行个性化的 LLM 训练,分析和优化具体 LLM 工程案例,研究 LLM 新模型、新方法的最新进展。 持续跟踪前沿发展动态。 机器学习是人工智能的一个子领域,深度学习是机器学习的一个子领域,大语言模型是深度学习在自然语言处理领域的应用之一,具有生成式 AI 的特点。
2024-10-18
现在最新的 AI 生成图片产品有哪些
目前最新的 AI 生成图片产品主要有以下这些: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格供选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,能将上传的照片转换为芭比风格,效果出色。 此外,还有一些用于设计海报的 AI 产品: 1. Canva(可画):https://www.canva.cn/ ,是受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可协助选择颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ ,智能设计工具采用先进人工智能技术,自动分析和生成设计方案。 3. VistaCreate:https://create.vista.com/ ,简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面,可快速创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 以下是图像生成的 Top30 AI 产品数据: |排名|产品名|分类|6 月访问量(万 Visit)|相对 5 月变化| |||||| |1|Adobe firefly|图像生成|28890|0.053| |2|Freepik|图像生成|8341|0.076| |3|Shutterstock|图像生成|6389|0.068| |4|Civitai|图像生成|2592|0.046| |5|Leonardo.Ai|图像生成|1680|0.027| |6|Midjourney|图像生成|1673|0.109| |7|Yodayo|图像生成|1554|0.044| |8|Ideogram|图像生成|1140|0.081| |9|Picsart Al|图像生成|1103|0| |10|Sea Art AI|图像生成|912|0.018| |11|PixAI|图像生成|899|0.07| |12|Openart|图像生成|650|0.074| |13|NovelAI|图像生成|639|0.052| |14|Playground|图像生成|631|0.065| |15|Krea|图像生成|611|0.119| |16|nightcafe|图像生成|606|0.039| |17|Media.io|图像生成|551|0.086|
2024-10-16
通过cursor编程的最新资料
以下是关于 Cursor 编程的最新资料: 小白视角: 已经通过 Cursor 跑出来第一个 html 文件,后续将继续探索,包括: 第一弹,一点小小的震撼——cursor 黑客松。 第二弹,文案工作者的福音——cursor 批量写 prompt、写文章。 第三弹,上一辈的崛起——cursor 的“向上”,给爹妈一场安利。 Cursor 官方功能介绍: Chat 聊天:允许与看到代码库的 AI 交谈,能看到当前文件和光标,可通过特定操作添加代码块到上下文或与整个代码库聊天。 Codebase Answers 代码库答案:使用特定操作询问有关代码库的问题,Cursor 会搜索代码库查找相关代码。 引用您的代码:通过@符号引用代码用作 AI 的上下文,键入@可查看文件夹中文件和代码符号列表。 使用图像:点击聊天下方的图片按钮或拖入图片可将视觉上下文包含在聊天中。 询问 Web:使用@Web 从 Internet 获取最新信息,Cursor 会构建搜索查询并搜索 Web 查找相关信息作为附加上下文。 @Web 相关:借助@Web,Cursor 会根据查询和提供的上下文构建搜索查询并在 Web 上搜索以查找相关信息,可在 Cursor 设置中开启“始终搜索 Web”使 Cursor 在每个查询中搜索 Web 聊天。
2024-10-12
国庆假期期间AI相关最新的资讯信息汇总
以下是国庆假期期间 AI 相关的最新资讯信息汇总: AI 绘画大赛 第 10 届先进建筑竞赛——人工智能下的建筑环境 时间:10/8/23 至 2024/02/02 类型:绘画 线上 青铜幻想计划启动!小说《九畿:岐风长歌》AI 创作大赛开启! 时间:10/8/23 至 10/28 类型:绘画 线上 畅游大好河山绘出盛世中华——AI 绘画征集大赛 时间:10/4/23 至 10/20 类型:绘画 线上 AI 绘画|与唐宫夜宴共绘盛世唐风,感受中华文化的魅力 时间:9/27/23 至 10/15 类型:绘画 线上 数字南翔古韵新象 2023 上海 AIGC 创作大赛 时间:9/27/23 至 10/27 类型:绘画 线上 【中秋·国庆特别活动】AITOP100 &意间 AI:用 AI 绘画诠释传统文化 时间:9/25/23 至 10/08 类型:绘画 线上 腾讯智影:祖国山河风景之美 时间:9/25/23 至 10/08 类型:绘画 线上 “翼起爱科学”青少年 AI 绘画创作大赛 时间:9/22/23 类型:绘画 线上 佛山市 AIGC 多模态训练师学院赛 时间:9/20/23 至 10/15 类型:绘画 线上 deepin 社区主题壁纸 AI 绘画创作大赛 时间:9/15/23 类型:绘画 线上 创意网球场 AI 绘画大赛 时间:9/12/23 类型:绘画 线上 《岁时令中秋》漫画海报 AI 创作大赛 时间:9/11/23 类型:绘画 线上 粤港澳大湾区文化创意设计大赛AI 主题赛道 时间:9/11/23 类型:绘画 线上 其他 AI 相关赛事 文心一言插件设计与开发 时间:2023/09/25 至 11/27 线上 「智谱清言」Prompt 优化大师会盟之旅 时间:2023/09/25 至 11/27 线上 2023 年中国联通网络 AI 大赛 时间:2023/09/19 至 10/11 线上 开赛啦!第六届“中国法研杯”司法人工智能挑战赛开启报名 时间:2023/09/09 至 11/30 线上
2024-10-07
最新的comfyui整合包
以下是关于最新的 ComfyUI 整合包的相关信息: 如果您是 AI 绘图工作者,对 ComfyUI 不熟悉,可在 GitHub 上拉取项目,或在 B 站下载整合包,如秋叶大佬的绘世整合包、只剩一瓶辣椒酱的铁锅炖整合包。 ComfyUI LLM party 是一个以 ComfyUI 作为前端的节点库,用于 LLM 智能体以及 LLM 工作流的无代码开发。可通过以下方法安装: 在中搜索 comfyui_LLM_party,一键安装,然后重启 ComfyUI。 导航到 ComfyUI 根文件夹中的 custom_nodes 子文件夹,使用克隆此存储库:git clone https://github.com/heshengtao/comfyui_LLM_party.git 教学辅导书(含知识点扩充与分享链接): ComfyUI 整合包下载: 官方 Release 页面:github.com/comfyanonymous/ComfyUI/releases 分流度盘:pan.baidu.com/s/1d9XLF96OzWlLtUGvZiYdVA?pwd=nely 分流 Quark:pan.quark.cn/s/ff8172bebe27(无提取码,请完整复制所有链接) 8 月 13 日 ComfyUI 共学中提到了关于康维 UI 部署及工作流搭建的分享会,包括 dream shaper 的 SD 1.5 底模、秋叶的两个整合包等内容,还提供了特定文件的下载链接及电脑配置要求的说明,以及关于 AI 绘图的本地及云端部署、模型介绍与文生图工作流讲解。
2024-10-01
最新视频生成模型和网址
以下是一些最新的视频生成模型和相关网址: 谷歌的视频模型 Veo:您现在可以加入@labs.google 的候补名单,Google 最新图像模型 Imagen 3 和视频模型 Veo 的 waitlist 申请地址:https://aitestkitchen.withgoogle.com/tools/videofx Vidu:Web 端访问:https://www.vidu.studio/ MiniMAX 发布的视频生成模型:https://hailuoai.com/video Civitai 新开的 Civita Green 站点(只有安全的图片和模型,没有色情内容):https://civitai.green/models Runway Gen3 视频生成模型(支持视频延长功能):https://x.com/runwayml/status/1829591480664768993
2024-09-30
AI 工具最新排名,请帮我用柱形图表示
以下是为您整理的部分 AI 工具的最新排名及相关访问量信息: 10 个最佳人工智能工具(2022 年 9 月至 2023 年 8 月访问量) |排名|工具名称| ||| |1|ChatGPT| |2|Character AI| |3|QuillBot| |4|Midjourney| |5|Hugging Face| |6|Google Bard| |7|NovelAI| |8|CapCut| |9|JanitorAI| |10|Civitai| 设计工具 Top20(2023 年 4 月访问量) |排行|产品名|分类|4 月访问量(万 Visit)|相对 3 月变化| |||||| |1|Canva Al|设计工具|58640|0.033| |2|CF Spark|设计工具|940|0.118| |3|Adobe Firefly|设计工具|835|0.051| |4|Microsoft Designer|设计工具|612|0.179| |5|What font is|设计工具|348|0.006| |6|Wepik by freepik|设计工具|284|0.295| |7|Hotpot.ai|设计工具|283|0.024| |8|稿定设计|设计工具|264|0.078| |9|Designs AI|设计工具|185|0.167| |10|墨刀 AI|设计工具|179|0.016| |11|vectorizer.ai|设计工具|171|0.208| |12|Animated Drawings|设计工具|120|0.213| |13|创客贴 AI|设计工具|111|0.224| |14|Autodraw|设计工具|106|0.036| |15|MasterGo|设计工具|105|0.234| |16|Uizard|设计工具|100|0.168| |17|Pixelied Image AI|设计工具|99|0.039| |18|即时 AI 设计|设计工具|89.9|0.022| |19|Relume|设计工具|75|0.016| |20|Pixso AI|设计工具|54.9|0.017| 很抱歉,暂时无法直接为您用柱形图表示这些数据。但您可以根据以上数据,使用相关的图表制作工具来生成柱形图。
2024-09-30