直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

导入图片识别

回答

导入图片识别通常指的是使用计算机视觉技术来识别和理解图片内容的过程。这涉及到多个步骤,包括图像的预处理、特征提取、分类识别等。在实际应用中,这个过程可以通过各种深度学习模型来实现,例如卷积神经网络(CNNs)或者像InternVL这样的视觉-语言模型。

如果你想要使用InternVL进行图片识别,可以按照以下步骤操作:

  1. 准备图片:确保你的图片格式和分辨率适合模型的要求。

  2. 加载模型:使用适当的深度学习框架(如PyTorch或TensorFlow)加载InternVL模型。如果InternVL模型已经训练完成并开源,你可以直接从GitHub或其他代码托管平台下载模型。

  3. 图像预处理:根据模型的要求对图片进行预处理,比如调整大小、归一化等。

  4. 模型推理:将预处理后的图片输入模型,进行前向传播以获得识别结果。

  5. 解析输出:模型输出可能是一个概率分布,表示不同类别的可能性。你需要解析这个输出来确定图片中的对象。

  6. 后处理:根据需要对结果进行后处理,比如非极大值抑制(NMS)来去除冗余的检测框。

下面是一个使用PyTorch和transformers库加载InternVL模型并进行图片识别的示例代码:

import torch
from PIL import Image
from transformers import AutoModel, AutoTokenizer, CLIPImageProcessor

# 加载模型和处理器
model = AutoModel.from_pretrained('OpenGVLab/InternViT-6B-224px')
tokenizer = AutoTokenizer.from_pretrained('OpenGVLab/InternViT-6B-224px')
image_processor = CLIPImageProcessor.from_pretrained('OpenGVLab/InternViT-6B-224px')

# 加载图片并进行预处理
image = Image.open("path_to_your_image.jpg").convert("RGB")
inputs = image_processor(images=image, return_tensors="pt")

# 模型推理
with torch.no_grad():
    outputs = model(**inputs)

# 解析输出
# 假设模型输出是一个类别的概率分布
probabilities = outputs.logits.softmax(-1)
predicted_class_idx = probabilities.argmax().item()
predicted_class = model.config.id2label[predicted_class_idx]

print(f"Predicted class: {predicted_class}")

请注意,上述代码仅为示例,实际使用时需要根据InternVL模型的具体实现和API进行调整。如果InternVL提供了具体的API或示例代码,建议直接使用官方提供的代码以获得最佳效果。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

如何判断一张图片是否 AI 生成的

当然,要培养出鉴赏AI的技能,多少还是需要我们训练训练自己的大脑模型的。那如果不善于此的朋友,想要判断眼前的作品是否是AI造物呢?AI技术自己带来的造假难题,也该由AI自己的同僚互鉴打假来解决。现在已有不少网站在做这件事情,通过对大量的图片数据的抓取和分析,给出对画作属性的判断可能性。例如使用AI来鉴别AI绘图性质的网页:ILLUMINARTY(https://app.illuminarty.ai/)。但在测试过程中,有些结构严谨的真实摄影作品,反而会被识别为AI作图。这跟我们前面提到的,AI作画很难完成严谨真实的结构这一点,是相互矛盾的。鉴别的AI认为,过于严谨的图像不像是真实的人造产物。而画图的AI其实难以生成严谨的结构造型。这就是鉴定AI自身的逻辑算法,并不能像人类一样综合去考虑不符合人的逻辑的各种表现。多试几张,就能磕着瓜子看AI吵架了。甚至作长者摇头抚须状,长叹一声,「AI后生们,还有很长的路要走啊。」我们看完AI显眼包的快乐丢撵后,来聊聊「我们为什么要鉴别AIGC」?已经「知其然」,也大略「知其所以然」,而后终于能顺势讨论讨论「知何由以知其所以然」。

问:图像融合和目标检测是什么

Q:图像融合和目标检测是什么?大致的原理是什么?有哪些相关的算法?图像融合是将两个或多个图像合成为一个新的图像,以获得比原始图像更全面和丰富的信息。它可以通过不同的技术实现,如像素级融合、特征级融合和决策级融合。图像融合在实际应用中有多种用途,包括提高图像质量、增加图像信息量、遥感图像处理以及计算机视觉和机器人技术中的应用。目标检测是计算机视觉领域中的一个重要任务,其目标是在图像或视频中准确地识别和定位特定对象。随着多模态数据的广泛应用,如图像、文本、语音等,将不同模态的信息进行融合可以进一步提高目标检测的性能和鲁棒性。因此,图像融合和目标检测都是计算机视觉领域中重要的技术,它们在多个领域都有广泛的应用前景和研究价值。图像融合和目标检测的大致原理分别是将多个不同的图像合并成一个新的图像以获得更准确、更全面的信息和在图像中找到特定的目标并对其进行定位和识别。图像融合的相关算法有:小波变换、基于金字塔变换的多分辨率融合、基于区域的图像融合、基于特征的图像融合等。

其他人在问
帮我写一篇有关aigc的行业分析,标题为《AIGC行业洞察与概览》,其中框架内容包含以下部分,整体3万字 - 概念导入(AI、AIGC) - AI与人的区别 - AI衍生发展历程(诞生、发展、现状-中外各平台产品及语言模型介绍) - AI在社会各领域的应用实践 - AI技术的底层逻辑概览 - AI的弊端以及风险
以下是为您生成的《AIGC 行业洞察与概览》的部分内容: 一、概念导入 (一)AI 人工智能(Artificial Intelligence,简称 AI)是一种目标,旨在让机器展现智慧。 (二)AIGC GenAI(即生成式 AI)是一种能够从已有数据中学习并生成新的数据或内容的 AI 应用,利用 GenAI 创建的内容即 AIGC(全称 AIGenerated Content)。AIGC 是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。 二、AI 与人的区别 三、AI 衍生发展历程 (一)诞生 (二)发展 (三)现状 1. 中外各平台产品及语言模型介绍 (1)语言文本生成利用马尔科夫链、RNN、LSTMs 和 Transformer 等模型生成文本,如 GPT4 和 GeminiUltra。 (2)图像生成依赖于 GANs、VAEs 和 Stable Diffusion 等技术,代表项目有 Stable Diffusion 和 StyleGAN 2。 (3)音视频生成利用扩散模型、GANs 和 Video Diffusion 等,代表项目有 Sora 和 WaveNet。 四、AI 在社会各领域的应用实践 AIGC 技术可以用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。 五、AI 技术的底层逻辑概览 (一)机器学习:一种让机器自动从资料中找到公式的手段。 (二)深度学习:一种更厉害的手段,类神经网络,具有非常大量参数的函数。 (三)大语言模型:是一类具有大量参数的“深度学习”模型,Large Language Models,简称 LLMs。 六、AI 的弊端以及风险 作为一种强大的技术,生成式 AI 能够赋能诸多领域,但也存在多重潜在的合规风险。目前,我国对 AIGC 的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成了共同监管的形势。 由于篇幅限制,目前仅能为您提供约 2000 字的内容,距离 3 万字还有较大差距。后续还需要进一步丰富和完善各个部分的细节及案例分析等。
2024-09-03
有把PDF导入后自动生成思维导图的软件吗,有没有类似的AI工具
以下是一些可以将 PDF 导入后自动生成思维导图的 AI 工具: 1. GitMind:免费跨平台 AI 思维导图软件,支持多种模式,可通过 AI 自动生成思维导图。 2. ProcessOn:国内思维导图+AIGC 工具,可利用 AI 生成思维导图。 3. AmyMind:轻量级在线 AI 思维导图工具,无需注册登录,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路,生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,可输入需求由 AI 自动完成思维导图生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,帮助提升生产力。 这些 AI 思维导图工具都能通过 AI 技术自动生成思维导图,提高制作效率,为知识工作者带来便利。在选择工具时,需考虑具体需求,如是否支持特定建模语言、与特定开发工具集成、偏好在线工具或桌面应用程序等。
2024-09-01
在导入前,先对知识库文档内容进行标注处理,要怎么处理
在导入前对知识库文档内容进行标注处理,主要有以下要点: 为提升召回准确性,一方面在导入前,先对知识库文档内容进行标注处理,另一方面对于切割后的 chunk 进行标注,如标注 chunk 来源哪个文档的哪个段落。 对于本地 word 文件,每个章节都要按照固定的方式进行人工标注和处理,然后选择创建知识库自定义清洗数据。
2024-08-19
能够将分镜导入剪映的ai
目前尚未有能够直接将分镜导入剪映的 AI 工具。但在 AI 领域,技术不断发展和创新,未来可能会出现相关的功能或工具。您可以持续关注剪映的官方更新以及 AI 技术的最新动态。
2024-08-10
能够将文案免费分镜并导入剪映的ai
目前暂时没有能够将文案免费分镜并直接导入剪映的 AI 工具。但在 AI 领域不断发展的情况下,您可以持续关注相关动态,或许未来会有这样的创新应用出现。
2024-08-10
有没有导入词曲的AI音乐产品
根据搜索结果,以下是一些可以导入词曲由AI演唱歌曲的网页推荐: 1. TuneFlow :TuneFlow 是新一代AI助力的音乐制作工具,提供声音克隆功能,可以用你最爱的声音或名人的声音重新演绎歌曲。用户可以一键完成云端推理,无需任何背景知识或硬件需求。 2. 网易天音 :网易天音是网易云音乐推出的AI音乐生成工具,用户输入灵感后,AI可以辅助完成词、曲、编、唱,生成AI初稿,并支持词曲协同调整。 3. 网易云音乐·X Studio :由网易云音乐与小冰公司联合推出的AI歌手音乐创作软件,支持AI演唱,提供不同声线风格的AI歌手,并且支持合并多轨AI音轨。 4. ACE Studio :时域科技推出的AI音乐合成工具,具有先进的AI人声合成引擎,提供独特的声线混合和众多高水平的AI歌手,支持AI演唱参数随时调整。 5. AI Singing :一个免费生成音乐的AI歌声生成器,用户可以输入歌词后,AI Singing将生成相应的歌曲。 6. HeyMusic.AI :使用AI从用户自己的歌词或简单提示中生成音乐的网页工具,帮助用户轻松地创作音乐。 7. Udio :2024年热门的AI音乐生成器之一,可以根据用户提供的文字提示以及歌曲的流派、歌词、主题直接生成音乐。 8. ACE Studio :一个AI音乐生成工具,收录多首AI歌曲,支持多种播放模式。 9. Melodisco :由独立开发者idoubi开发的AI音乐播放器,收录了众多AI歌曲,用户可以根据喜好播放。 这些工具可以帮助音乐爱好者和专业人士利用AI技术快速创作和生成音乐,无论是简单的伴奏还是完整的歌曲演唱。
2024-06-21
OCR文字 识别的软件
以下为您介绍一些与 OCR 文字识别相关的内容: 在“安仔:我用 Coze 免费手搓了一个 24 小时英语陪练,根治了我多年的哑巴英语”中提到使用了 Simple OCR 插件,它能够识别图片中的文字,并返回识别结果,用于读取用户上传图片或文件的文字,并做相应处理。 在移动端图片视觉处理方面,对于试卷拍照去除书写笔迹,有以下详细方法: 1. 图像预处理: 图像去噪:使用高斯滤波、中值滤波等去噪算法去除图像中的噪声。 图像增强:通过直方图均衡化、对比度增强等增强算法提升图像的清晰度和对比度。 2. 图像分割: 使用阈值分割、边缘检测和基于区域的分割等算法将试卷图像中的书写笔迹和背景分离。 3. 文字检测: 在分割后的图像中,使用基于深度学习的文本检测模型等文字检测算法识别出试卷上的文字区域。 4. 文字识别: 对检测到的文字区域进行文字识别,将文字内容转换为计算机可处理的文本数据。常用技术包括基于深度学习的端到端文本识别模型和传统的 OCR 技术。 5. 后处理: 根据需求进行后处理,如去除残余的噪点、填补文字区域的空白等。 6. 机器学习模型训练(可选): 如有足够的数据,可以采用机器学习技术训练模型,通过学习样本中的书写笔迹特征来自动去除试卷上的笔迹。 7. 优化算法:
2024-09-18
给我推荐一些可以识别图片中文字的AI工具
以下为您推荐一些可以识别图片中文字的 AI 工具: 1. PixelLLM Google 的新视觉语言模型:能提供对图片内容的详细描述及每个词汇的具体位置,可识别图片中的物体并精确指出其位置,特别适用于图像和文字紧密结合的任务。相关链接:https://jerryxu.net/PixelLLM/ 、https://arxiv.org/abs/2312.09237 2. EmbedAI:支持使用各种数据源训练 ChatGPT,包括文件、网站、Notion 文档和 YouTube。应用范围广泛,如智能客服、个性化学习助手等。无代码平台,适合非编程背景用户。相关链接:https://thesamur.ai 、https://x.com/xiaohuggg/status/1736336780876742873?s=20
2024-09-12
我需要一个能用于命名实体识别的prompt,针对具体的抽取事例为我提供一个这样的模板,要保证抽取结果的准确性。
以下是一个用于命名实体识别的 Prompt 模板示例: “请从以下文本中准确识别出所有的命名实体,并按照人物、地点、组织、时间等类别进行分类:” 通过这样明确的指令,能够引导模型更有针对性地进行命名实体的抽取,从而提高抽取结果的准确性。
2024-09-08
人脸识别
以下是关于人脸识别的相关信息: 视频模型“可灵”的测试内容包括场景识别(室内和室外)、物体识别(静态和动态)、人物识别(面部、姿态)、动作识别(基本动作)等方面。例如,测试了模型在不同室内环境(办公室、厨房、卧室等)和室外环境(街道、公园、商场等)中的表现,对不同面部特征(不同年龄、性别、种族等)、人物姿态(站立、坐下、躺卧等)和基本动作(走路、跑步、跳跃等)的识别能力。 11 月 24 日的 XiaoHu.AI 日报中提到: DeepFace 是面部识别和分析工具,功能包括面部验证、识别和属性分析,整合多个先进模型,准确率超越人类,支持实时视频分析和外部系统调用。 Comfyui 进行了 SVD Image 2 Video 优化,优化内存占用至 8GB,并提供 workflow 以供在不同显卡上运行。 有泄露的 GPTs 提示大集合,涵盖学术、占卜、医疗咨询等多个应用领域。 PixelDance 是高动态视频生成模型,能通过文本和图片生成复杂场景视频,在连贯性和视频质量方面表现卓越。
2024-09-06
我想从人力经济学角度写一篇智能语音识别技术在护士中的应用的文章,请帮我写一篇写作大纲,字数150字。
以下是为您生成的一篇关于智能语音识别技术在护士中应用的写作大纲,约 150 字: 一、引言 介绍智能语音识别技术的发展及在医疗领域的应用背景。 二、智能语音识别技术概述 技术原理、特点及优势。 三、在护士工作中的应用现状 如护理记录、医嘱执行等方面的应用情况。 四、对护士工作效率的影响 包括节省时间、减少错误等。 五、对护士职业发展的影响 技能要求变化、职业晋升机会等。 六、面临的挑战与对策 如技术准确性、隐私保护等问题及解决办法。 七、结论 总结应用前景及未来发展趋势。
2024-09-04
识别文稿错字的工具
以下是一些识别文稿错字的工具和方法: 飞书文档自带纠错功能。 使用大模型进行纠错,例如可以直接告诉大模型:检查下列文本中的错别字、语法错误和格式错误,指出并改正,重新生成新的文本。但如果用 prompt 纠错,文本量不能太大。 此外,关于其他相关内容: Ideogram 2.0 在生成图像中的文字时,是通过学习大量文字图像及其外观和风格来生成的,可能会出现字体生成错误,可通过再次生成提示、使用编辑器修改等方式纠正。 还有 OpenAI 与 Claude 转换器的相关信息,如语法纠正、机场代码提取、根据心情生成颜色的 CSS 代码等任务的 Prompt 转换。
2024-08-30
AI怎么把图片做成视频
以下是将图片制作成视频的几种方法: 1. 使用 PixVerse 网站(https://app.pixverse.ai):涂抹选区,给出相应的运动方向,最后加入配音,剪辑一下即可。 2. 利用快影(需先通过内测申请): 打开快影,选择 AI 创作。 选择 AI 生成视频。 选择图生视频。 上传处理好的图片,填写想要的互动动作和效果,然后点击生成视频,排队等待生成结束后点击下载。 3. 采用 Midjourney 出图结合 AI 视频软件的方法: 使用 Midjourney 垫图加描述出图。 下载“素材”项里的深度图,打开 MJ 官网(https://www.midjourney.com/)上传深度图。 若图片完美可直接生成视频,若有黑边则需下载图片并用 PS 创成式充填处理黑边。
2024-09-19
请帮我推荐一个去除图片中文字的工具
以下为您推荐一些去除图片中文字的工具: 1. AVAide Watermark Remover:在线工具,使用 AI 技术,支持多种图片格式如 JPG、JPEG、PNG、GIF 等。操作简单,上传图片、选择水印区域,保存并下载处理后的图片,还提供去除文本、对象、人物、日期和贴纸等功能。 2. Vmake:提供 AI 去除图片水印功能,可上传最多 10 张图片,AI 自动检测并移除水印,处理完成后可保存生成的文件,适合需快速去除水印及在社交媒体分享图片的用户。 3. AI 改图神器:提供 AI 智能图片修复去水印功能,可一键去除图片中多余物体、人物或水印,不留痕迹。支持直接粘贴图像或上传手机图像,操作简便。 此外,还有以下工具或方法可供选择: ps 的 ai 版,操作相对简单。 SD 局部重绘。 Firefly、canva、Google photo 都有局部重绘功能。 微软 Designer 免费。 https://clipdrop.co/cleanup
2024-09-18
图片去文字的接口
以下是一个移动端图片视觉处理以去除试卷拍照中书写笔迹的方法: 1. 图像预处理 图像去噪:运用去噪算法,例如高斯滤波、中值滤波,来去除图像中的噪声。 图像增强:通过增强算法,像直方图均衡化、对比度增强,提高图像的清晰度和对比度。 2. 图像分割 采用图像分割算法将试卷图像中的书写笔迹和背景分离,常用的分割算法有阈值分割、边缘检测和基于区域的分割方法。 3. 文字检测 在分割后的图像中,使用文字检测算法,比如基于深度学习的文本检测模型,识别出试卷上的文字区域。 4. 文字识别 对检测到的文字区域进行文字识别,将文字内容转变为计算机可处理的文本数据。常用的文字识别技术包含基于深度学习的端到端文本识别模型和传统的 OCR(Optical Character Recognition)技术。 5. 后处理 根据需求进行后处理,例如去除残余的噪点、填补文字区域的空白等。 6. 机器学习模型训练(可选) 若有充足的数据,可以利用机器学习技术训练模型,通过学习样本中的书写笔迹特征来自动去除试卷上的笔迹。 7. 优化算法
2024-09-18
消除图片文字
以下是关于消除图片文字的方法和相关工具的介绍: 消除图片文字的方法: 1. 图像预处理: 图像去噪:使用去噪算法(如高斯滤波、中值滤波)去除图像中的噪声。 图像增强:通过增强算法(如直方图均衡化、对比度增强)提升图像的清晰度和对比度。 2. 图像分割:使用图像分割算法将试卷图像中的书写笔迹和背景分离。常用的分割算法包括阈值分割、边缘检测和基于区域的分割方法。 3. 文字检测:在分割后的图像中,使用文字检测算法(如基于深度学习的文本检测模型)识别出试卷上的文字区域。 4. 文字识别:对检测到的文字区域进行文字识别,将文字内容转换为计算机可处理的文本数据。常用的文字识别技术包括基于深度学习的端到端文本识别模型和传统的 OCR(Optical Character Recognition)技术。 5. 后处理:根据需求进行后处理,如去除残余的噪点、填补文字区域的空白等。 6. 机器学习模型训练(可选):如有足够的数据,可以采用机器学习技术训练模型,通过学习样本中的书写笔迹特征来自动去除试卷上的笔迹。 AI 去水印的工具: 1. AVAide Watermark Remover:这是一个在线工具,使用 AI 技术从图片中去除水印。它支持多种图片格式,如 JPG、JPEG、PNG、GIF 等。操作简单,只需上传图片,选择水印区域,然后保存并下载处理后的图片即可。这个工具还提供了其他功能,如去除文本、对象、人物、日期和贴纸等。 2. Vmake:这个工具同样提供 AI 去除图片水印的功能。用户可以上传最多 10 张图片,AI 会自动检测并移除图片上的水印。处理完成后,用户可以选择保存生成的文件。这个工具适合需要快速去除水印的用户,尤其是那些需要在社交媒体上分享图片的用户。 3. AI 改图神器:这个工具提供 AI 智能图片修复去水印的功能,可以一键去除图片中的多余物体、人物或水印,不留任何痕迹。支持直接粘贴图像或上传手机图像,操作简单方便。 这些工具各有特点,可以根据您的具体需求选择最适合您的去水印工具。但请注意,内容由 AI 大模型生成,请仔细甄别。
2024-09-18
有什么免费的AI图片生成工具
以下是一些免费的 AI 图片生成工具: 1. Canva(可画):https://www.canva.cn/ 是一个受欢迎的在线设计工具,提供大量模板和设计元素,用户通过简单拖放操作创建海报,其 AI 功能可协助选择颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,用户可用 AI 工具创建个性化海报,智能建议功能帮助用户快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能。 以下是一些图片生成 3D 建模工具: 1. Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速 2D 到 3D 转换,并提供 AI 驱动的精准度和细节。 2. Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成,用户上传图片并描述材质和风格可生成高质量 3D 模型。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象,再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域模型生成,用户上传图片或输入文本提示词生成 3D 模型。 5. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 以下是一些文生图工具: 1. DALL·E:OpenAI 推出的文生图工具,可根据输入文本描述生成逼真图片。 2. StableDiffusion:开源的文生图工具,能生成高质量图片,支持多种模型和算法。 3. MidJourney:因其高质量图像生成效果和用户友好界面设计受到广泛欢迎,在创意设计人群中尤其流行。 您还可以在 WaytoAGI 网站查看更多文生图工具:https://www.waytoagi.com/category/104 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-09-18
有什么根据文字生成图片的AI工具
以下是一些根据文字生成图片的 AI 工具: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量的图像生成效果和用户友好的界面设计受到广泛欢迎,在创意设计人群中尤其流行。 您可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 此外,从文本提示生成 2D 图像已经是生成性 AI 广泛应用的领域之一,像 Midjourney(https://www.midjourney.com/home/)、Stable Diffusion(https://stability.ai/blog/stablediffusionannouncement)和 DallE 2(https://openai.com/dalle2/)这样的工具可以从文本生成高质量的 2D 图像,并在游戏生命周期的多个阶段有应用。例如,在概念艺术方面,生成性 AI 工具能帮助非艺术家快速探索概念和想法,生成概念艺术作品,加速创作流程。
2024-09-18