直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

用哪个ai可以将图片中的公示提取出来

回答

目前常见的能够提取图片中公式的 AI 工具包括但不限于以下几种:

  1. 一些专门的 OCR(光学字符识别)工具,它们经过训练可以识别图片中的文字和公式,并将其转换为可编辑的文本格式。
  2. 部分具有图像识别和文本处理能力的综合性 AI 平台,可能具备提取图片中公式的功能。

需要注意的是,不同工具的识别准确率和适用场景可能会有所差异,您可以根据具体需求进行选择和尝试。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

生成式人工智能艺术形态想象 | 精简版

生成式人工智能是一种全新的信息获取方式,而midjourney等工具所代表的是图形领域的信息获取通过背后的人工智能模型,可以根据用户提供的文本描述生成高度相关和创造性的图像。这种通过文本命令获得图像的方式叫做Prompting,是一种全新形态的人机交互。比如我输入:想象:安塞尔亚当斯的风光摄影,平遥,全景图,云隙光,丁达尔光,史诗的,明暗对照法就能获得以上图像。为什么能达成这样的能力。我们把复杂的计算机专业领域概念拆解成为三个简单的词汇。数据,映射和扩散。首先是数据,包括从公共数据库中获取世界上万事万物的图像存档、历史文献图片,或者创建特定的数据集以覆盖特定的风格或元素。最终,收集数据的目的是,获得足够的基础。用以特征化每一个世界上的物体、风格或概念。第二个部分是映射,在数据处理阶段,AI使用如卷积神经网络的算法,来识别和提取图片中的关键视觉特征,如颜色、形状、纹理等。这个过程涉及到从原始数据中学习到的特征的映射这些映射后的特征将用于生成新的艺术作品。核心本质是将信息进行蒸馏,抛弃干扰的部分将特征得以呈现。比如我们现在看到的这个苹果。最后一个概念是扩散(Diffusion)利用学习到的数据和视觉特征,AI能够通过创造性扩散的过程,不仅仅是复制或模仿已知的艺术风格,而是在现有数据的基础上,通过AI的内部处理机制,探索和创造新的视觉表达形式。归根结底,这样的核心机制,授予了创作者一只自己会动的笔。本雅明把摄影时代称作为机械复制时代,那也许我们这个时代就是人工智能执笔时代。不需要笔也能画画,拍电影。只需站在“画架”之前思考我们的观念,题材,实现路径。

南瓜博士:让 AI 画了十万只猫后,我终于明白了人类的独特价值

那有没有可能用一套提示词架个agent flow,让AI自举式的开始创造呢?还真有可能。我给AI设计了一套工作流,依次做以下几件事:1.根据画风匹配作家2.从几个干扰选项中确认作家、排除步骤一瞎匹配的那些3.根据作家的作品描绘名场面4.将名场面转译成绘画指令5.将指令用对应画风画出来例如下图左上角的猫猫,AI能非常到位地识别匹配到作家奥斯卡·王尔德。从四幅图中挑出最配王尔德的它也能挑准,说明那是真匹配。(我做了好些这个实验,收到很多令人惊叹的结果,后面另写文章介绍。)然后,它从《道林·格雷的画像》这部小说中提取出名场面,转译成prompt,得到了如下的图画。注意到左侧,年青俊美的道林格雷那空洞的眼神了吗?注意到右侧,手握匕首的道林,和都柏林Merrion广场里的王尔德雕塑是同样的姿势吗?这些细节,真的让我鸡皮疙瘩都起来了。当给到的方法足够好,让AI能从人类知识的宝库里获取足够多信息,AI也可以有精彩的自举式创造。[heading1]6[heading2]

AI 带你穿越时空,去拥抱儿时的自己

The young boy and the young man,both Chinese,are standing together,displaying a harmonious and friendly scene.The young boy stands on the right side of the young man,leaning slightly forward with a bright smile,showing his neat baby teeth.His black short hair is fluffy and styled,with slightly curly bangs,and his big eyes are full of innocent curiosity.He is wearing a blue shirt with a white knitted vest over it,looking clean and neat.The young man stands on the left side of the young boy,bending slightly to be at the same height,with a gentle smile on his face and a look of fondness in his eyes.His black shiny hair is neatly combed back with a slight wave at the ends,his facial features are well-defined,eyebrows thick and shaped,eyes large and expressive,nose high and straight,and lips thin with a subtle curve.He is dressed in a formal black suit with a white shirt underneath and a black bow tie,looking very handsome and charming.They stand shoulder to shoulder,with the young man's right hand gently resting on the young boy's shoulder,showing warmth and closeness.The young boy's left hand naturally rests on the young man's arm,displaying a sense of trust and reliance.Their posture and expressions convey a deep bond and mutual support,filling the scene with warmth and harmony.

其他人在问
AI硬件
以下是关于 AI 硬件的相关信息: AI Native 产品: AI Pin:由 Humane 公司开发的可穿戴设备,通过激光投影技术在手掌显示信息,由高通 Snapdragon 芯片驱动,运行 OpenAI 的 GPT4 语言模型,集成麦克风、摄像头和传感器,能语音通话、上网和回答问题,注重隐私保护,价格高昂,市场接受度可能受影响。 TAB AI:挂在脖子上的小冰盘,本质是麦克风和电池,使用蓝牙传输音频到手机和云端,ChatGPT 转录对话,各种人工智能模型提取见解,被称为“人工智能伴侣”或“clarity machine”。 OpenAI 和 Lovefrom 在软银 10 亿美元融资开发的“人工智能 iPhone”。 主流 AI 笔记本电脑: 截止 2024 年 5 月,主流的 AI 笔记本电脑是为人工智能和深度学习设计的高性能移动工作站,通常配备强大的 GPU(如 NVIDIA RTX 系列)、大容量内存和高速固态硬盘。 知名品牌包括:微软(Microsoft)第 11 代 Surface Pro、微星(MSI)Creator/Workstation 系列、技嘉(GIGABYTE)Aero/Aorus 系列、戴尔(Dell)Precision 移动工作站、惠普(HP)ZBook 移动工作站、联想(Lenovo)ThinkPad P 系列。 一般采用英特尔酷睿或 AMD Ryzen 的高端移动 CPU,配备 NVIDIA RTX 30/40 系列或 AMD Radeon Pro 专业级 GPU,提供大容量内存和高速 NVMe SSD 存储选配,预装 NVIDIA CUDA、cuDNN 等深度学习框架和 AI 开发工具。 价格相对较高,通常在 2000 美元以上,用户需根据自身需求和预算选择,同时关注散热、续航等实际使用体验。 GenAI 硬件 TikTok 热度总榜: RayBan Meta Smart Glasses:眼镜,Meta 和 RayBan 出品,180000 个 TT 作品,价格 299 美元。 Vision Pro:眼镜,苹果出品,38600 个 TT 作品,价格 3999 美元。 cozmo:玩具机器人,Digital Dream Labs 出品,10500 个 TT 作品,价格 399 美元。 Lovot:玩具机器人,GROOVE X 出品,5931 个 TT 作品,价格 9000 美元。 Optimus:大型机器人,特斯拉出品,2641 个 TT 作品。 AI pin:吊坠,Humane 出品,1200 个 TT 作品,价格 699 美元。 PLAUD:录音机,Smart connection 出品,1072 个 TT 作品,价格 159 美元。 RabbitR1:吊坠,Rabbit Inc 出品,1048 个 TT 作品,价格 199 美元。 Loona:玩具机器人,KEYi Tech 出品,753 个 TT 作品,价格 449 美元。 Timekettle WT2:耳机,Timekettle 出品,751 个 TT 作品,价格 299 美元。 OrCam MYEYE:眼镜,OrCam 出品,532 个 TT 作品,价格 4250 美元。 Jibo:玩具机器人,Ling Technology 出品,492 个 TT 作品,价格 749 美元。 LOOI:玩具机器人,TangibleFuture 出品,400 个 TT 作品,价格 129 美元。 Pixel Buds Pro:耳机,谷歌出品,393 个 TT 作品,价格 199 美元。
2024-11-12
目前能力最强的AI是什么?
目前能力最强的 AI 是 GPT4。GPT4 是功能最强的人工智能写作工具,您可以在 Bing(选择“创新模式”)上免费访问,或者通过购买 ChatGPT 的$20/月订阅来使用。Claude 也是表现出色的 AI,紧随其后,并且提供了有限的免费选项。这些工具还被直接集成到常见的办公应用程序中,例如 Microsoft Office 将包括一个由 GPT 提供支持的副驾驶,Google Docs 将整合 Bard 的建议。
2024-11-12
AI画卡通画,有什么平台
以下是一些可以用于 AI 画卡通画的平台: MewXAI:这是一款强大专业且新手友好、操作简单的 AI 绘画创作平台。其功能包括 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。访问地址:https://www.mewxai.cn/ Lucidchart:强大的在线图表制作工具,集成了 AI 功能,可自动化绘制多种示意图,如流程图、思维导图、网络拓扑图等。拖放界面易于使用,支持团队协作和实时编辑,有丰富的模板库和自动布局功能。官网:https://www.lucidchart.com/ Microsoft Visio:专业的图表绘制工具,适用于复杂的流程图、组织结构图和网络图。其 AI 功能可帮助自动化布局和优化图表设计,集成 Office 365,方便与其他 Office 应用程序协同工作,有丰富的图表类型和模板,支持自动化和数据驱动的图表更新。官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware Diagrams.net:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。支持本地和云存储(如 Google Drive、Dropbox),有多种图形和模板,易于创建和分享图表,可与多种第三方工具集成。官网:https://www.diagrams.net/
2024-11-12
现在有哪些AI陪伴类型的产品?
以下是一些 AI 陪伴类型的产品: 1. Character.ai:用户可以与数百个 AI 驱动的角色进行交流,还能创建自己的角色并赋予其各种特性。 2. Replika:用户可以设计理想的伴侣,其会存储记忆并在未来对话中参考,甚至能发送照片。 3. Talkie:主打情感路线,有大量 NPC 和丰富的剧情体系,游戏和休闲娱乐体验感强。 4. 星野、BubblePal:在长短记忆上做处理,突出陪伴意义,陪伴时间越久,知识库沉淀的个性化记录越丰富,越懂用户。 但每个产品都有其特定的应用场景和功能,建议您根据自己的具体需求来选择合适的产品。
2024-11-12
AI 在教育行业的落地场景有哪些?
AI 在教育行业的落地场景主要包括以下方面: 1. 个性化学习:通过集成算法和大数据分析,如 Knewton 平台,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源。 2. 自动评估:利用自然语言处理技术(NLP)自动批改学生的作文和开放性答案题,如 Pearson 的 Intelligent Essay Assessor,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学:例如 Google 的 AI 教育工具 AutoML 用于创建定制学习内容,通过有趣方式加深学生对学科概念的理解。 4. 虚拟现实(VR)和增强现实(AR):学生可通过 VR 头盔进入虚拟实验室进行实验操作并获得 AI 系统反馈,如 Labster 的虚拟实验室平台。 5. 协助评估学生学习情况,为职业规划提供建议。 6. 针对学生情况和兴趣定制学习内容。 7. 论文初稿搭建及论文审核。 8. 帮助低收入国家/家庭获得平等教育资源。
2024-11-12
ai生成图片
以下是关于如何判断一张图片是否为 AI 生成的相关内容: 首先,要培养鉴别 AI 生成图片的技能,需要训练自己的大脑模型。对于不善于此的朋友,可以借助一些网站,如 ILLUMINARTY(https://app.illuminarty.ai/),通过对大量图片数据的抓取和分析来给出画作属性的判断可能性。但在测试中可能存在问题,比如结构严谨的真实摄影作品可能会被误判为 AI 作图,这是因为鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。 此外,还可以通过画面风格、物品 bug 等细节来辨别。就在我们总结这些方法的同时,AI 也在飞速修正作图 bug,所以这些方法可能随时失效。 我们曾在小红书、B 站等自媒体平台上以“ AIGC 鉴别”为话题发布图文,让大家判别真迹与 AI 仿品。在这个过程中发现,大家对判断哪幅图是 AI 生成的往往有一种直觉感受,但进一步询问如何看出时,多半难以迅速给出一套章程来描述或解释。所以我们系统地总结了“AIGC 鉴别”经验帖,帮助大家学会如何一眼盯真,两眼打假。
2024-11-12
推荐一个视频文案提取的AI工具
以下为您推荐几个视频文案提取的 AI 工具: 1. Reccloud:这是一个免费的在线 AI 字幕生成工具,能直接上传视频进行精准识别,还能对识别的字幕进行翻译,自动生成双语字幕。它宣称已处理 1.2 亿+视频,识别准确率接近 100%。 2. 绘影字幕:一站式专业视频自动字幕编辑器,提供简单、准确、快速的字幕制作和翻译服务。支持 95 种语言,准确率高达 98%,还能自定义视频字幕样式,包括字体、颜色、大小、位置等。 3. Arctime:可对视频语音自动识别并转换为字幕,甚至支持自动打轴。支持 Windows 和 Linux 等主流平台,支持 SRT 和 ASS 等字幕功能。 4. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 以上工具各有特点,您可根据自身需求选择最适合的视频自动字幕工具。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-08
如果我希望搜索尽可能全部的含有相关搜索词的论文并提取其特定信息呢
目前知识库中没有关于如何搜索尽可能全部的含有相关搜索词的论文并提取其特定信息的内容。但一般来说,您可以通过以下几种方式来尝试: 1. 利用专业的学术数据库,如 Web of Science、Scopus 等,设置精确的搜索词和筛选条件。 2. 尝试使用多个不同的学术搜索引擎,以扩大搜索范围。 3. 运用高级搜索技巧,例如布尔逻辑运算符(AND、OR、NOT)来优化搜索词组合。 4. 对于提取特定信息,可以先确定所需信息的类型和特征,然后借助相关的文献管理工具或数据挖掘软件来辅助处理。
2024-11-06
提取视频中的语音转文字
要提取 B 站视频中的字幕文字内容,可按以下步骤操作: 1. 打开 B 站视频,如果在视频栏下面有字幕按钮,说明该视频作者已上传字幕或后台适配了 AI 字幕。 2. 安装油猴脚本: 。 3. 安装后刷新浏览器,点击字幕,会看到多出一个“下载”按钮。 4. 点击下载按钮,弹出窗口,可选择多种字幕格式,如带时间的或者不带时间的。 5. 最后将下载的字文字内容全选复制发送给 GPTs 即可。 需要注意的是,对于有字幕的视频,目前大部分用 AI 总结视频的工具/插件/应用都是通过获取字幕来实现的。直接用语音转文字的方式效率较低。
2024-11-04
能够提取视频摘要的大模型有哪些
以下是一些能够提取视频摘要的大模型: 1. InstructBLIP:基于预训练的BLIP2模型进行训练,在MM IT期间仅更新QFormer。通过引入指令感知的视觉特征提取和相应的指令,能够提取灵活多样的特征。 2. PandaGPT:是一种开创性的通用模型,能够理解6种不同模式(文本、图像/视频、音频、热、深度和惯性测量单位)的指令并根据指令采取行动。 3. PaLIX:使用混合VL目标和单峰目标进行训练,包括前缀完成和屏蔽令牌完成。这种方法对于下游任务结果和在微调设置中实现帕累托前沿都是有效的。 4. VideoLLaMA:引入了多分支跨模式PT框架,使LLMs能够在与人类对话的同时处理给定视频的视觉和音频内容,使视觉与语言以及音频与语言保持一致。 5. 视频聊天GPT:专门为视频对话设计的模型,能够通过集成时空视觉表示来生成有关视频的讨论。 6. Shikra:Chen等人介绍的一种简单且统一的预训练MMLLM,专为参考对话(涉及图像中区域和对象的讨论的任务)而定制,展示了值得称赞的泛化能力,可以有效处理看不见的设置。 7. DLP:提出PFormer来预测理想提示,并在单模态句子数据集上进行训练,展示了单模态训练增强MM学习的可行性。 8. Pegasus1:具有约800亿参数,可处理从10秒到数小时的视频内容。不仅能识别视频中的人物、物体、场景,还能理解背景音乐、对话等,并提供一系列API来满足不同的视频到文本转换需求。
2024-11-01
AI 辅助访谈过程分析与信息提取
以下是关于 AI 辅助访谈过程分析与信息提取的相关内容: 在“危柯宇:如何让 AI 走进我们的工作和生活”中,案例二“【调研达人秘籍】用 AI 破解信息迷阵,轻松收获深度报告(提效 10x)”提到了以下要点: 效益方面:通过清晰的 AI 工作流,能在短时间内完成深度调研,为决策提供有力支持。 AI 赋能调研工作流包括: 启动智库引擎:询问 AI 如何理解问题(参考截图一)。 搭建信息骨架:询问 AI 如何汇报内容(参考截图二)。 精准信息挖掘:向“秘塔 AI”定向搜索(参考截图三)。 信息融合与分析:让“Kimichat”综合分析(参考截图四和五)。 汇报成果精炼:整合分析结果,制作报告,分享实用调研工具(参考截图六和七)。 详情可查看上面的即刻链接。
2024-10-29
科学问题二:XXX(小标题) 问题挑战:如何通过构建合理的先验知识或模型假设,刻画出数据中的可变性?如何利用从少量样本中提取到的变化信息来预测未见数据的表现? XXX XXX(问题挑战一的方法) XXX)问题挑战二的方法) 请将XXX补充完整,重点在预测,如何刻画和利用数据分布的“变化性”
以下是为您补充完整的内容: 对于如何通过构建合理的先验知识或模型假设,刻画出数据中的可变性,以及如何利用从少量样本中提取到的变化信息来预测未见数据的表现,我们可以参考以下方法: 在准备 LLM 数据方面,对于制作 LLM 微调数据集,首先获取文本格式非结构式和网络式结构式的数据。对于 QA 数据集,主要依靠已有的大语言模型生成,根据不同文本设定不同的提示词以获取尽可能多且信息量丰富的 QA。先对文件中的文本进行切割,将每一大部分放进一个约 200 字的 txt 文件里,然后设定提示词模板。例如对于公司产品手册,模板可以是:“你是一个聪明的 xxx 公司的 xxx 产品的产品经理。给你一段 xxxxx 有限公司 xx 产品相关的文本,你必须依据文本想出十个不同的问题和这十个问题对应的答案。你想出的问题可以被用来测试公司内部 xxx 职员的专业能力。你想出的问题可以是使用公司产品的用户会想到的问题。你想出的问题和答案必须和所给文本相关。你回答得答案必须可以让使用产品的用户理解。当你想出问题和答案后,你必须用以下格式回复:```
2024-10-21
好用的图片无损高清放大
以下是关于图片无损高清放大的相关内容: 图像修复放大的流程分为三部分: 1. 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,因其处理时间长。 2. 图像高清修复:使用 Iceclear/StableSR 等模型进行高清修复并 2 倍放大,提示词应包含想要达到的目的内容,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。全程采取两次高清修复,第一次修复原始图像分辨率并放大。 3. 图像高清放大:针对第一次放大修复后的图像进行二次修复,用 realisticVision 底膜,使用提示词反推 node 对图像进行画面提示词提取,搭配 tile ControlNet 提升画面细节感,用合适的高清放大模型进行二次放大。 【SD】超清无损放大器 StableSR: 作者为白马少年,发布于 2023 年 6 月 10 日 20:01,原文网址:https://mp.weixin.qq.com/s/J0HIF2U1siAen6FWNA67A 。 之前讲过在 Stable Diffusion 中绘制高清大图的方式,主要用到“脚本”和“后期处理”,其中脚本以“Ultimate SD upscale”为主,会改变原图细节;“后期处理”是 Stable Diffusion 自带的扩图功能,适用于所有图片,可按原图内容扩图,但无法还原原图不清晰的地方。 今天讲的 StableSR 可算作“后期处理”的上位替代品,能在尽可能保留原图的情况下更精致地还原原图。安装方式:在扩展面板中搜索 StableSR 直接安装,或将下载好的插件放在“……\\sdwebuiakiv4\\extensions”文件夹下,安装完成后重启 webUI 即可在脚本中找到。 修复需使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹;StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹;VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。 测试:用一张网上找的分辨率为 512x768 的神仙姐姐照片,“Ultimate SD upscale”脚本放大哪怕重绘幅度只开到 0.1,人物细节有变化但磨皮严重,重绘幅度开到 0.4 则变化很大;“后期处理”放大 3 倍,眼神变锐利但头发仍模糊;StableSR 放大时,先调整大模型和 VAE,打开脚本下拉选择“StableSR”,模型选择对应模型,放大倍数为 3,勾选“pure noise”。
2024-11-12
幻海映月字体设计文字生成图片
以下是关于幻海映月字体设计文字生成图片的相关内容: Ideogram 2.0 工具教程: 1. 生成图像设置:将魔法提示设置为“关闭”,使用模型 v2.0。 2. 字体版权问题:Ideogram 的 AI 在生成图像时并非使用真实字体,而是通过学习大量文字图像及其外观和风格来生成类似特定风格或字体的文字。 3. 字体生成错误处理: 多次重新生成提示,看是否得到想要的文本。 使用编辑器修改文本、添加或删除部分,然后重新混合图像。 将较长、较复杂的单词更改为较短的同义词。 上传包含所需文本的图像,作为重新混合创建图像的起点和合成源。 4. 版本选择:使用 0.2 或 1.0 版本可能会更稳定。
2024-11-11
有什么特别好的AI识别图片的大模型API
以下是一些关于 AI 识别图片的大模型 API 相关的信息: 学习笔记《【这就是 ChatGPT】了解原理让大语言模型 AI 成为你的打工人》中提到,对于识别印刷体图片,会先将图片变成黑白、调整大小为固定尺寸,然后与数据库中的内容进行对比得出结论。但这种基于规则的方法存在多种局限,而神经网络专门处理未知规则的情况,在图片识别中具有优势。 搭建 OneAPI 可以汇聚整合多种大模型接口,方便后续更换使用各种大模型。 0 基础手搓的“AI 拍立得”概念旨在简化操作流程,提升效率。用户可以选择拍摄场景类型并立即拍照,AI 会自动识别和分析照片中的内容信息,依据预设场景规则迅速生成符合情境的反馈。其实现场景包括图片转成文本和图片转绘图片等。例如,图片转成文本时,大模型会根据选择的场景生成与内容相关的文字描述或解说文本。
2024-11-11
我希望用即梦来生成一张图片,我想要实现的效果是:空中有悬浮的大理石加金子材质的悬浮台。请协助我生成提示词
以下是为您生成的使用即梦生成空中悬浮的大理石加金子材质悬浮台图片的提示词相关步骤: 1. 工具选择:即梦、可灵、Runway、Suno、剪映。 即梦:是最简单易用的图片重绘工具,云端访问且无需付费。 可灵:具有极强的运动笔刷控制力。 Runway:能很好地实现泼墨和画面上色。 Suno:可尝试新的使用视频制作歌曲的效果。 2. 即梦使用步骤: 使用即梦的图片生成功能,上传同一张图片 2 次,一次选择边缘轮廓,一次选择人物姿势(或者单独使用边缘轮廓也可以)。 在此场景下,不要添加景深,否则会出现“文物感”效果,而非所需的写实风。 可稍微提升精细度,由于原图是竖版,选择竖版切割,所得图片更适合用作首尾帧。 3. Runway 提示词:Static shot:colorful paint splashed onto canvas,transforming into a vibrant,lifelike display 4. 可灵提示词:一个帅气地老头从鹿背上跳下来,释放法术,漂浮在空中,非常自信,非常帅气。鹿向左走出了画面(鹿没有走出画面,但漂浮效果不错,决定不再抽卡,保留这个版本)。 希望这些信息对您有所帮助。
2024-11-10
用AI怎么制作美女图片
以下是关于用 AI 制作美女图片以及判断图片是否为 AI 生成的相关内容: 用 AI 制作美女图片: 使用 AI 工具绘制好看的人像需要弥补相关知识。例如,麦橘的工作流包括使用聚片等工具进行微调,出图时要进行选择,且要有后期修图的思路。关键是要在脑海中形成对人体结构和妆容效果的概念,追求极致效果需要在细节处进行细化。此外,麦乐园举办了 AI 人像设计比赛,旨在发掘大家在 AI 人像方面的技能,并为优秀者提供机会。 判断一张图片是否 AI 生成: 1. 依赖艺术知识储备:对于名画,如果熟悉其风格、画质与笔触的表现力,能调用基础知识储备做出判断。 2. 细节决定成败:单纯判断一幅作品是否出自 AI 算法时,往往是“细节决定成败”。比如,在某些 AI 生成的图片中,人物主体的肢体可能存在异常,或者在特定风格的图片中,如穆夏的作品,真迹才能表现出严谨连续的背景花纹和顺次排列的底纹文字信息。 3. 参考著名画家的风格:列宾、穆夏等艺术史上著名画家的作品风格鲜明突出,很适合用作 AI 生图的风格参考。例如,基于列宾的真迹“伏尔加河上的纤夫”,让 AI 生成了相关仿画;挑选穆夏的代表作生成了多幅仿画。
2024-11-10