Pony 类作图大模型可能并非一个常见或明确的特定模型名称。但在相关领域中,有以下几种常见的作图大模型:
可图大模型是由快手可图团队开发的基于潜在扩散的大规模文本到图像生成模型。Kolors在数十亿图文对下进行训练,在视觉质量、复杂语义理解、文字生成(中英文字符)等方面,相比于开源/闭源模型,都展示出了巨大的优势。同时,Kolors支持中英双语,在中文特色内容理解方面更具竞争力。更多的实验结果和细节请查看我们的[技术报告](https://github.com/Kwai-Kolors/Kolors/blob/master/imgs/Kolors_paper.pdf)。
预处理器:canny模型:control_v11p_sd15_canny预处理器:lineart_standard(from white bg & black line),模型:control_v11p_sd15_lineart[heading3]4、放大高清大图[content]Multi Diffusion + Tiled VAE + ControlNet Tile模型将生成的图片发送到图生图,会把关键词种子一并发送过去重绘幅度建议0.35太高图片细节发生变化,
机器之心原创作者:泽南、杨文字节豆包大模型又又又上新了!11月11日,字节跳动豆包大模型团队推出了最新图像编辑模型SeedEdit,主打一句话轻松P图。它是国内首个产品化的通用图像编辑模型,无需描边涂抹,仅使用简单的自然语言,就能换背景、转风格,或者在指定区域进行元素的增删和替换。比如,输入Prompt「把老婆饼换成驴打滚」,SeedEdit立马锁定修改目标,完成美食替换:(Prompt:把老婆饼换成驴打滚)要知道,「老婆饼」、「驴打滚」等中国美食曾「骗」倒一众大模型,但SeedEdit能精准理解复杂指令,不仅看得懂中英文提示词,还对成语和专有名词「门儿清」。再比如,在不「误伤」原图细节的情况下,把草莓换成柠檬:(Prompt:把草莓换成柠檬)甚至可以让油画里戴珍珠耳环的少女张大嘴巴啃汉堡:(Prompt:戴珍珠耳环的少女吃汉堡)在处理玻璃裂纹、发丝等精细涂抹区域时,SeedEdit同样能够保持原图的完整性:(Prompt:移除玻璃裂纹,干净画面)此外,作为一款通用图像编辑模型,它不仅具备单次编辑的能力,还支持多轮操作,能够让用户对同一图像进行连续的创意编辑。比如,让一个二次元女孩换上骑士装、戴上牛仔帽、改变动作、增加背景,最后「Pia」一下变身酷飒火枪手: