Chat with Wiki - 生成图片

Answer

以下是关于生成图片的相关内容：

PS Beta 版本 Firefly Image 3 模型：

生成图像：局部生成图像自然，英文关键词生成结果比中文好。
参考图像：产品外形还原不像，颜色还原较好。
调整画笔：功能多且实用。
生成类似的内容：右侧可选择，效果还行。
生成背景：有添加背景的 3 种方式，包括生成背景、导入背景、油漆桶，效果各有特点，自动生成的图片质量不高，部分细节处理较好。
增强细节：生成蝴蝶后点击左上角增强细节图标，效果不明显但有一定清晰作用。

全国首例 AI 生成图片著作权案例：

Stable Diffusion 模型根据文本指令生成图片，取决于使用者输入的提示词，非排列组合工作模式，难以出现完全相同的两张输出图片，类似于画笔，构造图画取决于使用者设计。
人工智能不具备自由意志，李某通过增删提示词、修改参数得出不同图片并选定，体现其投入智力和独创思想，如同使用相机拍摄调节参数，案例中法官承认此类依靠使用者输出设计生成的图片属于美术作品，受著作权保护。
法律适用：《中华人民共和国著作权法》第三条和《中华人民共和国著作权法实施条例》第四条相关规定。

Stable Diffusion（SD）核心基础知识：

文本生成图像：输入 prompt 输出图像，包括 Load Checkpoint 模块初始化模型结构、CLIP Text Encode 控制图像生成、Empty Latent Image 初始化高斯噪声、KSampler 调度算法及相关生成参数、VAE Decode 转换生成图像。
图片生成图片：输入图像和 prompt 输出图像，与文本生成图像过程相比，预处理阶段先添加噪声到隐空间特征，通过去噪强度控制噪音加入量。

Content generated by AI large model, please carefully verify (powered by aily)

References

PS Beta版本Firefly lmage 3 模型超强更新

局部生成图像看着挺自然中文关键词（逼真的火烈鸟在一个游泳池与反射，中世纪的现代房子在黄色，山背景）英文关键词（photorealistic flamingo in aswimming pool with reflection,mid-century modern house in yellow,mountains irthe background.The better you describe what you want to generate,the closer theresults will be to what you envisioned.）英文关键词生成的结果比中文好。[heading2]2.参考图像[content]产品外形还原的不像，对颜色还原的倒是挺好的。[heading2]3.调整画笔[content]功能很多，试了下很实用，我很喜欢这个功能。[heading2]4.生成类似的内容[content]这开始右侧变化可以选择生成类似的内容，看着效果还行。[heading2]5.生成背景[content]添加背景的3种方式先移动除背景无法自动扣出投影的透明区域，（其实就是自动扣图并添加蒙版的功能），带有透明度和背景的还是自己抠吧。第一种生成背景效果还凑合吧，因为ps生成的图片质量不是很高。（因为这里投影没有手动抠，不带透明度，背景你换其他颜色一下子就暴露了）还是会有一些细节的处理，比如沿着瓶子边缘生成的泡沫就是比较合理第2种导入背景没什么说的，就是直接拉一个自己准备的背景到ps里。第3种—油漆桶其实就是自动添加了颜色图层，没啥好说的。[heading2]5.增强细节[content]先生成一个蝴蝶点击左上角的-增强细节图标效果不是很明显，是清晰了点。右边是增强的

全国首例AI生成图片著作权案例解读：探索AI作品知识产权保护之路

1.Stable Diffusion模型可以根据文本指令，利用文本中包含的语义信息与图片中包含的像素之间的对应关系，生产与文本信息匹配的图片，并不是通过搜索引擎调用已有的现成图片，也不是将软件设计者预设的各种要素进行排列组合。说明其生成的图片是什么样子完全取决于使用者输入什么样的提示词，在非排列组合的工作模式下难以出现完全相同的两张输出图片。它就类似于画笔，仅负责提供线条、色彩，而要构造出一幅什么样的图画取决于使用者自己的设计。2.人工智能并不具备自由意志。也就是说，利用人工智能时，其并不具有独自优化的能力，李某根据自己的审美个性，通过增删提示词、修改相关参数，得出了不同的图片，最后选定，完全体现出本质上是李某在利用这个工具创作，在投入自己的智力以及独创思想。就像人们使用照相机拍摄，为了排出漂亮的照片会调节参数、选取角度光线等，体现个人对作品的创作理念。案例中法官承认这样依靠使用者的输出设计生成的图片属于美术作品，具有独创性和智力投入，受到著作权的保护，达到了鼓励创作的目的。在当下技术背景与现实下，给艺术创作提供了有力的支持以及新的创作思路。利用新兴智能工具，把自己的独创性思想转化为现实作品，极大地节省了创作成本。法律适用：《中华人民共和国著作权法》第三条：本法所称的作品，是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。《中华人民共和国著作权法实施条例》第四条：著作权法和本条例中下列作品的含义：(八)美术作品，是指绘画、书法、雕塑等以线条、色彩或者其他方式构成的有审美意义的平面或者立体的造型艺术作品。（2）AI软件使用者享有生成图片的著作权案例中该人工智能软件生成的图片应由谁来享有该图片的著作权，谁是它法律意义上的作者呢？

教程：深入浅出完整解析Stable Diffusion（SD）核心基础知识 - 知乎

输入：prompt输出：图像其中Load Checkpoint模块代表对SD模型的主要结构进行初始化（VAE，U-Net），CLIP Text Encode表示文本编码器，可以输入prompt和negative prompt，来控制图像的生成，Empty Latent Image表示初始化的高斯噪声，KSampler表示调度算法以及SD相关生成参数，VAE Decode表示使用VAE的解码器将低维度的隐空间特征转换成像素空间的生成图像。[heading3]5.2图片生成图片[content]输入：图像+prompt输出：图像其中Load Checkpoint模块代表对SD模型的主要结构进行初始化（VAE，U-Net），CLIP Text Encode表示文本编码器，可以输入prompt和negative prompt，来控制图像的生成，Load Image表示输入的图像，KSampler表示调度算法以及SD相关生成参数，VAE Encode表示使用VAE的编码器将输入图像转换成低维度的隐空间特征，VAE Decode表示使用VAE的解码器将低维度的隐空间特征转换成像素空间的生成图像。与文字生成图片的过程相比，图片生成图片的预处理阶段，先把噪声添加到隐空间特征中。我们设置一个去噪强度（Denoising strength）控制加入多少噪音。如果它是0，就不添加噪音。如果它是1，则添加最大数量的噪声，使潜像成为一个完整的随机张量，如果将去噪强度设置为1，就完全相当于文本转图像，因为初始潜像完全是随机的噪声。去噪强度（Denoising strength）控制噪音的加入量