目前有一些 AI 工具可以实现把一个物体生成多个角度。例如,在图像生成方面,像 OpenAI 等机构的相关模型能够生成同一场景的多个角度,包括具有物理上准确的光线,甚至在某些情况下还能生成物理上准确的流体和雨水。
在生成 AI 人物形象时,也可以通过选择不同的拍摄角度来实现。常用的角度包括高角度、低角度和平视角度。
此外,人物构图的视角还可以按照相机相对于被拍摄对象的位置,分为正面、背面和侧面等不同方向。
另一项机器人学发展——这次来自特斯拉(2023年5月16日)。他们训练了他们的机器人“Optimus”去抓取物体——而且“没有进行特定任务的编程”。一切都是通过人类示范学习的。“这意味着我们现在可以快速扩展到许多任务。”再次强调:如果人类示范是先进机器人学性能所需的一切,那么一个在互联网上所有视频上训练的100万亿参数模型肯定能够实现惊人的机器人学性能...左边的图片展示了1万亿参数的GPT-4在图像识别方面的能力。其回应已经比许多人类所能想出的更加清晰和写得更好。那么,当你在互联网上所有可用数据的基础上训练一个比GPT-4大100倍、与人类大脑大小相当的模型时,会发生什么呢?重要:注意AI模型能够生成同一场景的多个角度,具有物理上准确的光线,甚至在某些情况下还能生成物理上准确的流体和雨水。如果你能生成具有准确、常识性物理的图像和视频,你就拥有了常识推理能力。如果你能生成常识,你就理解了常识。目前公开可用的视频和图像生成AI模型的质量水平示例。这些模型的大小不到100亿参数。当你在互联网上所有可用数据的基础上训练一个比这大10,000倍的模型,并赋予它生成图像和视频的能力时,会发生什么?(答案:图像和视频与真实事物完全无法区分,100%的时间,没有任何例外,没有任何解决方法,无论人们怎么努力,都无法分辨出区别)。-(更新:SORA来自GPT-5 Q* 2023模型)
什么是人物的角度选择呢?通俗来说就是拍摄的高度。不同的拍摄角度可以呈现出不同的情感和视觉效果,可以通过选择合适的拍摄角度可以突出被拍摄对象的特点,提高照片的表现力。一般常用的有这3种角度1.高角度:位于被拍摄对象的上方,适合拍摄俯视角度的场景,可以突出被拍摄对象的大小和高度。2.低角度:位于被拍摄对象的下方,适合拍摄仰视角度的场景,可以突出被拍摄对象的高度和威严感。3.平视角度:与被拍摄对象在同一高度,适合拍摄平面场景,可以突出被拍摄对象的水平线和平衡感。1.低角度位于被拍摄物体的下方,可以强调物体的高度感,适用于拍摄建筑物、树木等。咒语关键词:Low angle view生成思路:低角度的年轻女孩生成咒语:young girl,low angle view,--ar 16:9这次配合使用角度生成的结果的确也比之前单纯使用仰视角生成的结果要好很多了,没有出现人物对镜头的感觉了,图片整体实现的结果还是比较和谐的,那我们继续看一看其它的角度。2.高角度位于被拍摄物体的上方,可以强调物体的底部,适用于拍摄人群、城市等。咒语关键词:High angle view生成思路:高角度的年轻女孩生成咒语:young girl,high angle view,--ar 16:9从这次的生成结果上来看用俯视角+高角度生成的图片,要比单纯使用俯视角生成的结果更自然,更符合人物摄影的特征。3.平视角度位于被拍摄物体高度相同,呈现出一种中性的视角,适用于拍摄人像、风景等。咒语关键词:Eye level view生成思路:平视角度的年轻女孩生成咒语:young girl,eye level view,--ar 16:9
视角可以按照相机相对于被拍摄对象的位置,分为正面、背面和侧面。当然,拍摄角度不仅限于这三个方向,还可以有更多不同的角度选择,这需要根据被拍摄对象和拍摄需求来选择合适的角度。测试:不加入关键词的AI生成的图片会是什么样子?生成思路:年轻的女孩生成咒语:young girl,--ar 16:9通过随机生成的8张来看,由于没有其他关键词的约束,目前随机出来默认的人物形象偏欧美风,人物视角的比例偏差也都保持在了正面和侧面,那么我们现在可以通过增加构图视角的关键词来限定人物呈现的视角。我们来看看增加不同视角之后的样子吧。1.正视角正视角是指在人像构图时,拍摄对象正对着相机的姿态,使人像呈现出正面的视角。咒语关键词:Front view生成思路:正视角的年轻女孩生成咒语:young girl,front view,--ar 16:9通过随机生成的图片来看,由于受到正视角关键词的约束,目前随机出来人物都是偏正面的,结果相对来说是较好的,那么我们就继续来看一看其它的视角。2.后视角后视角是指从被摄对象的背后拍摄的视角,也就是以被摄对象的背部为主要构图元素的拍摄方式。这种视角可以营造出一种神秘或者引人遐想的氛围。咒语关键词:Back view angle & Back angle生成思路:后视角的年轻女孩生成咒语:young girl,back view angle,--ar 16:9