Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

什么是controlnet? controlnet有什么重要作用

Answer

ControlNet 是一种由斯坦福大学张吕敏发布的神经网络模型,常与预训练的图像扩散模型(如 Stable Diffusion)结合使用。

其重要作用包括:

  1. 实现对 AI 绘画生成过程的精细控制,通过引入如涂鸦、边缘图、姿势关键点、深度图、分割图、法线图等多种类型的额外条件输入来指导生成图像的内容。
  2. 工作原理是将 Stable Diffusion 模型的权重复制到 ControlNet 的可训练副本中,并使用外部条件向量训练副本,在不破坏原模型能力的前提下,通过小批量数据集训练实现对特定条件的学习。
  3. 设计思想提供了训练过程的鲁棒性,避免过度拟合,允许在小规模甚至个人设备上训练,架构具有强大的兼容性与迁移能力,可用于其他扩散模型,增强图像生成的多样性和可控性。
  4. 应用不限于 AI 绘画,还可用于图像编辑、风格迁移、图像超分辨率等多种计算机视觉任务,展现了在 AIGC 领域的广泛应用潜力。

在 Stable Diffusion 中,ControlNet 带来的最大改变是让输出结果能更好地被控制。其使用逻辑是通过预处理器将图片提取特征并转换为 AI 可识别的形式,再通过模型进行图像生成。在使用时,如启用 ControlNet 需点击 Enable,Preprocessor 指预处理器,Weight 可调整其在合成中的影响权重,Guidance strength 控制图像生成的前百分之多少步由 ControlNet 主导生成,Invert Input Color 可启动反色模式,RGB to BGR 可反转输入色彩通道信息,Low VRAM 为低显存优化,Guess Mode 为无提示词模式。同时,Model 中选择的解析模型应与输入图像或预处理器对应。

Content generated by AI large model, please carefully verify (powered by aily)

References

问:ControlNet 是什么?

ControlNet是一种神经网络模型,由斯坦福大学张吕敏发布,它与预训练的图像扩散模型(例如Stable Diffusion)结合使用,通过引入额外的条件输入来控制AI绘画的生成过程。ControlNet模型通过在Stable Diffusion模型中添加辅助模块,实现对生成图像的精细控制。这些条件输入可以是多种类型的图像,例如涂鸦、边缘图、姿势关键点、深度图、分割图、法线图等,它们作为条件输入来指导生成图像的内容。ControlNet的工作原理涉及将Stable Diffusion模型的权重复制到ControlNet的可训练副本中,并使用外部条件向量来训练这个副本。这样做的好处是,可以在不破坏Stable Diffusion模型原本能力的前提下,通过小批量数据集对ControlNet进行训练,从而实现对特定条件的学习。ControlNet的设计思想提供了训练过程中的鲁棒性,避免了模型过度拟合,并允许在小规模甚至个人设备上进行训练。此外,ControlNet的架构具有强大的兼容性与迁移能力,可以用于其他扩散模型中,增强了图像生成的多样性和可控性。ControlNet的应用不仅限于AI绘画,它还可以用于图像编辑、风格迁移、图像超分辨率等多种计算机视觉任务,展现了在AI生成内容(AIGC)领域的广泛应用潜力。内容由AI大模型生成,请仔细甄别类似问题:Transformer是什么?

【SD】最强控制插件ControlNet(1)附模型下载

Stable Diffusion一直在致力于更精确地控制出图结果,而在这众多的功能中,最突出的要属ControlNet了。无论是文生图还是图生图,我们更多的是对内容的一个描述,但是如果我们想要更细化一些,比如构图、轮廓、形象姿态、色彩风格等等,单靠文生图或者图生图就不够用了,我们需要一个更强大的控制模块,这时ControlNet也就应运而生。它带来的最大的改变,就是让输出结果能更好的被我们控制了。关于ControlNet插件的安装,如果是用的秋叶大佬的整合包,就会自带这个插件。如果没有,可以去扩展中搜索ControlNet进行安装。安装完成之后,就可以看到ControlNet的使用界面了。ControlNet的使用逻辑是通过预处理器将我们的图片提取特征,并转换为AI可识别的形式,再通过模型将预处理器的结果进行图像生成。说得再直白一点,预处理器就是我们和ControlNet之间的一款翻译软件。比如,我想绘制一张女孩打篮球的图片,并且想让她模仿库里的这个动作。接下来,输入关键词:(最好的质量,杰作),女孩,打篮球,篮球场,认真,球衣,看着观众,受伤,绷带。

SD新手:入门图文教程

点击Enable启用该项ControlNetPreprocessor指预处理器,它将对输入的图像进行预处理。如果图像已经符合预处理后的结果,请选择None。譬如,图中导入的图像已经是OpenPose需要的骨架图,那么preprocessor选择none即可。在Weight下,可以调整该项ControlNet的在合成中的影响权重,与在prompt中调整的权重类似。Guidance strength用来控制图像生成的前百分之多少步由Controlnet主导生成,这点与[:]语法类似。Invert Input Color表示启动反色模式,如果输入的图片是白色背景,开启它。RGB to BGR表示将输入的色彩通道信息反转,即RGB信息当做BGR信息解析,只是因为OpenCV中使用的是BGR格式。如果输入的图是法线贴图,开启它。Low VRAM表示开启低显存优化,需要配合启动参数“--lowvram”。Guess Mode表示无提示词模式,需要在设置中启用基于CFG的引导。Model中请选择想要使用解析模型,应该与输入的图像或者预处理器对应。请注意,预处理器可以为空,但模型不能为空。

Others are asking
用一句话解释什么是controlnet
ControlNet 是一种由斯坦福大学张吕敏发布的神经网络模型,常与预训练的图像扩散模型(如 Stable Diffusion)结合,通过引入如涂鸦、边缘图等多种类型的额外条件输入来控制 AI 绘画生成过程,其工作原理是在 Stable Diffusion 模型中添加辅助模块,实现对生成图像的精细控制,还具有训练鲁棒性、兼容性与迁移能力,不仅用于 AI 绘画,还可用于图像编辑等多种计算机视觉任务。使用时需注意相关设置和安装,如确保路径同步、选择合适的预处理器和模型等。
2024-12-23
什么是Controlnet
ControlNet 是一种由斯坦福大学张吕敏发布的神经网络模型,常与预训练的图像扩散模型如 Stable Diffusion 结合使用,用于控制 AI 绘画的生成过程。 其工作原理是将 Stable Diffusion 模型的权重复制到 ControlNet 的可训练副本中,并利用外部条件向量训练副本。条件输入类型多样,如涂鸦、边缘图、姿势关键点、深度图、分割图、法线图等,以此指导生成图像的内容。 ControlNet 具有以下特点和优势: 1. 设计思想提供了训练过程中的鲁棒性,避免过度拟合,允许在小规模甚至个人设备上训练。 2. 架构具有强大的兼容性与迁移能力,可用于其他扩散模型,增强图像生成的多样性和可控性。 其应用不仅限于 AI 绘画,还可用于图像编辑、风格迁移、图像超分辨率等多种计算机视觉任务,展现出在 AIGC 领域的广泛应用潜力。 在使用方面,如在 Stable Diffusion 中,无论是文生图还是图生图,ControlNet 能实现更细化的控制,如构图、轮廓、形象姿态、色彩风格等。使用逻辑是通过预处理器将图片提取特征并转换为 AI 可识别的形式,再通过模型进行图像生成。预处理器如同“翻译软件”。例如绘制女孩模仿库里打篮球的图片,输入关键词和选择相应预处理器、模型等操作后即可生成。 在 Stable Diffusion 中使用 ControlNet 时,要注意一些设置,如确保 ControlNet 设置下的路径与本地 Stable Diffusion 的路径同步。基本流程包括点击 Enable 启用,选择预处理器,调整权重、控制生成步骤、反色模式等,还需根据情况选择合适的模型。
2024-11-24
controlnet教程
以下是关于 ControlNet 的教程: ControlNet 是 Stable Diffusion 中的一个功能,能够让用户更精确地控制出图结果。比如可以控制人物的动作、建筑物的线条等。 在使用时,大模型和关键词正常填写生成所需照片。然后鼠标滑到最下面点击“ControlNet”: 1. 点击空白处上传指定姿势的照片。 2. 点击“启用”。 3. 在“预处理器”和“模型”里选择“openpose”,这用于让计算机识别人物姿势。 接着点击“预览预处理结果”,原照片右边会出现人物姿势的线条,最后点击生成照片即可得到指定姿势的图片。 另外,如果是用秋叶大佬的整合包,会自带 ControlNet 插件。若没有,可去扩展中搜索安装。 其使用逻辑是通过预处理器将图片提取特征并转换为 AI 可识别的形式,再通过模型进行图像生成。例如绘制女孩打篮球模仿库里动作的图片,输入相关关键词,选择大模型,在 ControlNet 中导入库里照片,选择合适的预处理器和模型,调试参数后生成。 在 ControlNet 中还可以尝试不同的预处理器,如 softedge_pidinet、depth、canny、tile 等,可能会得到不错的效果。同时要注意电脑配置,避免出现显存不足等问题。
2024-10-18
controlnet一直加载怎么办
ControlNet 一直加载可能由以下原因导致及对应的解决方法: 1. 模型版本问题:确保 checkpoint、ContalNet 等所有需要加载模型的版本均基于 SD1.5,否则可能会报“超出索引”的错误。 2. 节点未安装完全:载入工作流后若出现爆红部分,可能是节点没下好、没下全。此时可以先全部更新,让所缺节点“显露出来”,然后安装好缺失的节点。 3. 参数设置问题:假如右下角的区域报红,那么就得根据报错信息相应调整一下左上角蓝色区域的 h、w 参数。 此外,ControlNet 还有一些新的功能和应用,例如: 1. 1.1 版本新出的 lineart 线稿提取功能,可先通过 invert 预处理将白底黑线处理成黑底白线,然后切换到 lineart 预处理器和模型进行生成。 2. mlsd 直线线条检测功能,一般用在建筑或者室内设计上,预处理器可提炼出室内的结构线。 ComfyUI 中的 ControlNet 高级控件: 在时间步和批处理潜变量之间调度 ControlNet 强度的节点,以及应用自定义权重和注意力掩码。这里的 ControlNet 节点完全支持滑动上下文采样。输入包括 positive(提示词(正面))、negative(提示词(负面))、control_net(加载了控制网络)、image(用于指导控制网络的图像)、mask_optional(应用于控制网络的注意力掩码)、timestep_kf(时间步关键帧)、latent_kf_override(潜在关键帧的覆盖)。
2024-08-29
ControlNet是什么?
ControlNet是一种神经网络模型,由斯坦福大学张吕敏发布,它与预训练的图像扩散模型(例如Stable Diffusion)结合使用,通过引入额外的条件输入来控制AI绘画的生成过程。ControlNet模型通过在Stable Diffusion模型中添加辅助模块,实现对生成图像的精细控制。这些条件输入可以是多种类型的图像,例如涂鸦、边缘图、姿势关键点、深度图、分割图、法线图等,它们作为条件输入来指导生成图像的内容。 ControlNet的工作原理涉及将Stable Diffusion模型的权重复制到ControlNet的可训练副本中,并使用外部条件向量来训练这个副本。这样做的好处是,可以在不破坏Stable Diffusion模型原本能力的前提下,通过小批量数据集对ControlNet进行训练,从而实现对特定条件的学习。 ControlNet的设计思想提供了训练过程中的鲁棒性,避免了模型过度拟合,并允许在小规模甚至个人设备上进行训练。此外,ControlNet的架构具有强大的兼容性与迁移能力,可以用于其他扩散模型中,增强了图像生成的多样性和可控性。 ControlNet的应用不仅限于AI绘画,它还可以用于图像编辑、风格迁移、图像超分辨率等多种计算机视觉任务,展现了在AI生成内容(AIGC)领域的广泛应用潜力。
2024-04-28
即梦ai里,关于智能画布中的参考图的具体作用
在即梦 AI 中,智能画布中的参考图具有以下重要作用: 1. 实现多种商业创意设计:只需上传一张参考图,就能快速生成多种创意设计,例如模特图的变装、换发型、换脸、换发色和调整人物姿势;产品图的材质和背景改变;电商海报的背景、元素更改等。 2. 提升设计的灵活性和可塑性:在奶茶宣传图的制作中,参考图在制作步骤中发挥了关键作用,如在第 1 步找参考图,为后续的生成和融合等操作提供基础。 基础操作包括: 1. 打开即梦官网 https://jimeng.jianying.com/ 。 2. 选择图片生成。 3. 选择导入参考图(上传一张参考图,点击智能参考)。 相关案例: 1. 模特图自由定制:通过智能参考,轻松实现模特图的多种变化。 2. 产品图随心变化:可以改变产品材质和画面背景。 3. 电商海报一键搞定:支持随意更改背景、元素,适应不同营销主题。 原文链接:https://mp.weixin.qq.com/s/sD0RFMqnFZ6Bj9ZcyFuZNA
2025-02-17
即梦ai里,关于智能画布中的参考图的具体作用
在即梦 AI 中,智能画布中的参考图具有以下重要作用: 1. 实现多种商业创意设计:只需上传一张参考图,就能快速生成多种创意设计,例如模特图的变装、换发型、换脸、换发色和调整人物姿势;产品图的材质和背景改变;电商海报的背景、元素更改等。 2. 提升设计的灵活性和可塑性:在奶茶宣传图的制作中,参考图在制作步骤中发挥了关键作用,如在第 1 步找参考图,为后续的生成和融合等操作提供基础。 基础操作包括: 1. 打开即梦官网 https://jimeng.jianying.com/ 。 2. 选择图片生成。 3. 选择导入参考图(上传一张参考图,点击智能参考)。 相关案例: 1. 模特图自由定制:通过智能参考,轻松实现模特图的多种变化。 2. 产品图随心变化:可以改变产品材质和画面背景。 3. 电商海报一键搞定:支持随意更改背景、元素,适应不同营销主题。 原文链接:https://mp.weixin.qq.com/s/sD0RFMqnFZ6Bj9ZcyFuZNA
2025-02-17
你是谁,你有什么作用
我是一名 AI 知识专家,能够为您提供全面的 AI 知识指导,解决您在 AI 领域的疑问和问题,并帮助您实现在 AI 领域的目标。以下是一些具体的示例: 在提示词方面,比如新闻文章的事实核查员,需要区分事实和观点,确定其是否一致,并用特定的格式和流程进行处理。 在游戏实操中,利用 LLM 进行环境叙事和解谜,像在《Im Here2》中设计提示词,为玩家提出谜题并根据回答给予相应的反馈和线索。 在声线制作方面,为不同角色设定特定的声线描述,如城市居民 B、橘猫、绵羊、泡泡鱼等。
2025-02-09
现在ai在生活中的作用
AI 在生活中的作用广泛且多样,以下是一些主要方面: 1. 医疗保健: 医学影像分析,辅助诊断疾病。 加速药物研发,识别潜在药物候选物和设计新治疗方法。 提供个性化医疗方案。 控制手术机器人,提高手术精度和安全性。 2. 金融服务: 识别和阻止欺诈行为,降低风险。 评估借款人信用风险,辅助贷款决策。 分析市场数据,辅助投资决策。 提供 24/7 客户服务,回答常见问题。 3. 零售和电子商务: 分析客户数据,推荐可能感兴趣的产品。 改善搜索结果,提供个性化购物体验。 根据市场需求动态调整产品价格。 提供聊天机器人服务,解决客户问题。 4. 制造业: 预测机器故障,避免停机。 检测产品缺陷,提高产品质量。 优化供应链,提高效率和降低成本。 控制工业机器人,提高生产效率。 5. 交通运输: 开发自动驾驶汽车,提高交通安全性和效率。 优化交通信号灯和交通流量,缓解拥堵。 优化物流路线和配送计划,降低运输成本。 实现无人机送货,将货物送达偏远地区。 6. 其他领域: 教育领域,提供个性化学习体验。 农业领域,分析农田数据,提高农作物产量和质量。 娱乐领域,开发虚拟现实和增强现实体验。 能源领域,优化能源使用,提高能源效率。 总之,AI 的应用场景还在不断扩展,未来将对我们的生活产生更加深远的影响。
2025-02-08
一、学习内容 1. AI工具的操作:了解并掌握至少一种AI工具的基本操作,如智能代码、流程管理、智能报表、数据分析、图像识别、文字生成等。 2. AI工具在本职工作的应用:思考并提出AI工具如何帮助你更高效地完成本职工作,包括但不限于提高工作效率、优化工作流程、节约成本、提升交付质量等。 3. AI工具在非本职工作的潜力推演:探索AI工具如何在你的非本职工作领域发挥作用,比如在公司管理、团队领导、跨部门合作、团队发展以及市场研究等方面。提出这些工具如何被有效利用,以及它们可能带来的改
以下是关于学习 AI 的相关内容: 一、AI 工具的操作 要了解并掌握至少一种 AI 工具的基本操作,如智能代码、流程管理、智能报表、数据分析、图像识别、文字生成等。 二、AI 工具在本职工作的应用 思考并提出 AI 工具如何帮助更高效地完成本职工作,包括但不限于提高工作效率、优化工作流程、节约成本、提升交付质量等。 三、AI 工具在非本职工作的潜力推演 探索 AI 工具在非本职工作领域,如公司管理、团队领导、跨部门合作、团队发展以及市场研究等方面的作用,思考如何有效利用这些工具以及它们可能带来的改变。 四、学习路径 1. 对于不会代码的学习者: 20 分钟上手 Python+AI,在 AI 的帮助下可以完成很多基础的编程工作。若想深入,需体系化了解编程及 AI,至少熟悉 Python 基础,包括基本语法(如变量命名、缩进等)、数据类型(如字符串、整数、浮点数、列表、元组、字典等)、控制流(如条件语句、循环语句)、函数(定义和调用函数、参数和返回值、作用域和命名空间)、模块和包(导入模块、使用包)、面向对象编程(类和对象、属性和方法、继承和多态)、异常处理(理解异常、异常处理)、文件操作(文件读写、文件与路径操作)。 2. 新手学习 AI: 了解 AI 基本概念,建议阅读「」部分,熟悉术语和基础概念,浏览入门文章。 开始 AI 学习之旅,在「」中找到为初学者设计的课程,推荐李宏毅老师的课程,也可通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习并获证书。 选择感兴趣的模块深入学习,掌握提示词技巧。 实践和尝试,理论学习后通过实践巩固知识,在知识库分享实践作品和文章。 体验 AI 产品,如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人,了解其工作原理和交互方式。 五、工具推荐 1. Kimi 智能助手:ChatGPT 的国产平替,上手体验好,适合新手入门学习和体验 AI。不用科学网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,对长文理解做得好,能一次搜索几十个数据来源,无广告,能定向指定搜索源(如小红书、学术搜索)。 PC 端: 移动端(Android/ios): 2. 飞书:汇集各类 AI 优质知识库、AI 工具使用实践的效率工具,助力人人成为效率高手。
2025-02-07
AI智能体是什么?有什么作用?主要运用场景有哪些?
AI 智能体是一种能够自主感知和行动的系统,类似于 AI 机器人小助手。 其作用在于能够弥补大模型的不足,例如无法回答私有领域问题、无法及时获取最新信息、无法准确回答专业问题等。 主要运用场景包括: 1. 私有领域知识问答:准备好相关知识库文件,创建私有领域知识问答应用,如公司制度、人员信息等方面。 2. 个性化聊天机器人:提供长期记忆功能,保存关键历史对话信息,集成夸克搜索和图像生成等插件,提供个性化聊天体验。 3. 智能助手:引入 RAG(检索增强生成)能力、长期记忆和自定义插件等功能,帮助提升工作效率,如处理邮件、撰写周报等。 在其他领域也有重要应用,如: 1. 自动驾驶:感知周围环境,做出驾驶决策。 2. 家居自动化:根据环境和用户行为自动调节智能家居设备。 3. 游戏 AI:游戏中的对手角色和智能行为系统。 4. 金融交易:根据市场数据做出交易决策。 5. 客服聊天机器人:通过自然语言处理与用户互动,提供自动化的客户支持。 6. 机器人:各类机器人中集成的智能控制系统。 设计和实现一个智能体通常涉及定义目标、设计感知系统、定义决策机制、设计行动系统以及学习与优化等步骤。智能体在现代计算机科学和人工智能领域是一个基础且重要的概念,其技术的不断发展和应用正在改变我们的生活方式和工作模式。
2025-02-07
有没有形容在ai应用中 数据很重要的图
在 AI 应用中,数据具有极其重要的地位,主要体现在以下几个方面: 1. 训练过程:计算机通过数据进行自我学习,每一层节点代表的含义由数据决定,数据的质量和偏差会直接影响 AI 学习结果。 2. 模型效果:高质量的数据如同精炼后的汽油,能极大提升模型效果。而国内中文互联网数据质量相对较低,获取高质量数据困难,存在“垃圾进,垃圾出”的问题。 3. 企业应用:企业应确保数据的多样性与真实性,进行数据审查和多源验证,避免历史偏见被放大。很多企业虽认识到数据重要,但数据梳理是漫长枯燥的过程。 4. 避免陷阱:要警惕数据陷阱和新的信息茧房,避免因数据问题导致决策失误。
2025-02-17
我想了解diffusion技术相关的重要论文
以下是一些与 diffusion 技术相关的重要论文: 《HighResolution Image Synthesis with Latent Diffusion Models》:https://arxiv.org/abs/2112.10752 《Denoising Diffusion Probabilistic Models》:作者为 Ho、Jain、Abbeel,出自 Berkeley (2020)
2025-02-16
什么是提示词工程?有什么重要作用?普通人学习提示词工程的意义有哪些
提示词工程是人工智能领域,特别是在自然语言处理和大型语言模型的背景下的一个相对较新的概念。 它涉及设计和优化输入提示,以引导 AI 模型生成特定类型的输出或执行特定的任务。其关键点包括精确性、创造性、迭代以及对上下文的理解。 提示词通常指直接输入到 AI 模型中的问题、请求或指示,是提示工程的一部分。而提示工程是一个更广泛的概念,不仅包括创建提示词,还涉及理解模型的行为、优化提示以获得更好的性能,以及创造性地探索模型的潜在应用。 例如,通过简单的提示词可以获得大量结果,但结果质量与提供的信息数量和完善度有关。一个提示词可以包含指令、问题、上下文、输入或示例等元素,以更好地指导模型获得更好的结果。像在 OpenAI 的相关模型中,可以使用不同角色来构建 prompt。从示例中可以看出,语言模型能基于给出的上下文内容完成续写,通过改进提示词能获得更好的结果。 对于普通人来说,学习提示词工程具有以下意义: 1. 能够更好地与 AI 模型进行交互,获得更符合需求的结果。 2. 有助于提升在文本概括、数学推理、代码生成等各种高级任务中的效率和质量。 3. 加深对大型语言模型能力和局限性的理解,从而更有效地利用相关技术。 提示工程指南是由 DAIR.AI 发起的项目,旨在帮助研发和行业内相关人员了解提示工程,传播 AI 技术和研究成果。研究人员可利用提示工程提升大语言模型处理复杂任务场景的能力,开发人员可通过其设计、研发强大的工程技术,实现和大语言模型或其他生态工具的高效接轨。提示工程包含了与大语言模型交互和研发的各种技能和技术,在实现和大语言模型交互、对接,以及理解其能力方面都起着重要作用,还能用于提高模型的安全性,借助专业领域知识和外部工具来增强模型能力。
2025-02-06
在现阶段的GPT发展下,与AI交流提示词还重要吗
在现阶段的 GPT 发展下,与 AI 交流的提示词仍然非常重要。以下是一些原因: 1. 目标明确:对于 GPT 及其他 AI 来说,明确每一步的目标至关重要。只有给予清晰的指导,AI 才能产生相关且有价值的输出。 2. 逻辑性:在各种提示策略中,逻辑性都是关键。清晰、结构化的提示有助于 AI 更有效地生成输出。 3. 分步骤:无论是进行深度分析还是遵循特定结构,确保提示按照清晰的步骤进行极为重要。 4. 考虑变量:这在某些提示策略中尤其重要,需要考虑可能影响结果的所有因素。 例如,在运用 CoD 将文章做摘要的实验中,个人观点认为以英文提示词最后加上中文输出的方式效果较好,并且密度等级 4 的结果较让人满意。同时,LangGPT 框架的出现也表明随着新一代模型的发布,提示词的重要性日益凸显,其编写过程逐渐成为一种编程语言。但也有人认为框架在协助的同时也有限制,提示词带来的收益并非如宣传所说,其重要性会朝两极分化。
2025-01-07
AI for social science 有哪些重要的资源
以下是一些关于 AI for social science 的重要资源: 1. 《人工智能权利法案蓝图》:其中提到了公民权利、公民自由和隐私方面的内容,包括言论自由、投票自由以及免受歧视、过度惩罚、非法监视和侵犯隐私等,还涉及机会均等和获取关键资源或服务等方面。 2. AGI 万字长文(下)| 2024,分叉与洪流:如果从“AGI 已经出现”的阴谋论出发,AGI 所需要的基本资源无法回避,在能源领域,如可控核聚变技术,在 AI 的协助下有了一定进展。 3. 4.5.2016 EN:通过耦合注册表中的信息,研究者能够在诸如心血管疾病、癌症和抑郁症等广泛的医疗状况方面获得极有价值的新知识。在社会科学领域,基于注册表的研究使研究者能够获得关于失业、教育等一系列社会状况与其他生活状况的长期相关性的重要知识。通过注册表获得的研究结果提供了坚实、高质量的知识,可为基于知识的政策的制定和实施提供基础,提高许多人的生活质量,并提高社会服务的效率。
2024-12-10
最近一个月最重要的AI动态
以下是最近一个月的一些重要 AI 动态: 2024 年 4 月第二周:谷歌发布了一堆 AI 能力和升级,AI 音乐生成工具 Udio 发布,Open AI 发布 GPT4 Turbo 正式版,AI 画图应用 Ideogram 发布模型更新。 2024 年 4 月第三周:Meta 正式发布 Llama3 8B、70B 模型,Open AI 的 Assistants API 更新等,Reka Core 发布,一个 GPT4 级别的多模态 LLM,Mixtral8X22B 模型开源。 2024 年 4 月第四周:Open AI 的动态包括企业服务、起初研究和 ChatGPT 体验优化。 2024 年 5 月第一周:Claude 推出移动应用以及团队版计划,突然爆火的两款 SD 图像风格,亚马逊推出了 Amazon Q AI 助手。 2024 年 5 月第二周:Open AI 高强度预热发布会,Open AI 宣布和 Stack Overflow 达成合作,Controlnet 作者敏神发布 ICLight 光线融合生成项目。 此外,在过去的一段时间里,人工智能行业发展迅速。在过去 12 个月里,人工智能行业是重要的技术发展之一。从 2022 年 9 月到 2023 年 8 月,研究的工具访问量大幅增长。这一飞跃从去年 11 月 ChatGPT 成为最快达到 100 万用户的平台开始,炒作持续攀升,直到 2023 年 5 月达到峰值,之后虽有回落,但人们的兴趣仍然巨大。 另外,关于如何使用 AI 做事,目前似乎没有完善的用户文档,相关指南多通过 Twitter 影响者获得。作者基于自身经验为学生和读者准备的人工智能入门指南也需不断修改。
2024-11-15