Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有没有ai调色的大模型

Answer

以下为您介绍一些有关 AI 调色的大模型:

  1. 在最近新上线的 controlnet 模型中,新增了名为 Recolor 的模型,可将黑白图片重新上色。在处理人物照片还原时,可选择 realisian 的写实大模型,通过提示词描述颜色和对应内容。ControlNet 选择 Recolor 时,预处理器选择“recolor_luminance”效果较好。
  2. 星流一站式 AI 设计工具的基础模型中,允许使用更多的微调大模型,如基础模型 F.1、基础模型 XL、基础模型 1.5 等。同时,还具有高清分辨率修复、脸部/手部修复等功能,以及多种参数如采样器、采样步数、随机种子、CFG Scale 等可调整。
  3. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。处理复杂照片时,可放弃人物服装颜色指定,只给场景方向,如加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,通过简单关键词控制色调。
Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】用AI给老照片上色,岁月不改它模样

作者:白马少年介绍:SD实践派,出品精细教程发布时间:2023-09-10 19:00原文网址:https://mp.weixin.qq.com/s/-hlnSTpGMozJ_hfQuABgLw在最近新上线的controlnet模型中,除了我们之前测试过的一众适配sdxl的模型以外,还增加了一款名为Recolor的新模型,它的作用是可以将黑白的图片进行重新上色。看到这个功能,我首先想到的就是可以用它来修复那些已经年代久远的老照片。毕竟在以前那个年代,没有现在这种可以永远保存的数码拍照技术,很多洗出来的照片也都随着岁月的流逝而褪去了色彩。如果能用AI技术恢复这些往日的时光,也许能唤醒我们心底的一些温暖。于是,我联系爸妈帮我找来了一些他们珍存的照片。他们也很热心于这件事情,立马给我发来了一大堆照片,其中有很多我也没见过的他们年轻的时候的样子,还包括我爷爷奶奶外公外婆那一辈的回忆。虽然很多照片都是黑白的,但是仍然能感受到那个时候的阳光和清风。这是我的奶奶,她离开已经有十几年了,年轻时候留下的照片不多,这一张算是保存得很好的了,那个年代的人物照片总能让人感受到一种独特的气质。既然是人物照片的还原,我这里就选择了realisian的写实大模型。提示词直接描述颜色和对应的内容。比如黑色的头发、黄色的皮肤、深蓝色的衣服、浅蓝色的背景。因为黑白照片,颜色无从判断,所以有些只能靠猜测了。ControlNet这里选择Recolor,预处理器有两个,经过我的测试,选择“recolor_luminance”的效果会更好一些。

星流一站式 AI 设计工具

点击生成器下方的切换按钮进行切换|与入门模式相比增加了|高级模式框架||-|-||基础模型:允许使用更多的微调大模型<br><br>图片参考:允许使用更多的图像控制功能<br>星流基础大模型下,增加了tile分块与softedge线稿<br><br>切换不同的系列的基础模型可以使用与之配套的图像控制功能<br>基础模型F.1<br><br>基础模型XL<br><br>基础模型1.5<br><br>高清分辨率修复:利用算法对初步生成的图像进行简单的图生图高清放大(目前仅支持基础模型xl和1.5模型)<br><br>放大算法:影响图像放大后的图像质量,建议默认即可<br>重绘幅度:与初步生成的图像的相似度<br>其他参数默认即可<br>参数:允许调整更多的高级参数<br><br>采样器:采样方法决定了模型在生成图像过程中的出图质量,有些采样器在细节处理上表现更佳比如DPM++2M,而有些则在生成速度上更快,比如Euler。<br>采样步数:一般来说,步数越多,模型对图像的生成和优化越充分,但同时也会增加生成时间。<br>随机种子:文生图的随机数种子是一个用于生成过程的整数值。通过设置相同的随机数种子,可以确保在相同的参数配置下生成相同的图像。<br>CFG Scale:控制生成图像与提示词一致性的重要参数。<br>脸部/手部修复:利用算法对人像的脸部或者手部进行修复<br>||

【SD】用AI给老照片上色,岁月不改它模样

启用MutiDiffusion插件,不开放大倍数,仅使用分块渲染的功能,能帮助我们在显存不够的情况下,将图片放大到足够的倍数。好了,经过一顿操作,我们就将这张图片处理完成了。对比一下看看,之前的黑白照片和经过上色高清化完成之后效果。同样的步骤,又还原了一张我妈妈的照片。在问到她当时穿的什么颜色衣服的时候,她记得可清楚了,想都没想就告诉我说是绿色的。这两张还算容易的,接下来就遇到比较棘手的照片了。比如这一张,是我外公外婆带着我妈和我舅舅。外公走得更早,我甚至都没见过一面,只有这些照片还记录着他存在的痕迹。而这张照片也有些年头了,一直被外婆好好保存着。人物多、场景复杂,像素非常的低,使得这张照片处理起来难度很大。我首先在ps里面进行了一下角度的调整和照片的裁切,然后使用刚才的步骤进行上色,但是直接上色的结果有点像是加了一层黄色滤镜,有颜色但是年代感还是太强了。而太具体的颜色指定,又容易让画面污染严重,因为内容实在太多了,光是指定衣服就得十来个颜色提示词,AI能分辨得清才怪。所以我决定放弃人物服装的颜色指定,只给一个场景方向,剩下的交给AI去自行决定。于是,我从网上找到了一张仙人洞的照片,让AI去帮我匹配色调。加入第二个controlnet来控制颜色,使用的是t2ia_color的模型。关键词只给了:蓝天、绿树、灰石砖这么简单的几个词。颜色终于正常了,最后经过脸部的修复和放大,得到了最终的效果。

Others are asking
有没有什么能帮我ai自动调色的网站推荐
以下为您推荐一些与 AI 自动调色相关的内容: 有一个名为“Mood to color”的功能,您提供心情描述,它会为您生成匹配的 CSS 颜色代码,输出以 json 格式呈现,键名为“css_code”。 对于给老照片上色,为实现颜色与内容的统一,可启用 cutoff 插件进行控制,您可以参考文章【Stable Diffusion】告别提示词颜色污染!Cutoff 插件(http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487436&idx=1&sn=dba5cf7a170223deda6a706fa2e14f6b&chksm=c2515908f526d01eae402083a7f93e4c5c7dca057693a25847bb8e97929c875617777cbb9721&scene=21wechat_redirect)。
2024-10-17
raw照片调色软件推荐
处理和调色RAW照片的软件有很多,它们提供了丰富的功能和工具,帮助摄影师提升照片质量。以下是一些推荐的RAW照片调色软件: 1. Adobe Lightroom 平台:Windows, macOS, iOS, Android 特点: 强大的RAW文件处理能力。 非破坏性编辑,原始文件不被修改。 广泛的调色和编辑工具,包括曝光调整、白平衡、颜色校正等。 支持云同步,方便多设备协作。 丰富的预设和插件支持。 2. Adobe Photoshop 平台:Windows, macOS 特点: 提供Camera Raw插件,支持RAW文件编辑。 强大的图像处理和编辑功能。 专业级调色和润饰工具。 与Lightroom无缝集成。 3. Capture One 平台:Windows, macOS 特点: 专业摄影师常用的RAW处理软件。 优秀的色彩管理和调色工具。 高效的工作流程和批量处理能力。 支持多种相机品牌的RAW格式。 强大的图层和局部调整功能。 4. DxO PhotoLab 平台:Windows, macOS 特点: 高质量的RAW文件处理,特别是在降噪和镜头校正方面表现出色。 强大的自动调整工具,如DxO Smart Lighting和ClearView Plus。 深入的局部调整和调色工具。 5. Affinity Photo 平台:Windows, macOS, iOS 特点: 价格实惠的专业图像编辑软件。 强大的RAW处理能力。 丰富的调色和修饰工具。 支持非破坏性编辑和高级图层功能。 6. ON1 Photo RAW 平台:Windows, macOS 特点: 一体化的RAW处理和编辑解决方案。 强大的预设和滤镜功能。 丰富的调色和局部调整工具。 高效的工作流程,适合大量照片的快速处理。 7. Darktable 平台:Windows, macOS, Linux 特点: 开源免费的RAW处理软件。 强大的调色和图像处理工具。 非破坏性编辑,支持多种RAW格式。 丰富的模块和插件支持。 8. Luminar Neo 平台:Windows, macOS 特点: 简洁易用的界面,适合初学者和专业摄影师。 强大的AI工具,自动增强和修饰照片。 灵活的图层和调整工具。 丰富的预设和滤镜。 选择软件的建议 需求和预算:根据你的需求(如专业级功能、简单易用性)和预算选择合适的软件。 相机兼容性:确保软件支持你的相机品牌和型号的RAW格式。 工作流程:选择适合你工作流程的软件,如需要批量处理或多设备协作。 试用版:许多软件提供试用版,先试用一下,看看是否符合你的需求和习惯。 这些推荐的软件都具备强大的RAW处理和调色功能,可以帮助你提升照片质量和创作水平。根据个人需求和喜好,选择适合自己的软件。
2024-05-29
Java相关的AI
以下是关于 Java 相关的 AI 的一些信息: 1. 利用固定格式文档结合 AI 进行代码开发的可行性分析:建议优化方面,要强调组员主观能动性,让他们自主设计,组长负责引导和经验分享。文档并非唯一最佳方式,可尝试用简短描述或 Prompt 辅助代码生成。经验分享方面,在 AI 编程中,设计非常重要,模块化低耦合设计和清晰的上下文对代码生成效果尤为关键。参考链接: 2. 后端 Java 程序员转向 LLM 方向的行动建议:借助 AI 编程(如 Cursor),熟悉 LLM 原理,探索复杂 Prompt 和定制化规则。开展 LLM 相关的 Side Project(如翻译工具、AI 对话应用等),通过实践快速掌握技能。将 AI 当老师,边做边学,获取即时反馈,持续提升。核心建议是行动起来,找到正反馈,坚持使用 AI 辅助编程。参考链接:
2025-03-14
直接分析excel的数据,有哪些AI推荐,免费的
以下是一些可用于直接分析 Excel 数据的免费 AI 工具推荐: 1. 让 AI 帮您写 Excel 宏函数,适用于几乎所有主流 AI。 2. Claude 网页版或 ChatGPT,可上传 CSV 进行可视化分析。 3. Excel Labs:Excel 插件,新增生成式 AI 功能,基于 OpenAI 技术,可在 Excel 中利用 AI 进行数据分析和决策支持。 4. Microsoft 365 Copilot:微软推出的 AI 工具,整合了多种办公软件,通过聊天形式完成数据分析或格式创建等任务。 5. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,可通过自然语言交互式地进行数据分析和生成 Excel 公式。 6. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,能执行公式生成、文本内容生成、情感分析、语言翻译等任务。 随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-03-14
直接分析excel的数据,有哪些AI推荐
以下是一些可用于直接分析 Excel 数据的 AI 工具和方法: 1. Excel Labs:这是一个 Excel 插件,基于 OpenAI 技术新增了生成式 AI 功能,可用于数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的整合了 Word、Excel、PowerPoint、Outlook、Teams 等办公软件的 AI 工具,能通过聊天形式完成数据分析或格式创建等任务。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,支持自然语言交互式地进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,能进行公式生成、根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 此外,还可以通过让 AI 帮您写 Excel 宏函数来处理数据,对于数据分析,推荐使用 Claude 网页版或 ChatGPT,并可上传 CSV 进行可视化分析。随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-03-14
AI制作视频的工具
以下是一些可用于将小说制作成视频的 AI 工具及制作流程: AI 工具: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,能生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 另外,以“AI 特效挑战 001 杯子里的鲸鱼”为例,选用视频制作工具时,如使用可灵 AI,可参考以下步骤: 1. 打开可灵 AI,网址:https://klingai.kuaishou.com/ ,点击图生视频,上传第一张图片。输入提示词时一定需要加“固定镜头”。 2. 按照上述做法制作第二张图片的动态效果,得到两段视频。 视频剪辑方面(以 PC 端为例): 1. 右上方点击抠像按钮。 2. 鼠标选中要处理的素材。 3. 把带绿幕的素材先放入下面主视频轨道。 4. 打开剪映,导入需要的三段素材。 5. 把带绿幕的素材和下方黑色咖啡的素材合成一个片段。 6. 点击新建的复合片段,调整对应的参数,最后完成。
2025-03-14
学习开发ai的第一步是什么?
学习开发 AI 的第一步包括以下几个方面: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅:在「」中,您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。同时建议掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品:与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。
2025-03-14
根据台词寻找电影片段的AI
以下是为您整理的相关内容: 首先使用 Fanbook 中的 niji6 模型及sref 指令,并确定视频尺寸为 16:9。 根据丝绸之路的古风主题确定风格和时长,然后设定故事主线和镜头。 基于故事剧本和相关资料扩充每一个画面,参考分镜头基本格式要求,按场景、地点、镜号、画面描述、台词、音效等维度填充。画面数量与台词长短有关,要精简人物对话。 若对某句台词缺乏画面灵感,可借助语言大模型,如与 Kimi 交流,让其帮忙写画面描述甚至加上音效需求。大模型能提供灵感,可多提问尝试,但最终画面的选取和平衡需进一步思考,在 AI 辅助下完成分镜头剧本。
2025-03-14
希望找到一个可以帮助我写论文的模型
以下是一些关于利用模型写论文的信息: 可以向 LLM 寻求写作建议,甚至直接要求它帮您写论文。例如提供关于个人背景的信息,让其生成大学申请论文。但需要注意,这种方式可能存在道德问题。 可以直接给模型相关论文,让其完成任务,如写出论文中的例子。模型能够理解复杂的信息,不需要过度简化。 例如用 ChatGPT 撰写“宇宙类比大规模语言模型”的论文时,可以给出相关提示词,从宏观天文学、微观量子力学、哲学等角度展开讨论,并明确探讨方向。
2025-03-14
Transformer模型
Transformer 模型是一种基于注意力机制的深度学习模型,由 Vaswani 等人在论文《Attention is All You Need》中提出,用于处理序列到序列的任务,如机器翻译、文本摘要等。其原理主要包括以下几个关键点: 1. 自注意力机制:能够同时考虑输入序列中所有位置的信息,而非像循环神经网络或卷积神经网络一样逐个位置处理。通过自注意力机制,模型可根据输入序列中不同位置的重要程度,动态分配注意力权重,从而更好地捕捉序列中的关系和依赖。 2. 位置编码:由于自注意力机制不考虑输入序列的位置信息,为使模型能够区分不同位置的词语,Transformer 模型引入了位置编码。位置编码是一种特殊的向量,与输入词向量相加,用于表示词语在序列中的位置信息。位置编码通常基于正弦和余弦函数计算得到的固定向量,可帮助模型学习到位置信息的表示。 3. 多头注意力机制:通过引入多头注意力机制,可以并行地学习多个注意力表示,从不同的子空间中学习不同的特征表示。每个注意力头都是通过将输入序列线性变换成查询、键和值向量,并计算注意力分数,然后将多个头的输出拼接在一起得到最终的注意力表示。 4. 残差连接和层归一化:在每个子层(SelfAttention 层和前馈神经网络层)的输入和输出之间都引入了残差连接,并对输出进行层归一化。残差连接可缓解梯度消失和梯度爆炸问题,使得模型更容易训练和优化;层归一化可加速训练过程,并提高模型的泛化能力。 5. 位置感知前馈网络:在每个注意力子层之后,Transformer 模型还包含了位置感知前馈网络,它是一个两层的全连接前馈神经网络,用于对注意力表示进行非线性转换和映射。位置感知前馈网络在每个位置独立地进行计算,提高了模型的并行性和计算效率。 Transformer 模型主要由两大部分组成:编码器和解码器。每个部分都是由多个相同的层堆叠而成,每层包含了多头注意力机制和位置全连接前馈网络。 编码器可以理解为将自然语言转换成向量文本,以模型内的既有参数表示。这些参数包含了原始信息,同时也融合了序列内元素间的相互关系。例如,输入“我喜欢猫”,将自然语言转换成词嵌入向量:我>,经过自注意力机制,输出编码器输出一个序列的向量,表示对输入句子的理解。 解码器基于编码器的输出和之前生成的输出逐步生成目标序列,也就是把向量文本重新转化成自然语言。例如,目标生成中文句子“我喜欢猫”,初始输入为解码器接收一个开始符号,用,对应“猫”。这是一个简单的复现概念,当模型得到匹配度高的参数时,它就会一个词一个词地判断需要输出的语言文本。
2025-03-14
大模型如何在企业里应用
大模型在企业中的应用主要体现在以下几个方面: 1. 智能终端行业:中国超半数手机厂商如三星、荣耀、vivo、OPPO、小米等主流品牌,以及上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 2. 百度表现:在主流大模型厂商中,百度表现突出,拿下最关键的中标项目数量、中标金额两项第一。其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。百度智能云的增长主要由互联网、教育、金融等行业对模型训练和推理的高需求带动。 3. 落地所需能力:企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。这意味着大模型落地赋能企业智能化时,能力比拼从单项变为全能比拼。 然而,大模型在企业落地应用中面临一些问题和挑战: 1. 竞争格局:大模型是典型赢家通吃领域,胜出的大模型在中国和世界范围内都很难超过 2 个,巨头在资金、技术和数据方面具有优势,给创业公司的机会很少。 2. 落地难题:如何将大模型更快落地应用,将技术能力释放并与更多场景相结合,真正产生新一轮科技革命和产业变革,是当前紧要的关键问题。 3. 具体问题: 提高内容可信:需要通过商业交付去应用、反馈和评测,不断优化数据以解决实际应用问题,走向垂直化以提高内容精准度。 解决算力成本高、训练重复和资源紧缺:以 GPT3 模型为例,训练成本高昂,且目前仍无法用商业化的国产芯片进行大模型训练。 解决大模型落地问题,主要有以下三方面:提高内容可信;解决算力成本高、训练重复和资源紧缺的问题;降低大模型价格或使用垂直领域模型落地。
2025-03-14
大模型和智能体的区别
大模型和智能体的区别主要体现在以下几个方面: 概念定义: 智能体:简单理解就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。可以是面向 C 端,如社交方向,用户注册后先捏一个自己的智能体,然后让其与他人的智能体聊天,两个智能体聊到一起后再真人介入;也可以面向 B 端,帮助 B 端商家搭建智能体。 大模型:是一种技术。 局限性: 大模型具有强大的语言理解和生成能力,但存在一定局限性,例如无法回答私有领域问题(如公司制度、人员信息等),无法及时获取最新信息(如实时天气、比赛结果等),无法准确回答专业问题(如复杂数学计算、图像生成等)。 开发平台: 有众多智能体开发平台,如字节的扣子、Dify.AI 等。 应用场景: 智能体应用基于大模型,通过集成特定的外部能力,能够弥补大模型的不足。适用于有企业官网、钉钉、微信等渠道,期望为客户提供产品咨询服务,缺少技术人员开发大模型问答应用等场景。典型场景包括私有领域知识问答、个性化聊天机器人、智能助手等。 在 Anthropic 的定义中,智能体可以有多种定义,一些客户将其定义为能够长期独立运行的全自动系统,能使用各种工具完成复杂任务;另一些则将其描述为更具规范性、遵循预定义工作流程的系统。Anthropic 将这些变体统称为智能系统,并在架构上区分为工作流和智能体两种类型,工作流是通过预定义代码路径来编排 LLM 和工具的系统,智能体则是由 LLM 动态指导自身流程和工具使用的系统,能够自主控制任务完成方式。
2025-03-14
快速帮我补充下大模型的发展时间线和关键节点,以及当前最前沿的新闻
大模型的发展时间线和关键节点如下: 2017 年:发布《Attention Is All You Need》论文。 2018 年: Google 提出 BERT,创新性地采用双向预训练并行获取上下文语义信息及掩码语言建模。 OpenAI 提出 GPT,开创仅使用自回归语言建模作为预训练目标的方式。 2021 年:Meta 提出 Large LAnguage Model Approach(LLAMA),成为首个开源模型。 2022 年 11 月 30 日:ChatGPT 发布,在全球范围内掀起人工智能浪潮。 2022 年 12 月:字节云雀大模型等出现。 2023 年: 国内大模型发展大致分为准备期(国内产学研迅速形成大模型共识)、成长期(数量和质量逐渐增长)、爆发期(开源闭源大模型层出不穷,形成百模大战态势)。 关键进展包括:Meta 开源 Llama2、OpenAI 发布多模态 GPT4V 及 GPT4 Turbo、百川智能开源 Baichuan7B 及 Baichuan2、百度升级文心一言 4.0、清华&智谱 AI 开源 ChatGLM2 及清华开源 ChatGLM3、腾讯发布混元助手等。 当前最前沿的新闻包括:过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从 7 月份与 GPT3.5 的 20 分差距,到 11 月份测评时已在总分上超越 GPT3.5。
2025-03-14
阿里的千问大模型在行业内处于一个什么样的水平
阿里的通义千问大模型在行业内处于领先水平。 通义千问 2.5 正式发布并开源 1100 亿参数模型,在多模态和专有能力模型方面影响力强大,始终坚持开源路线,已推出多款开源模型,受到开发者和生态伙伴的热情支持。百炼平台也升级支持企业 RAG 链路,提供更灵活的企业级检索增强服务。通义灵码推出企业版,满足企业定制化需求,已在多个领域落地应用。 Qwen2.5Max 基于 SFT 和 RLHF 策略训练,在多项基准如 Arena Hard、LiveBench、LiveCodeBench、GPQADiamond 上超越 DeepSeek V3,引发社区关注。支持官方 Chat、API 接口、Hugging Face Demo 等多种方式,展示其顶尖性能与灵活应用场景。 Qwen2.5VL 是新一代视觉语言模型,可解析 1 小时以上视频内容并秒级定位事件,识别从金融文档到通用物体,动态适配高分辨率图像。具备复杂任务执行能力,覆盖更多实际场景如票据解析、商业分析等。 10 月 31 日,阿里云正式发布千亿级参数大模型通义千问 2.0,8 大行业模型同步上线。
2025-03-14
有没有什么好用的搜索引擎
以下是一些好用的 AI 搜索引擎: 1. 秘塔 AI 搜索:由秘塔科技开发,具有多模式搜索、无广告干扰、结构化展示和信息聚合等功能,能提升用户的搜索效率和体验。 2. Perplexity:聊天机器人式的搜索引擎,允许用自然语言提问,通过生成式 AI 技术从各种来源收集信息并给出答案。它不仅有通用搜索功能,还推出了 Copilot 能力,支持网页版、APP(目前支持 iOS,安卓即将推出)、Chrome 插件。网页版能力全面,能根据提问从互联网上搜寻信息并给出总结后的答案,还能给出信息来源网址,并根据搜索内容给出继续对话的问题建议。但要注意不要在开着浏览器翻译能力的同时使用,可能会报错。此外,首页推荐当下流行的新闻、搜索内容,支持筛选 Academic、Wolfram|Alpha、Wikipedia、Youtube、Reddit、News 进行搜索。访问地址: 3. 360AI 搜索:360 公司推出,通过 AI 分析问题,生成清晰、有理的答案,并支持增强模式和智能排序。 4. 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来还将支持图像、语音等多模态搜索。 5. Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,提供插件系统和社区功能。 6. Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 7. Phind:专为开发者设计的 AI 搜索引擎,利用大型语言模型提供相关的搜索结果和动态答案,特别擅长处理编程和技术问题。 这些 AI 搜索引擎通过不同的技术和功能,为用户提供更加精准、高效和个性化的搜索体验。
2025-03-13
我要策划一个朋友圈发的海报,需要有些prompt指导,看看有没有类似的案例或者相似的案例
以下为您提供一些朋友圈海报的 prompt 指导及相关案例: 即梦图片 2.1 模型: 模型上线,已支持在图片中生成中文字体。 操作步骤: 第一步:打开即梦官网 https://jimeng.jianying.com/ 第二步:点击进入图片生成页面 第三步:生图模型选择图片 2.1 模型 案例: 提示词:咖啡店穿着服务员服装的猫咪,揉着眼睛,文字“小店打烊了” 提示词:一只布偶猫举着牌子,牌子上写着“睡什么睡,起来嗨” 提示词:电影宣传海报,画面中间是韦小宝,四周是七个宫女,标题文字“重生之我是韦小宝” 提示词:电商节日海报,背景是上海外滩,圣诞节布置,旋转木马,节日的气氛,标题文字“圣诞集市” 即梦:女神节海报教程: 原文链接:https://mp.weixin.qq.com/s/CYmlZDPjrchnKr8V4lvmRQ 操作步骤: 第一步:打开即梦 AI,选择“图片生成”功能 https://jimeng.jianying.com 第二步:模型选择图片 2.1,输入提示词(可以直接参考案例提示词) 第三步:点击生成,几秒钟后,专属字体海报完成 案例: 案例一:提示词:女神节主题,3D 设计,梦幻氛围,明亮春天场景,花田,数字 38,天空“女神节”,五彩缤纷的蝴蝶,晴朗的蓝天,茂密的绿色草地,盛开的花朵,柔和光线 案例二:提示词:粉色主题,梦幻氛围,数字 38,心形气球,花卉装饰,玫瑰花,漂浮的花瓣,柔和的云朵,美丽的湖面倒影,奇幻风格,柔和的色调,庆祝场景 案例三:提示词:妇女节,3D 设计,粉色主题,大号装饰数字 38,爱心,郁金香花朵,柔和光照,背景城市天际线,精致花卉装饰,优雅节日氛围,金色文字,春天氛围,细致鲜艳 希望这些内容对您策划朋友圈海报有所帮助!
2025-03-13
有没有表格处理ai?
目前有多种可用于表格处理的 AI 工具和插件,例如: 1. Excel Labs:是 Excel 插件,基于 OpenAI 技术,新增生成式 AI 功能,可在 Excel 中进行数据分析和决策支持。 2. Microsoft 365 Copilot:整合了 Word、Excel、PowerPoint 等办公软件,通过聊天形式完成用户需求,如数据分析和格式创建。 3. Formula Bot:提供数据分析聊天机器人和公式生成器功能,支持自然语言交互进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,能进行公式生成、生成相关文本内容、执行情感分析、语言翻译等任务。 此外,飞书多维表格也能与 AI 协作,帮助处理数据。例如,自带 AI 插件可实现自然语言提取网址和电话、生成 AI 标签等功能。在工作中,可根据具体需求选择合适的工具,如用智谱 AI 表格插件理解图片、生成视频的指令等。随着技术发展,未来可能会有更多 AI 功能集成到表格处理中,提高工作效率和智能化水平。
2025-03-13
有没有参照pdf模仿生成一个类似的word的ai
以下是关于将 PDF 转换为类似 Word 或生成可视化网页的相关内容: 用 AI 把 PDF 一键变成能玩的可视化网页是可行的。如果想插入视频,需找到公网的视频地址(本地视频先上传到公网,如 Youtube 或 B 站),在视频页面寻找“分享”按钮,点击“嵌入”或“嵌入代码”选项,把复制下来的 HTML 代码粘贴到媒体资源处。对于其他渠道没有代码预览功能的,可把生成的代码复制到 https://www.yourware.so/ ,点 deploy code 稍等就有预览,点 copy link 可分享给朋友。 基于深度学习的 ChatDOC PDF 解析器在超过一千万份文档页面的语料库上进行了训练,包含一系列复杂步骤,如 OCR 进行文字定位和识别、物理文档对象检测、跨列和跨页调整、阅读顺序确定、表格结构识别、文档逻辑结构识别等。解析后会以 JSON 或 HTML 格式提供结果,像一个结构清晰的 Word 文件。 而将 PDF 转换为可视化网页这种方式在 AI 加持下门槛很低,人人都可操作。整体思路来自归藏,按此修改的 Prompt 目前在 Claude 3.7 Sonnet 效果最好,其他大模型生成的审美稍差。Prompt 基本复制可用,但细节部分如作者信息和媒体资源要改成自己的内容。媒体资源方面,图片尽量用公链,网上现成图片可右键复制图像链接,自己的图片可使用图床服务托管生成公链,然后用 Markdown 格式贴到媒体资源处。
2025-03-13
有没有参照pdf模仿生成一个类似的ai
以下是关于参照 PDF 模仿生成类似内容的相关信息: 可以用 AI 把 PDF 一键变成能玩的可视化网页。若想插入视频,需找到公网视频地址(如上传本地视频至 Youtube 或 B 站),在视频页面寻找“分享”按钮,点击“嵌入”或“嵌入代码”选项,将复制的 HTML 代码粘贴到媒体资源处。对于没有代码预览功能的渠道,可将生成的代码复制到 https://www.yourware.so/ 网站,点 deploy code 稍等即可预览,点 copy link 能分享给朋友。 让 AI 像人类一样思考的步骤包括:输入章鱼哥,把情绪体感构建轮子的 prompt3 粘进去拼到章鱼哥下面,点击发送按钮让模型完成人物解构建构,复制章鱼哥 prompt 给到模型,和章鱼哥聊天看其反应。AI 拟人化的核心在于“体感”的重现,通过解构建构得到四种类型的轮子并合理使用,能让 AI 语言表达重现人类的体感,使其在不同场景中展现像人类一样的思维、情感和行动。 关于教师使用 AI 减负,可先输入讲义 PDF 让 AI 提取知识点,例如在对话框输入“请提取以下 PDF 中的主要知识点”并上传讲义 PDF 文件。
2025-03-13
有没有使用AI炒股的相关内容
以下是关于使用 AI 炒股的相关内容: 1. Stocked AI 是一个投资服务,提供每日股票推荐。其推荐由机器学习模型生成,使用人工智能预测下一天的股票收盘价。 2. 博主林亦 LYi 的《AI 炒股?我开了一家员工全是 AI 的公司,自动帮我炒股》在某种程度上实现了多 Agent 协作的能力。 3. 有摊位提出“AI+交易:来定制专属于你的私人高级交易顾问吧!”的思路,期望借助 AI 分析行情,提高资金使用效率。 目前 AI Agent 应用大多集中在 2B 场景,面向个人消费者的产品较少。一方面高度智能化的 Agent 能力需要打磨,概念落地还有距离;另一方面 AI 和娱乐消费诉求的结合几乎没有,其主要带来的是生产方式变革和效率变革。个人消费者方向,目前只看到“私人助理”场景。
2025-03-13