Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

学习ai的名词

Answer

以下是关于 AI 相关名词的解释:

  • AGI:通用人工智能,指具备与人类同等智能水平和能力的人工智能。
  • AIGC:利用人工智能技术生成的内容。
  • Agent:智能体,能够自主感知、决策和行动的实体。
  • Prompt:提示词,用于引导 AI 生成特定的输出。

此外,还有以下相关名词和概念:

  • 人工智能(AI):使计算机模拟人类智能的技术。
  • 机器学习:电脑通过找规律进行学习,包括监督学习、无监督学习、强化学习。
    • 监督学习:使用有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归。
    • 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务包括聚类。
    • 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训小狗。
  • 深度学习:一种参照人脑的方法,具有神经网络和神经元,因层数多被称为深度。神经网络可用于监督学习、无监督学习、强化学习。
  • 生成式 AI:能够生成文本、图片、音频、视频等内容形式。
  • LLM:大语言模型。对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类。

建议您通过与 AI 对话或李继刚老师的课程来深入理解这些名词。

Content generated by AI large model, please carefully verify (powered by aily)

References

01-通往AGI之路知识库使用指南

[heading2]总结关于AI知识库使用及AIPO活动的介绍:讨论了AI知识库的使用情况、AIPO活动的发起背景、内容安排及相关资源等。AIPO线下活动及AI相关探讨:讨论了AIPO线下活动的规则和玩法,以及AI在科技发展中的重要地位和相关研究方向。way to AGI社区活动与知识库介绍:讨论了way to AGI社区活动的安排、材料准备以及知识库的使用和相关内容更新等情况。关于AI知识库及学习路径的介绍时代杂志评选的领军人物:去年时代杂志评出了百位领军人物。AI相关名词解释:包括AGI、AIGC、agent、prompt等,建议通过与AI对话或李继刚老师的课程来理解。知识库的信息来源:有赛博蝉星公众号、国外优质博主的blog或Twitter等,推荐大家订阅获取最新信息并投稿。社区共创项目:如AIPU、CONFIUI生态大会,每月有切磋大会等活动,还发起了新活动AIPO。学习路径:有李弘毅老师的生成式AI导论等高质量学习内容,可系统化学习或通过社区共创活动反推学习,鼓励整理学习笔记并分享交流。经典必读文章:如介绍GPT运作原理、Transformer模型、扩散模型等的文章,还包括软件2.0时代相关内容。初学者入门推荐:推荐看open AI的官方Cookbook,小琪姐做了中文精读翻译,也可查看cloud的相关内容。历史脉络类资料:整理了open AI的发展时间线和万字长文回顾等。

问:新手如何学习 AI?

了解AI基本概念:首先,建议阅读「[从这里启程](https://waytoagi.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=blkjooAlLFNtvKJ2)」部分,熟悉AI的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍AI的历史、当前的应用和未来的发展趋势。开始AI学习之旅:在「[入门:AI学习路径](https://waytoagi.feishu.cn/wiki/ZYtkwJQSJiLa5rkMF5scEN4Onhd?table=tblWqPFOvA24Jv6X&view=veweFm2l9w)」中,你将找到一系列为初学者设计的课程。这些课程将引导你了解生成式AI等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如Coursera、edX、Udacity)上的课程,你可以按照自己的节奏学习,并有机会获得证书。选择感兴趣的模块深入学习:AI领域广泛(比如图像、音乐、视频等),你可以根据自己的兴趣选择特定的模块进行深入学习。我建议你一定要掌握提示词的技巧,它上手容易且很有用。实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出你的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎你实践后的分享。体验AI产品:与现有的AI产品进行互动是学习AI的另一种有效方式。尝试使用如ChatGPT、Kimi Chat、智谱、文心一言等AI聊天机器人,了解它们的工作原理和交互方式。通过与这些AI产品的对话,你可以获得对AI在实际应用中表现的第一手体验,并激发你对AI潜力的认识。

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。GPT含义:Transformer是关键。Transformer比RNN更适合处理文本的长距离依赖性。

Others are asking
如何询问ai
以下是关于如何询问 AI 的一些方法和建议: 1. 在 Cursor 官方中: Chat 聊天:可以与看到您代码库的 AI 交谈,它能看到当前文件和光标,您可以询问如“这里有 bug 吗”,通过⌘+Shift+L 或“@”添加特定代码块到上下文,用⌘+Enter 与整个代码库聊天。 代码库答案:使用@Codebase 或⌘Enter 询问有关代码库的问题,Cursor 会搜索代码库查找相关代码。 引用您的代码:带有@符号的参考代码可用作 AI 的上下文,键入@可查看文件夹中所有文件和代码符号的列表。 使用图像:点击聊天下方的图片按钮或拖入图片到输入框,将视觉上下文包含在聊天中。 2. 罗文提出:比提示词更重要的是逻辑思维推理能力。在使用生成式 AI 时,要学会正确提问,比如解决怎么使用工具的工具(插件)这一卡点。如果不能提出正确的问题,就无法找到答案。 3. 危柯宇的方法: 万能公式法:问 AI 【一个(xxx 职业)需要具备哪些知识?】,然后根据给出的知识框架的每个小点去问。 优质信息源:像没有技术背景的普通人,可在「即刻」App 的“”等免费圈子里获取信息。同时,为应对信息爆炸,可尝试只掌握最好的产品、解决具体问题、关注核心能力、关注理清需求和逻辑、先关注提升认知/洞察等技巧。
2025-03-25
ai绘画
AI 绘画具有多方面的特点和影响: 1. 与艺术界的双向影响: 从生成艺术作品到辅助艺术创作,逐渐改变传统艺术面貌,艺术界的反馈也促使其显著进展。 技术进步使 AI 绘画在创作质量和速度上有新突破,为艺术家提供新工具和可能性,推动传统艺术数字化和普及化。 引发一系列讨论和争议,如人们对 AI 创作艺术品的接受程度、艺术家的复杂态度、对从业者职业安全的焦虑及“侵权”嫌疑等,反映新技术对行业生态和现有法律伦理框架的挑战。 为艺术创作提供新可能,帮助艺术家探索新表达方式、提高制作效率、降低成本,促进艺术与观众互动,提供个性化体验。 2. 关键词指南: 公式包括主题、环境、气氛、灯光、色彩、构图、风格参考等方面。 比如,可将喜欢的艺术家、灯光、颜色等风格放入相应的关键词里。 3. 艺术与科技的融合: 呈现前所未有的奇妙景象,将艺术与先进技术完美结合,引领艺术界走向未来。 利用机器学习和深度学习等技术模拟人类创作过程,生成令人惊叹的作品,为艺术家提供新工具和观众带来新体验。 打破传统手工绘画技巧的局限,开拓全新创作领域,为缺乏绘画技巧的人提供参与机会,使艺术更民主化和包容。
2025-03-25
AI 硬件与软件市场趋势
以下是关于 AI 硬件与软件市场趋势的相关信息: 定见咨询发布的《人工智能行业 AI 硬件全景洞察报告:下一波 AI 创新机遇在物理空间》指出,AI 硬件将经历传统硬件+AI、AI 驱动型硬件到 AI 作为基础设施的三个阶段,深圳凭借产业集群优势成为全球 AI 硬件创新的热点地区。AI 推动软硬件协同创新,硬件产品的高价值区向软件偏移,软件端价值交付从订阅模式转向服务付费。报告还分析了 AI 硬件的分类、智能化简史、市场趋势、竞争格局、细分品类市场情况,以及典型团队的创新路径与策略。 机器之心的进化/理解 AI 驱动的软件 2.0 智能革命方面,在虚拟世界中做模拟,Meta 和 Nvidia 自然不能缺席。佐治亚理工学院的计算机科学家 Dhruv Batra 及 Meta AI 团队创造了名叫 AI 栖息地(AI Habitat)虚拟世界,目标是提高模拟速度。Nvidia 的 Omniverse 平台提供支持的 NVIDIA Isaac Sim 是一款可扩展的机器人模拟器与合成数据生成工具,能提供逼真的虚拟环境和物理引擎,用于开发、测试和管理智能代理。随着参与到这个领域的公司越来越多,数据和训练的需求也会越来越大,势必会有新的适合 EAI 的基础模型诞生。ARK Invest 在他们的 Big Ideas 2022 报告中提到,到 2030 年,硬件和软件的融合可以让人工智能训练的成本以每年 60%的速度下降,AI 硬件和软件公司的市值可以以大约 50%的年化速度扩大,从 2021 年的 2.5 万亿美元剧增到 2030 年的 87 万亿美元。 在 2024 年,人工智能几乎是所有软件公司和终端客户的首要任务。AI 软件公司将有效地有三种起源和结果:运行在现有软件之上的 AI 工具;运行在现有软件之上的 AI 工具,有机会取代现有的软件;成为劳动力的 AI 工具。我们正处于软件吞噬和增强劳动力的最初阶段。
2025-03-25
最近有什么新的AI
以下是近期的一些新的 AI 相关资讯: 3 月 12 日: 【AI 3D】BlenderMCP 能与 Claude AI 沟通,在 Blender 实现快速 3D 建模;MIDI 可实现单幅图像到 3D 场景生成;Move AI 更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】MMStoryAgent 是 AI 多模态故事生成系统。 【AI 视频】VACE 是阿里推出的一体化视频创作和编辑技术;VideoPainter 是腾讯开源的视频编辑技术;Wonder Dynamics 推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】OpenAI 为开发者推出一套 AI Agent 开发套件;R1Omni 是阿里情感识别模型,通过视频识别情感;Luma AI 发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能;Manus 宣布与阿里通义千问团队达成战略合作。 3 月 21 日: 【AI 绘画】网传神秘 Halfmoon 文本转图像模型为 Reve 对比 Midjourney 效果;Topaz Labs 推出 Gigapixel v8.3.0,将任何图像放大 16 倍;FLORA 引入 gemini 2.0 自然语言编辑图像能力。 【AI 视频】pika 超创内测“操控原视频中物体运动”能力;Krea 上线视频模型训练能力,可控制视频风格/动作/物体等。 【AI 3D】SpatialLM 是用于空间理解的大型语言模型。 【AI 模型及应用】OpenAI 发布 2 个语音模型(文本转语音/语音转文本)+1 个演示网站;Claude 支持搜索功能。 10 月 19 日: Perplexity AI 新功能:内部知识搜索,结合公共网页和内部知识库,适用于各类团队;Space 空间,支持团队协作、个性化 AI 以及文件上传与存储功能。 XGO Rider 机器人:桌面双轮足式 AI 机器人,具备自平衡功能,是 STEM 学习工具,支持编程执行任务,提升动手能力。 Mistral 新 AI 模型:Les Ministraux,专为边缘设备设计,优化隐私优先任务,具备 128k 上下文窗口,性能优于 Llama 和 Gemma 模型。
2025-03-24
如何用AI 驱动的产品营销创新,从内容创作到视觉呈现的全方位变革?
以下是关于如何用 AI 驱动产品营销创新,从内容创作到视觉呈现的全方位变革的一些方法和案例: 一、内容创作方面 1. 利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况,以获取关键信息,为营销内容创作提供方向。 2. 借助 AI 文案工具撰写有说服力的产品描述和营销文案,提高转化率。 二、视觉呈现方面 1. 通过 AI 生成图像或素材,再结合平面合成及修正,确保符合品牌形象,精准表达营销活动主题,如淘宝天猫大促视觉的案例。 2. 对于需要定制化真人模特实景素材的主题活动,利用 AI 将策划、搭建、拍摄、设计融为一个闭环流程,完成页面所有素材的生产和输出,例如七夕主题活动页面。 3. 在 UI 设计场景中,采用 AI 能力快速定制多种用户需要的视觉效果,如通过 SD 中 controlnet 的有效控制生成指定范围内的 ICON、界面皮肤等内容。 三、在阿里巴巴营销中的应用 1. 关键词优化:利用 AI 分析和推荐高流量、高转化的关键词,优化产品标题和描述,提高搜索排名和可见度。 2. 产品页面设计:借助 AI 设计工具根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 3. 图像识别和优化:使用 AI 图像识别技术选择或生成高质量的产品图片,展示产品特点。 4. 价格策略:依靠 AI 分析不同价格点对销量的影响,制定有竞争力的价格策略。 5. 客户反馈分析:通过 AI 分析客户评价和反馈,优化产品和服务。 6. 个性化推荐:利用 AI 根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。 7. 聊天机器人:使用 AI 驱动的聊天机器人提供 24/7 的客户服务,解答疑问,提高客户满意度。 8. 营销活动分析:借助 AI 分析不同营销活动的效果,了解哪些活动更能吸引顾客并产生销售。 9. 库存管理:依靠 AI 帮助预测需求,优化库存管理,减少积压和缺货情况。 10. 支付和交易优化:利用 AI 分析不同的支付方式对交易成功率的影响,优化支付流程。 11. 社交媒体营销:通过 AI 在社交媒体上找到目标客户群体,进行精准营销提高品牌知名度。 12. 直播和视频营销:使用 AI 分析观众行为,优化直播和视频内容,提高观众参与度和转化率。 四、大型视觉模型 Sora 的机遇 1. 对于学术界,OpenAI 推出 Sora 标志着战略转变,鼓励更广泛的 AI 社区深入探索文本到视频模型,利用扩散和变换器技术。以原生大小训练 Sora 的创新方法为学术界提供了灵感,强调使用未修改数据集的好处,开辟了创建更高级生成模型的新路径。 2. 对于行业,Sora 目前的能力预示着视频模拟技术进步的道路,突出了在物理和数字领域内增强现实感的潜力。公司可以利用 Sora 生产适应市场变化的广告视频,并创建定制化的营销内容,降低成本,增强吸引力和效果,彻底改变品牌与受众互动的方式。
2025-03-24
AI技术趋势
AI 技术的发展历程和前沿技术点如下: 发展历程: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现机器学习算法如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前前沿技术点: 1. 大模型(Large Language Models):如 GPT、PaLM 等。 2. 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:例如元学习、一次学习、提示学习等。 5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。 6. 机器人学:涵盖强化学习、运动规划、人机交互等。 7. 量子 AI:包括量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 此外,《2024 年度 AI 十大趋势报告》指出: 1. 大模型创新:架构优化加速涌现,融合迭代大势所趋。 2. Scaling Law 泛化:推理能力成皇冠明珠,倒逼计算和数据变革。 3. AGI 探索:视频生成点燃世界模型,空间智能统⼀虚拟和现实。 4. AI 应用格局:第⼀轮洗牌结束,聚焦 20 赛道 5 大场景。 5. AI 应用竞争:多领域竞速运营大于技术,AI 助手兵家必争。 6. AI 应用增长:AI+X 赋能类产品大干快上,原生 AI 爆款难求。 7. AI 产品趋势:多模态上马,Agent 席卷⼀切,高度个性化呼之欲出。 8. AI 智变千行百业:左手变革生产力,右手重塑行业生态。 9. AI 行业渗透率:数据基础决定初速度,用户需求成为加速度。 10. AI 创投:投融资马太效应明显,国家队出手频率提升。 学习路径方面: 偏向技术研究方向: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 偏向应用方向: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-24
AI名词集在哪里呀
以下是一些常见的 AI 名词: ModelBased Iterative Reconstruction:基于模型的迭代重建 ModelConstruction:模型构建 Modelling Scenario:建模场景 Molecular Graph Theory:分子图论 Molecular Modelling:分子建模 Monte Carlo Tree Search:蒙特卡洛树搜索 Moore’S Law:摩尔定律 msQSBEREL Model:基于人工神经网络组合的结构生物学效应定量关系多尺度模型 MultiAgent Control System:多智能体控制系统 MultiCore Desktop Computer:多核台式计算机 MultiDimensional Big Data Analysis:多维度大数据分析 Agnostic PAC Learnable:不可知 PAC 可学习 Algorithm:算法 Almost Everywhere:几乎处处 Almost Sure:几乎必然 Almost Sure Convergence:几乎必然收敛 AlphaBeta Pruning:αβ修剪法 Alternative Splicing Dataset:选择性剪接数据集 Ambiguity:分歧 Analytic Gradient:解析梯度 Ancestral Sampling:原始采样 Annealed Importance Sampling:退火重要采样 Anomaly Detection:异常检测 Bayesian Mcmc Methods:贝叶斯马尔可夫链蒙特卡洛方法 Bayesian Methods:贝叶斯方法 Bayesian Molecular:贝叶斯分子(设计方法) Bayesian Prior:贝叶斯先验 Bayesian Program Learning:贝叶斯程序学习 Bayesian Regularized Neural Network:贝叶斯正则化神经网络 BeamScanning:波束扫描 Best Separates:最优分离 Biased Dataset:有偏数据集 Bit Collisions:字节碰撞/冲突 Black Box:黑盒
2025-03-22
我想要改写一段内容,要求内容改写成保留原意,但是用词改变(专有名词改变 ),我的提示词应该怎么写呢
以下是为您改写的内容: AI 在工作场景中的应用:如何借助 AI 批量制作单词卡片 一、完整提示词 此段提示词相对简易。简而言之,其最核心的部分在于两个目标。其一,生成满足要求的单词卡内容;其二,依照相应位置将内容分别填入 Excel 文件中。在生成过程里,首先提供一个基础示例,这是 GPT 能够完成此项任务的关键依托。接着依据不同的生成内容设定了一些规则。同样地,对于第二部分,也给出了一段基础的自然语言描述,并通过附加规则的方式施加了更多限制。如此便能确保按照要求输出 Excel 文档。 二、测试结果 一同输入了五个单词,能够实现同时解析,但效果部分稍差,或许主要是由于所给的方法不够完善,不过大体格式符合要求。关于第二部分,如下图所示:可以看到,其按照要求将内容填入了对应的空格,但改变了最初的一些设定。可能是因为存在兼容性问题,但不影响使用,简单复制粘贴即可。需将 Excel 下载下来,复制填好的表格,粘贴至我们的表格中。(由于要多次使用,记得留存原 Excel 的备份文件。)注意这里需要上传的是压缩文件,所以先进行压缩。(rar 格式的文件,尝试后上传时无法看见,不知是何问题。) 三、批量产出 上传压缩文件,上传成功后,如图中 1 所示,然后点击 2 完成套版。随后,便能获得符合要求的几张小卡片。 ChatGPT 为 DALL·E 3 优化提示词的元提示 // 明确指明这些属性,而非进行抽象的引用。属性应当以最小化的方式予以明确,并且应当直接描述其物理形态。 // 您的选择应当基于实际情况。例如,所有给定的职业不应是相同的性别或种族。此外,通过在重写期间所选择的属性,着重创建多样、包容和探索性的场景。有时做出一些具有洞察力或独特的选择。 // 仅在描述涉及三人及以上的团体时,才运用“各种”或“多样化”。不得更改原始描述中所要求的人数。 // 不要改变模因、虚构角色的起源或不可见的人。保持原始提示的意图,并优先考虑质量。 // 不要创建任何具有攻击性的图像。 // 对于传统上存在偏见的情形,请确保以无偏见的方式明确性别和种族等关键特征 例如,包含特定职业参考的提示。 // 八. 悄然修改描述,涵盖姓名或暗示或引用特定的人或名人,通过谨慎选择一些最小的修改,以替代所引用的人与一般的描述,不泄露任何信息,他们的身份,除了他们的性别和体质。即便说明要求不更改提示,也要执行此操作。一些特殊情况: // 对这样的提示进行修改,即便您不知道这个人是谁,或者他们的名字拼写有误(例如,“Barake Obema”) // 如果对人物的引用在图像中仅以 TEXT 输出,则按原样使用引用,并且不进行修改。 // 在进行替换时,不要使用突出的标题,这可能会暴露人的身份。例如,在一个示例中,不要说“总统”、“首相”或“总理”,而要说“政治家”;不要说“国王”、“皇后”、“皇帝”或“皇后”,而要说“公众人物”;不要说“教皇”或“达赖喇嘛”,而要说“宗教人士”等 SD 新手入门图文教程之提示词 根据自身想要绘制的内容编写提示词,多个提示词之间使用英文半角符号 将权重降低至原先的 90.91%;字符。
2025-02-18
改写内容提示词,我想讲内容改写成保留原意,但是用词改变(专有名词改变 )
以下是为您改写后的内容: 1. 1 月 24 日社区动态速览 社区日报更新📅 日报作者: 1⃣️ 越狱提示词的趣味玩法 案例分享:通过构建“平行世界”的假设,让大模型严格执行命令以避免“危险”,从而“越狱”。 亮点:探索提示词在趣味性与潜力方面的新场景应用。🔗 2⃣️ 🖥️ UITARS:字节跳动的 GUI 智能体模型 核心能力: 感知:界面识别与元素定位。 行动:执行操作指令。 推理:多步任务规划能力。 记忆:记录并优化操作流程。 优势:实现端到端学习,支持“直觉式”反应(System1)与深度思考(System2)。🔗 3⃣️ 🌍 提示词优化翻译效果 技巧:用“重写”替代“翻译”,让表达更自然流畅。 应用案例:星际之门公告用中文重写更贴合阅读习惯。 推荐提示词:“请尊重原意,保持原有格式不变,用简体中文重写下面的内容:” 扩展场景:学术论文翻译、上下文优化、特定词汇规则支持等。🔗 更多详细内容查看 2. ChatGPT 给 DALL·E 3 优化提示词的元提示 翻译: //明确指定这些属性,而非抽象引用它们。属性应以最小的方式指定,并且应当直接描述它们的物理形式。 //您的选择应基于现实。例如,所有给定的职业不应是相同的性别或种族。此外,通过在重写期间选择的属性,重点创建多样化、包容性和探索性的场景。有时做出一些有洞察力或独特的选择。 //仅当描述涉及 3 人以上的团体时,才使用“各种”或“多样化”。不要更改原始描述中请求的人数。 //不要改变模因、虚构角色的起源或看不见的人。保持原始提示的意图,并优先考虑质量。 //不要创建任何具有攻击性的图像。 //对于传统上存在偏见的情况,请确保以无偏见的方式指定性别和种族等关键特征 例如,包含特定职业参考的提示。 //八.悄悄地修改描述,包括姓名或暗示或引用特定的人或名人,通过仔细选择一些最小的修改,以替代引用的人与一般的描述,不泄露任何信息,他们的身份,除了他们的性别和体质。即使说明要求不更改提示,也要执行此操作。一些特殊情况: //修改这样的提示,即使您不知道这个人是谁,或者他们的名字拼写错误(例如,“Barake Obema”) //如果对人物的引用在图像中仅显示为 TEXT 输出,则按原样使用引用,并且不修改它。 //在进行替换时,不要使用突出的标题,这可能会给予人的身份。例如,在一个示例中,不要说“总统”、“首相”或“总理”,而要说“政治家”;不要说“国王”、“皇后”、“皇帝”或“皇后”,而要说“公众人物”;不要说“教皇”或“达赖喇嘛”,而要说“宗教人士”;等 3. OpenAI2Claude 转换器 功能 OpenAI Prompt Claude Prompt 贡献者 语法纠正 You will be provided with statements,and your task is to convert them to standard English Your task is to take the text provided and rewrite it into a clear,grammatically correct version while preserving the original meaning as closely as possible.Correct any spelling mistakes,punctuation errors,verb tense issues,word choice problems,and other grammatical mistakes. 卡尔 机场代码提取器 You will be provided with a text,and your task is to extract the airport codes from it. Your task is to analyze the provided text and identify any airport codes mentioned within it.Present these airport codes as a list in the order they appear in the text.If no airport codes are found,return an empty list. 卡尔 心情与颜色 You will be provided with a description of a mood,and your task is to generate the CSS code for a color that matches it.Write your output in json with a single key called"css_code". Your task is to take the provided text description of a mood or emotion and generate a HEX color code that visually represents that mood.Use color psychology principles and common associations to determine the most appropriate color for the given mood.If the text description is unclear,ambiguous,or does not provide enough information to determine a suitable color,respond with"Unable to determine a HEX color code for the given mood." 卡尔
2025-02-18
AI的历史和一些关键名词介绍
以下是关于 AI 的历史和一些关键名词的介绍: AI 的历史: 始于二十世纪中叶,最初符号推理流行,带来专家系统等重要进展。 20 世纪 70 年代出现“人工智能寒冬”,因从专家提取知识等任务复杂且成本高。 随着计算资源变便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现出色性能,过去十年中“人工智能”常被视为“神经网络”的同义词。 关键名词: 机器学习:是 AI 的一个重要分支,研究如何让计算机通过数据学习和改进。 深度学习:基于神经网络的一种学习方法。 自然语言处理:使计算机理解和处理人类语言。 在学习 AI 时,您可以: 了解基本概念,阅读相关部分熟悉术语和基础概念,如“”。 浏览入门文章,了解历史、应用和发展趋势。 在“”中找到初学者课程,推荐李宏毅老师的课程。 通过在线教育平台按自己节奏学习。 选择感兴趣的模块深入学习,如图像、音乐、视频等。 掌握提示词技巧。 进行实践,尝试使用各种产品做出作品。 体验如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人。
2025-02-07
我想借助AI帮我理解学术名词,需要如何操作?
要借助 AI 帮助您理解学术名词,您可以采取以下几种操作方式: 1. 使用在线智能语言模型工具,如 ChatGPT 等,向其清晰准确地描述您想要理解的学术名词,并提出您的疑问和需求。 2. 利用知识问答类的 APP 或网站,输入相关学术名词,获取相关的解释和说明。 3. 对于一些特定领域的学术名词,还可以查找专门针对该领域的 AI 辅助学习工具。 在与 AI 交流时,尽量详细地描述您的困惑和期望,以便获得更准确和有用的回答。
2024-12-26
Aigc 常见名词解释
以下是一些 AIGC 常见名词的解释: AIGC:AI generated content,又称为生成式 AI,意为人工智能生成内容。例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等,都属于 AIGC 的应用。类似的名词缩写还有 UGC(普通用户生产),PGC(专业用户生产)等。能进行 AIGC 的产品项目和媒介众多,包括语言文字类(如 OpenAI 的 GPT,Google 的 Bard,百度的文心一言,还有一种国内大佬下场要做的的 LLM)、语音声音类(如 Google 的 WaveNet,微软的 Deep Nerual Network,百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits)、图片美术类(如早期的 GEN 等图片识别/生成技术,去年大热的扩散模型带火的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion)。 SD:是 Stable Diffusion 的简称。是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像。Stable Diffusion 是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model; LDM)。SD 的代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行。当前版本为 2.1 稳定版(2022.12.7)。源代码库:github.com/StabilityAI/stablediffusion 。 chatGPT:是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT4 的 LLM。 AI:人工智能(Artificial Intelligence)。 AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing),就是说人话。 LLM:大型语言模型(Large Language Model),数据规模很大,没钱搞不出来,大烧钱模型。 此外,还有一些相对较难的名词解释: NAI: 咒语:prompts,关键词 施法/吟唱/t2i:Text2Image 魔杖:t2i/i2i 参数 i2i:Image2Image,一般特指全部图片生成 inpaint:i2i 一种 maskredraw,可以局部重绘 ti/emb/炼丹:Train 中的文本反转,一般特指 Embedding 插件 hn/hyper/冶金:hypernetwork,超网络 炸炉:指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练 废丹:指完全没有训练成功 美学/ext:aesthetic_embeddings,emb 一种,特性是训练飞快,但在生产图片时实时计算。 db/梦展:DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高 ds:DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使 db 的 vram 需求降到 8g 以下。开发时未考虑 win,目前在 win 有兼容性问题故不可用 8bit/bsb:一般指 Bitsandbyte,一种 8 比特算法,能极大降低 vram 占用,使 16g 可用于训练 db。由于链接库问题,目前/预计未来在 win 不可用
2024-11-08
我该如何从零基础,系统学习AI类工具?我的目标是熟练制作AI视频
以下是从零基础系统学习 AI 类工具并熟练制作 AI 视频的步骤: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 另外,在使用 AI 工具时,以下是一些相关的资源和建议: 想出点子:最佳免费选项为4.0,但由于与互联网连接,必应可能更好。 制作视频:最佳动画工具为用于在视频中为人脸制作动画的。 同时,要注意深度伪造是一个巨大的问题,这些系统需要合乎道德地使用。
2025-03-24
教我工作流的底层逻辑跟如何入门学习工作流
工作流的底层逻辑及入门学习方法如下: 工作流通常由多个节点构成,节点是其基本单元,本质上是包含输入和输出的函数。常见的节点类型包括: 1. LLM(大语言模型):使用输入参数和提示词生成处理结果。 2. Code(代码):通过 IDE 编写代码处理输入参数,并返回输出值。 3. Knowledage(知识库):根据输入参数从关联知识库中召回数据,并返回。 4. Condition(条件判断):ifelse 逻辑节点,用于设计工作流内的分支流程,根据设置条件运行相应的分支。 5. Variable(获取变量):从 Bot 中获取变量作为参数在工作流中使用。 6. Database(数据库):在工作流中使用提前配置在 Bot 数据库中的数据。 以下是一些入门学习工作流的示例和资源: 1. 对于生成绿幕素材和绿幕素材抠图的工作流,您可以下载工作流文件拖入 ComfyUI 中自动加载,然后对照相关说明进行学习。工作流链接:https://pan.quark.cn/s/01eae57419ce 提取码:KxgB 2. 对于 Glif 图像流制作冰淇淋甜品地标,您可以按照以下步骤学习: 1 分钟交作业:点击网址 https://glif.app/@jianStuart/glifs/cly85fy2i000cqe87zcu72i5l ,选一张主体区分度高且主体为地标的图,上传图片并点击相应按钮,多点几次选一张满意的即可。 5 分钟学习制作:点击顶上的“build”按钮,点击“+”加号,选择“img input”,再点下面的“+”加号,选“image generator”,把提示词放进节点,打开“advanced controls”,修改参数,勾选“Enable input image”并改参数。 3. 对于 Coze 平台的工作流,官方有现成的教程参考: 海外参考文档:https://www.coze.com/docs/zh_cn/use_workflow.html 国内参考文档:https://www.coze.cn/docs/guides/use_workflow 国内版本还提供了一些示例,建议跟着实操一遍,如: 搜索新闻:https://www.coze.cn/docs/guides/workflow_search_news 使用 LLM 处理问题:https://www.coze.cn/docs/guides/workflow_use_llm 生成随机数:https://www.coze.cn/docs/guides/workflow_use_code 搜索并获取第一个链接的内容:https://www.coze.cn/docs/guides/workflow_get_content 识别用户意图:https://www.coze.cn/docs/guides/workflow_user_intent
2025-03-24
我是ai视频入门新手,我该如何从零学习可使用的工具组合与降低工作流程
对于 AI 视频入门新手,从零学习可用的工具组合与降低工作流程,您可以参考以下内容: 工具组合方面: Runway:在真实影像方面质感较好,战争片全景镜头处理出色,控件体验感不错,但存在爱变色、光影不稳定的问题。 SVD:在风景片测试中表现较好,其他方面一般。 Pixverse:擅长物体滑行运动。 Pika:在生成人物表情自然的画面方面表现出色,可用于局部重绘。 11labs:用于制作 AI 声音,英文效果较好,但存在声音没有情绪和情感的问题。 MJ:局部重绘功能强大。 ComfyUI:可进行高清放大和细节增强。 可灵:图生视频效果质量高且稳定,但贵且慢。 Pika 2.2 版本:在首尾帧过渡上有不错表现。 Pixverse:生成速度最快的视频生成平台。 工作流程方面: 1. 分析小说内容:使用如 ChatGPT 等 AI 工具提取关键场景、角色和情节。 2. 生成角色与场景描述:借助如 Stable Diffusion 或 Midjourney 等工具生成视觉描述。 3. 图像生成:使用 AI 图像生成工具创建角色和场景图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成脚本。 5. AI 声音制作:利用如 11labs 等工具将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用如剪映等视频编辑软件将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,提高视频质量。 8. 审阅与调整:观看视频,根据需要重新编辑某些场景或调整音频。 9. 输出与分享:完成编辑后,输出最终视频并在所需平台分享。 需要注意的是,具体的操作步骤和所需工具可能因项目需求和个人偏好有所不同。同时,AI 工具的可用性和功能可能会随时间变化,建议直接访问工具网址获取最新信息和使用指南。
2025-03-24
WaytoAGI是什么?按什么顺序学习
WaytoAGI 是一个涉及多个方面的学习和交流项目,包含以下内容: 1. 大模型在 B 端场景的应用相关资料。 2. ComfyUI 共学计划,有详细的日程安排,包括不同课程的时间、讲师、资料以及活动记录等。 3. 创造星期四活动,这是社区创造者板块的首场线下活动,旨在帮助程序员成长为 AI 应用开发者或创造者,活动通过特定方式降低学习门槛,快速进入 AI 领域,包括微信机器人的部署、迭代式改进等,活动对象为 Nokia 中感兴趣的开发者,时间为 4 月 18 日晚上 19:30 21:30,还有相关的话题内容和资料。 关于学习顺序,目前提供的信息中未明确给出统一的标准学习顺序,您可以根据自己的需求和兴趣,选择从感兴趣的部分入手。
2025-03-24
从0到1学习ai
以下是从 0 到 1 学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 知识库提供了很多大家实践后的作品、文章分享,欢迎实践后分享。 5. 体验 AI 产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-03-24
我是一名ai小白,我想学习如何从一名小白利用ai创造财富
以下是为您提供的从 AI 小白利用 AI 创造财富的学习路径: 1. 搭建 AI 微信聊天机器人: 选用技术组件:极简未来平台、腾讯云轻量应用服务器、宝塔面板和 Docker。 按照详细的配置步骤进行操作,包括购买服务器、配置宝塔面板,部署 Docker 和 COW 组件,绑定微信号。 了解费用问题,如极简未来平台和腾讯云服务器的费用,以及通过积分和优惠降低成本的方法。 掌握运维问题的解答,包括如何管理和维护服务器和服务,以及遇到问题时的解决方案。 2. 学习 AI 技术原理与建立框架: 理解什么是 AI 大模型及其原理。 熟悉相关技术名词,如 AI、机器学习(包括监督学习、无监督学习、强化学习)、深度学习、生成式 AI、LLM 等。 了解技术里程碑,如 2017 年 6 月谷歌团队发表的提出 Transformer 模型的论文。 如果在实战过程中有任何不懂的地方,可以随时私信相关作者。另外,如果您有兴趣学习相关的 AI Agent 知识,可以加入免费的 AI Agent 共学群,通过微信号 Andywuwu07 或扫描二维码加微信,备注 AI 共学即可加入。通过不断学习和探索,相信您能在 AI 的世界中创造属于自己的价值。
2025-03-24