Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

人工智能(AI)、机器学习(ML)、深度学习(DL)、生成式AI(AIGC)的区别与联系

Answer

AI(人工智能)是一个广泛的概念,旨在让机器模拟人类智能。

机器学习(ML)是AI的一个分支,指计算机通过数据找规律进行学习,包括监督学习(使用有标签的训练数据,学习输入和输出之间的映射关系,如分类和回归)、无监督学习(处理无标签数据,让算法自主发现规律,如聚类)和强化学习(从反馈中学习,以最大化奖励或最小化损失,类似训练小狗)。

深度学习(DL)是一种机器学习方法,参照人脑构建神经网络和神经元,由于网络层数较多被称为“深度”。神经网络可用于监督学习、无监督学习和强化学习。

生成式 AI(AIGC)能够生成文本、图片、音频、视频等内容形式。

它们之间的联系在于:深度学习是机器学习的一种重要方法,机器学习又是实现人工智能的重要途径,而生成式 AI 是人工智能的一个应用领域。例如,生成式 AI 中的一些技术可能基于深度学习和机器学习的算法。2017 年 6 月,谷歌团队发表的论文《Attention is All You Need》首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖于循环神经网络或卷积神经网络,对相关技术的发展具有重要意义。大语言模型(LLM)如谷歌的 BERT 模型,可用于语义理解(如上下文理解、情感分析、文本分类),但不擅长文本生成,对于生成式 AI,生成图像的扩散模型不属于大语言模型。

Content generated by AI large model, please carefully verify (powered by aily)

References

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。

Others are asking
爆款AI视频
以下是关于爆款 AI 视频的相关内容: 2025AI 春晚: 行业身份:首届 AI 春晚发起人&总导演,包括央视总台论坛&直播、TEDxAI 演讲、得到分享等。 爆款视频案例:快手&国家反诈中心合作,微博 650w+热搜,快手 520w+热搜(6 月 28 日);央视&海尔冰箱首支 AI 概念短片(6 月 29 日);个人制作视频,无推流,快手平台 636w 播放(6 月 29 日)。 社区与企业关系:涉及 WaytoAGI、AIGCxChina 等聚会,以及德必集团、万兴集团、福布斯 AItop50 等的论坛分享,还有嘉定区政府颁奖、温州 AI 音乐大会、腾讯研究院论坛、江西财经大学分享、宣亚集团分享等。 WTF:1w 粉 10w 粉仅仅用时 13 天,像素级拆解《动物时装秀》: 作者模仿动物时装秀账号效果不错并分享教程。一个爆款视频至少要满足以下几点: 切片:短视频通过不断切片,增加信息密度,从长视频和其他短视频中脱颖而出。 通感:利用人的直觉脑,不让观众动脑子,如头疗、水疗直播间靠声音让人舒服,美食直播间靠展示美食吸引人。 反差:可参考抖音航线里行舟大佬的相关文档。 视频模型:Sora: OpenAI 突然发布首款文生视频模型 Sora,能够根据文字指令创造逼真且充满想象力的场景,生成 1 分钟的超长一镜到底视频,女主角、背景人物等都有惊人的一致性和稳定性,远超其他 AI 视频工具。
2025-02-21
AI音频与数字人
以下是关于 AI 音频与数字人的相关信息: 数字人口播配音: 操作指引:输入口播文案,选择期望生成的数字人形象及目标语言,选择输出类型,点击开始生成。 支持的数字人形象和语言多样,能让视频制作更高效。 图片换脸: 操作指引:上传原始图片和换脸图片,点击开始生成。 图片大小上限 5M,支持 JPG、PNG 格式。 视频换脸: 操作指引:上传原始视频和换脸图片,点击生成。 音频合成数字人: 操作指引:上传音频文件,选择数字人角色和输出类型,点击开始生成。 支持 MP3 和 WAV 格式的音频文件,文件大小上限 5M,工具支持使用 100+数字人模板,可解决无素材冷启问题。 AI 配音: 多语种(包含菲律宾语、印地语、马来语等小语种)智能配音,同时支持区分男声和女声。 操作指引:输入需配音文案,选择音色,点击立即生成。 注意输入的配音文案需和选择音色语种保持一致。 AI 字幕: 操作指引:点击上传视频,开始生成,字幕解析完成后下载 SRT 字幕。 支持 MP4 文件类型,大小上限为 50M。 在数字人语音合成方面,提到了声音克隆,有新的声音克隆且音质很不错。算法驱动的数字人相关开源代码仓库有: ASR 语音识别:openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition)。 大模型:ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分:可以使用 LangChain 的模块去做自定义(https://www.langchain.com/)。 TTS:微软的 edgetts(https://github.com/rany2/edgetts)、VITS(https://github.com/jaywalnut310/vits)、sovitssvc(https://github.com/svcdevelopteam/sovitssvc)。 构建简单数字人的方式包括通过手动建模(音频驱动)或者 AIGC 的方式生成人物的动态效果(例如 wav2lip 模型),但仍存在一些问题,如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作、数字人如何使用知识库做出某个领域的专业性回答等。
2025-02-21
现阶段最智能的AI工具是哪一款?
现阶段很难确切地指出哪一款 AI 工具是最智能的,因为这取决于不同的应用场景和需求。以下为您介绍一些表现出色的 AI 工具: Unity 推出的两款 AI 工具: Copliot 工具:可通过与 Muse Chat 聊天快速启动创建游戏项目,如生成塔防类游戏基础框架、创建人物角色动作,还能协助编码和熟悉工程环境。 Unity Sentis:能在 Unity 运行时为游戏或应用程序嵌入 AI 模型,增强玩法和功能,是首个将 AI 模型嵌入实时 3D 引擎的跨平台解决方案。 基于 2022 年 9 月至 2023 年 8 月访问量的 10 个最佳人工智能工具: ChatGPT:访问量达 146 亿次,在美国使用率最高,男性用户占比较大,多用于写作和内容创作、教育和常识等方面。 Character AI QuillBot Midjourney Hugging Face Google Bard NovelAI CapCut JanitorAI Civitai 不同类型的 AI 工具在不同领域各有优势,例如聊天机器人在流量份额上占比较大,而图像生成器、视频生成器、语音和音乐工具等也在各自领域表现出色。您可以根据具体需求选择适合的工具。
2025-02-21
AI智能体接入个人微信的应用
以下是关于 AI 智能体接入个人微信的应用的相关信息: 国内版的扣子是一款在 AI 应用领域知名度高的产品,功能丰富,支持知识库、工作流和插件等,其社区市场完善,用户可选择官方或其他用户创建的插件和 AI Agent,且支持多种接入方式,包括接入个人微信公众号,还支持接入企业服务号和企业微信。但普通版本和专业版主要接入国内模型,可能存在性能和稳定性问题。 Coze 可以实现多模态资讯的跨平台推送,通过登录宝塔面板,在上面部署 docker 容器,启动 COW 项目与微信取得关联。具体步骤包括在宝塔面板中进行可视化控制云服务器,添加 Docker 项目模板,创建容器并编排,扫码等操作。 熊猫大侠介绍了基于 COW 框架的 ChatBot 实现步骤,可实现多种功能,支持多平台、多模型、多消息类型和多部署方法。但需要注意接入大模型 API 需单独付费,微信端接入有封号风险,操作需依法合规,注意数据处理和遵守法律法规。 此外,张梦飞同学写了更适合小白的使用教程:【保姆级】一步一图,手把手教你把 AI 接入微信副本
2025-02-21
转行做AI产品经理的自学指南,并帮我找到学习资源途径
以下是一份转行做 AI 产品经理的自学指南及学习资源途径: 自学指南: 1. 了解 AI 基础知识,包括常见的概念、技术和应用。 2. 学习产品管理的核心知识,如需求分析、用户体验设计等。 3. 关注技术原理,例如思维链、RAG、PAL、ReAct 等,可通过相关论文和科普视频进行学习。 4. 积累实践经验,尝试参与实际项目或模拟项目。 学习资源途径: 1. WaytoAGI(通往 AGI 之路):这是一个致力于人工智能学习的中文知识库和社区平台,提供系统全面的 AI 学习路径,涵盖从基础概念到实际应用的各个方面。 汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。 提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 定期组织实践活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 2. 相关技术论文:虽然对于小白有难度,但可以借助 AI 辅助阅读,完成一定知识储备。 3. 科普视频:如林粒粒呀的相关科普视频。 4. 行业访谈:例如安克创新 CEO 阳萌的访谈,获取前沿观点和启发。 此外,您还可以参考北京分队中相关人员的经验,如 Sundy 从产品运营转行当 AIGC 产品经理的经历。
2025-02-21
普通人的AI之路
普通人在 AI 领域有很多创造奇迹的机会和途径: 1. 参与 AI 艺术节:例如第一届 AI 艺术节 AIAF 面向全球创作者和 AI 爱好者发起了以“爱恨情仇”为命题的共同创作行动,收到了大量投稿,其中有相当比例的优秀作品来自此前并非从事视觉创作的跨界人士。 2. 让 AI 走进工作和生活: 万能公式法:问 AI 【一个(xxx 职业)需要具备哪些知识?】,获取知识框架,再针对小点提问,辅助深度思考。 寻找优质信息源:像没有技术背景的普通人,可在「即刻」App 的“”等免费圈子获取前沿信息,也可在必要时溯源至 Twitter 和相关官网。同时,为应对信息爆炸,可尝试只掌握最好的产品、解决具体问题、关注核心能力、关注需求和逻辑、先提升认知等技巧。 3. 了解 AGI 相关内容:如阅读 AGI 万字长文,了解 AI 多模态大爆发、应用现状、发展方向、可能带来的影响等多方面内容。
2025-02-21
大模型和小模型区别是什么?是否大模型都属于生成式AI,小模型属于判别式AI,为什么大模型有幻觉小模型没有?
大模型和小模型的区别主要体现在以下几个方面: 1. 规模和参数数量:大模型通常具有更多的参数和更复杂的架构,能够处理更大量和更复杂的数据。 2. 能力和性能:大模型在语言理解、生成等任务上往往表现更出色,能够生成更准确、丰富和连贯的内容。 3. 应用场景:大模型适用于广泛的通用任务,而小模型可能更专注于特定的、较狭窄的领域。 并非大模型都属于生成式 AI,小模型都属于判别式 AI。生成式 AI 能够生成新的内容,如文本、图片等;判别式 AI 则主要用于对输入进行分类或判断。模型的分类与其大小并无直接的必然联系。 大模型出现幻觉的原因主要是其通过训练数据猜测下一个输出结果,可能会因错误或不准确的数据导致给出错误的答案。而小模型相对来说数据量和复杂度较低,出现幻觉的情况相对较少,但这并非绝对,还取决于模型的训练质量、数据的准确性等多种因素。优质的数据集对于大模型减少幻觉现象非常重要。
2025-02-21
生成式AI教育场景应用 项目式学习 中小学案例
以下是一些中小学在生成式 AI 教育场景应用中采用项目式学习的案例: 北京市新英才学校: 开设“AI 创作家”小学课后服务特色课程,12 个五、六年级的学生在老师的引导和帮助下,主导设计一款实用的桌游。 学生们提出解决学校面积大导致新生和访客迷路的问题,决定制作一款学校地图桌游。 课程中,学生有时听老师讲解人工智能知识和工具使用方法,有时自己写 prompt 与大语言模型对话,还使用文生图 AI 工具生成桌游卡牌背后的图案,手绘第一版学校地图,选择游戏机制并梳理游戏流程。 在教育领域,生成式 AI 带来了诸多改变: 解决了教育科技长期以来在有效性和规模之间的权衡问题,可大规模部署个性化学习计划,为每个用户提供“口袋里的老师”,如实时交流并给予发音或措辞反馈的语言老师。 出现了众多辅助学习的产品,如教授新概念、帮助学习者解决各学科问题、指导数学作业、提升写作水平、协助创建演示文稿等。
2025-02-18
生成式AI教育场景应用 中小学案例
以下是北京市新英才学校在中小学教育场景中生成式 AI 的应用案例: 特色课程方面:学校开设了“AI 创作家”小学课后服务特色课程,12 个五、六年级的学生在老师的引导下,用 AIGC 工具设计一款实用的桌游。学生主导从收集需求、定义问题到设计背景、机制、内容、视觉,再到测试、迭代的全过程。例如,为解决学校面积大导致新生和访客迷路的问题,学生决定做一款学校地图桌游。课程中,学生学习人工智能知识、使用工具写 prompt 与大语言模型对话,还使用 OpenInnoLab平台生成桌游卡牌图案、手绘地图、选择游戏机制、梳理游戏流程。此外,还邀请中国传媒大学的吴卓浩教授合作,采用“大学生,小学生同上一节课”的方式,大学生为小学生讲解 AI 工具、试玩桌游。本学期,学生们测试并迭代桌游,使用 3D 打印机打印配件,用 ChatGPT 和 Midjourney 增强视觉设计,用 Kimi 辅助编写说明书,还计划让学生尝试用文生音乐工具 Suno 制作歌曲加入桌游 2.0 版本。 英语主课方面:初中部的英语课也融入了 AIGC 工具。魏一然协助初中部的英文老师杨佳欣和刘奕玚进行探索。在课程初期,更多是老师带着学生使用 AIGC 工具,prompt 由学生提出,老师引导。例如,在研究学校食堂食物浪费问题时,老师带着学生与 ChatGPT 对话,了解处理方法,让 ChatGPT 为学生生成生词解释和例句,形成生词库,并灵活加工生词生成题目、游戏或文章帮助学生复习单词。在关于社交媒体的英语辩论课上,尝试让学生自主使用 AIGC 工具做辩论准备。
2025-02-18
中小学AI教育场景 生成式 全息
以下是关于中小学 AI 教育场景生成式的相关内容: 北京市新英才学校在中小学 AI 教育方面进行了积极探索。跨学科项目老师带着学生用 AIGC 做学校地图桌游,英语老师在 AIGC 帮助下备课和授课,生物和信息科技老师合作带着学生训练 AI 模型以识别植物。数字与科学中心 EdTech 跨学科小组组长魏一然深入参与其中。 在英语课上,对于初中以上学生,一开始更多是老师带着使用 AIGC 工具,由学生提出 prompt,老师引导。例如在研究学校食堂食物浪费问题时,老师带着学生与 ChatGPT 对话获取信息,还让 ChatGPT 生成单词解释和例句,加工生词生成题目、游戏或文章帮助学生复习单词。在社交媒体的英语辩论课上,尝试让学生自主使用 AIGC 工具做辩论准备。 教育科技长期以来在有效性和规模之间权衡,而有了 AI 这种状况不再存在。现在可以大规模部署个性化学习计划,为每个用户提供“口袋里的老师”。像 Speak、Quazel、Lingostar 已在做实时交流并给予反馈的语言教学。Photomath、Mathly 指导学生解决数学问题,PeopleAI、Historical Figures 通过模拟与杰出人物聊天教授历史。学生在作业中也利用 Grammarly、Orchard、Lex 等工具提升写作水平,处理其他形式内容的产品如 Tome、Beautiful.ai 协助创建演示文稿。
2025-02-17
影视行业的生成式AI工具有哪些?帮我分一下类
以下是影视行业常见的生成式 AI 工具分类: 视频和图像类:Civitai、Kling AI、Viggle、Hailuo、Hedra、RunPod、Higgsfield、ThinkDiffusion、neural frames、Genmo、fal、LTX Video、CogVideoX、Morph Studio、Domo、Haiper、Pony Diffusion、Leonardo AI、Rubbrband 音频类:ElevenLabs、Hailuo、Cartesia、Sync、Tunes by Freepik 3D 类:Playhouse、Playbook、Tripo AI 故事板类:SAGA 在视频大类的分类下,按场景分,主要有以下几类: 1. 纯 AI 视频生成(RunwayML 等为代表) 2. 数字人(Heygen 等) 3. 营销类视频生成及编辑(生成内容以模板化,商业化内容为主) 4. 视频编辑(全面编辑,长剪短等) 此外,全球最大的生成式 AI 视频竞赛之一 Project Odyssey 第二季已开始,相关信息如下: 赛事官网:https://www.projectodyssey.ai/ 注册地址:https://projectodyssey.myflodesk.com/season2 赛事 Discord:https://discord.com/invite/projectodysseyai 提交地址:https://www.projectodyssey.ai/submission 时间线: 12 月 2 日:Project Odyssey 第二季开放报名 12 月 9 日:比赛规则公布 12 月 16 日:报名用户可解锁免费试用、完整规则正式发布、作品提交正式开启 1 月 16 日:提交截止,进入评审阶段 2 月 14 日:直播颁奖 参赛类别: 叙事类:通过鲜明的角色和深刻的故事情节,讲述能够打动人心的故事。 音乐视频:将视觉效果与原创音乐完美结合,打造震撼体验。 品牌创意:构思创意广告或活动视频,为虚拟品牌注入灵魂。(短于 60 秒) 创意预告片:制作极具吸引力的预告片或片头,为电影或剧集呈现特别概念。(短于 2 分 30 秒)
2025-02-16
吴恩达有《面向所有人的生成式 AI 入门课程 Generative AI for Everyone》下载资源
以下是吴恩达《面向所有人的生成式 AI 入门课程 Generative AI for Everyone》的相关资源: B 站: 学习笔记: 飞书: 下的相关课程
2025-02-07
什么是aigc
AIGC(人工智能生成内容)是一种利用人工智能技术生成各种类型内容的应用方式。它能够通过机器学习和深度学习算法,根据输入的数据和指令生成符合特定要求的内容,在内容创作、广告、媒体等领域有着广泛的应用。 具体来说,AIGC 包括以下方面: 1. 文字生成:使用大型语言模型(如 GPT 系列模型)生成文章、故事、对话等内容。 2. 图像生成:使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等。 3. 视频生成:使用 Runway、KLING 等模型生成动画、短视频等。 AIGC 作为一种强大的技术,能赋能诸多领域,但也存在多重潜在的合规风险。目前,我国对 AIGC 的监管框架由《网络安全法》《数据安全法》及《个人信息保护法》构成,并与《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》、《科技伦理审查办法(试行)》等形成了共同监管的形势。 AIGC 主要分为语言文本生成、图像生成和音视频生成。语言文本生成利用马尔科夫链、RNN、LSTMs 和 Transformer 等模型生成文本,如 GPT4 和 Gemini Ultra。图像生成依赖于 GANs、VAEs 和 Stable Diffusion 等技术,应用于数据增强和艺术创作,代表项目有 Stable Diffusion 和 StyleGAN 2。音视频生成利用扩散模型、GANs 和 Video Diffusion 等,广泛应用于娱乐和语音生成,代表项目有 Sora 和 WaveNet。此外,AIGC 还可应用于音乐生成、游戏开发和医疗保健等领域,展现出广泛的应用前景。 例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等,都属于 AIGC 的应用。类似的名词缩写还有 UGC(普通用户生产),PGC(专业用户生产)等。能进行 AIGC 的产品项目也很多,能进行 AIGC 的媒介也很多,包括且不限于: 1. 语言文字类:OpenAI 的 GPT,Google 的 Bard,百度的文心一言,还有一种国内大佬下场要做的的 LLM 都是语言类的。 2. 语音声音类:Google 的 WaveNet,微软的 Deep Nerual Network,百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits。 3. 图片美术类:早期有 GEN 等图片识别/生成技术,去年大热的扩散模型又带火了我们比较熟悉的、生成质量无敌的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion。
2025-02-18
我的毕业论文是AIGC的陶寺遗址空间可视分析技术研究,请问有何思路
对于您的毕业论文主题“AIGC 的陶寺遗址空间可视分析技术研究”,以下是一些可能的思路供您参考: 首先,深入了解陶寺遗址的相关背景和特点,包括其历史、文化、地理等方面的信息,这将为后续的分析提供基础。 其次,研究 AIGC 技术在空间可视分析方面的应用现状和前沿成果,了解相关的算法、模型和工具。 然后,考虑如何收集和整理陶寺遗址的空间数据,例如通过实地测量、卫星图像、考古记录等方式获取数据,并对数据进行预处理和清洗。 接着,运用合适的 AIGC 技术和算法,对陶寺遗址的空间数据进行可视化呈现,例如创建三维模型、绘制地图、生成动态图像等,以直观展示遗址的空间特征和关系。 在可视化的基础上,进行深入的分析,例如探究遗址的布局规律、空间结构、功能分区等,挖掘潜在的历史和文化信息。 最后,对研究结果进行评估和验证,确保其准确性和可靠性,并提出进一步的改进和优化方向。 希望这些思路能对您有所帮助,祝您顺利完成毕业论文!
2025-02-18
AGI和AIGC是啥关系,分别是什么的缩写
AGI 指通用人工智能,是一种能够像人类一样执行各种智能任务的人工智能。 AIGC 是人工智能生成内容的缩写,在公众传播层面,最初指用 Stable Diffusion 或 Midjourney 生成图像内容,后来泛指用 AI 生成音乐、图像、视频等内容。AIGC 是一种利用人工智能技术生成各种类型内容的应用方式,包括文字生成(如使用 GPT 系列模型生成文章、故事、对话等)、图像生成(如使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等)、视频生成(如使用 Runway、KLING 等模型生成动画、短视频等)。 AIGC、UGC(用户生成内容)和 PGC(专业人士或机构生成内容)都是内容生成的不同方式。UGC 由用户通过社交媒体等平台发布自己的内容,内容丰富多样,反映用户真实想法和创意,适用于互动性强的平台。PGC 由专业团队或机构根据特定标准和流程创作高质量内容,适用于需要高质量内容的平台。AIGC 的优势在于可以快速、大规模地生成内容,适用于需要大量内容的场景。
2025-02-13
想在手机上通过宠物照片给宠物建模,是宠物可以有一些动态性,需要怎么做?利用 AIGC 能快速的实现吗?
在手机上通过宠物照片给宠物建模并实现一定的动态性,可以考虑以下几种方式: 1. 利用 3D 引擎:目前有一些公司提供通过手机摄像头快速创建虚拟人身体的服务,例如 NextHuman。不过,3D 引擎在拟真程度高的同时,定制化成本也较高。 2. 借助 AIGC:虽然 AIGC 省去了建模流程,能直接生成数字人的展示图片,但可能存在数字人难以保持 ID 一致性、帧与帧连贯性不佳等问题。典型的相关项目有 wav2lip等。但需要注意的是,如果对模型真实度要求较高,AIGC 方式可能不太理想,因为算法发展很快,未来可能会有更好的连贯度生成方式。 目前利用 AIGC 来快速实现可能存在一些挑战,但随着技术的发展,未来有可能更便捷高效地达成您的需求。
2025-02-13
AIGC工程师
以下是为您整理的 AIGC 相关招聘信息: 猿印教育 AIGC 图像生成算法工程师/专家(北京五道口附近) 简历请发送至:stephen.wang@yyinedu.com 岗位职责: 面向 AIGC 领域,结合应用场景,开发针对性图像生成解决方案。 负责模型的部署和推理性能优化,确保模型在实际应用中的高效性和稳定性。 持续关注最新的技术发展和业界趋势,积极推动团队技术水平的提升,并将新技术应用到实际项目中。 任职要求: 计算机相关专业本科及以上学历,具备扎实的计算机基础知识。 熟练掌握 Python 语言,熟悉至少一种主流深度学习框架(TensorFlow/Pytorch 等)。 对深度学习和计算机视觉领域的基础理论和方法有深入理解,熟悉 DDPM,DDIM,Stable Diffusion 原理,了解 Dreambooth,ControlNet 等可控生成技术。 具有强烈的技术兴趣和钻研精神,具备良好的学习能力、沟通能力和团队合作精神。 数字银行 AIGC 产品经理(深圳) 请直接飞书联系@Eason 任职要求: 相信 AIGC:有过第一次用 chatgpt 时的兴奋,记得去年那个 AI 疯狂的 3 月份,熬夜看过 gpt4、copilot 的发布会,想过各种办法搞定 plus 账号,现在在翘首以盼 gpt5。 喜欢用:用过各种 AIGC 应用,如 GPT4,newbing,Kimi,Perplexity,Suno 等等。看到新的爆款产品,就会第一时间玩一玩。 能上手:可以简单的上手,不限于调用 api 做个小 demo,会写复杂的提示词,做一个简单的 RAG 应用,文生图、视频,微调模型等。 岗位职责: 构建赋能海量用户的大模型工程化产品,帮助某数字银行塑造技术领先性。 探索和设计工程化产品,来支持更快的 AI 原生应用构建(类似 Langchain,Llamaindex 等等,或者由您亲自来颠覆它们,做一个 Langxx,Llamaxx)。 在重点业务场景中深入探索大模型的应用落地,用最新的理念,做出真正能在海量金融业务场景中跑起来的应用(把类似 MetaGPT,AutoGen,Advanced RAG 真正落地,或者创造自己的 multi agent 应用)。 此外,3 月 2 日接龙中涉及 AIGC 相关人员的工作内容包括: 雯琋(Vinci)AIGC 不会编程但会鼓励编程。 AI 译文打杂文案。 AI 译然,AI 视频相关的都会一点,就是完全不会做网站。 Stanico,产品、运营、prompt。
2025-02-10
AIGC
AIGC 是利用 GenAI(生成式 AI)创建的内容。GenAI 能够从已有数据中学习并生成新的数据或内容。 AIGC 存在多种法律与道德风险: 1. 知识产权方面: 由于与输入数据的关联性,可能造成作品、专利、商标侵权、不正当竞争、侵犯商业秘密等问题。 存在是否构成侵犯著作权的争议,根源在于 GenAI 系统的训练方式。 对于 AIGC 产品是否构成著作权保护的产品以及著作权归属问题,目前存在需要重点探讨的方面。目前中国法律体系下,著作权主体仅限于自然人、法人或者非法人组织,AIGC 是否构成作品尚无法律明确规定,但我国已有认定 AIGC 享有著作权的先例。 2. 其他应用风险: AIGC 本身可能被滥用,产生误导性虚假信息,被用于不法目的。 面临社会伦理风险,可能延续和放大人类作品中的歧视、偏见,生成不当言论,被用于网络攻击、网络炒作和不正当商业营销等。 我国针对 AIGC 的应用出台了一系列法律法规进行规范,如《网络安全法》《数据安全法》《个人信息保护法》《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《网络音视频信息服务管理规定》等。
2025-02-09
coze平台有没有DeepSeek的mml可以调用
在 Coze 平台上,DeepSeek 是可以调用的。以下是相关的具体信息: 效果对比:用 Coze 做了个小测试,大家可以对比看看,相关视频 如何使用: 搜索 www.deepseek.com,点击“开始对话” 将装有提示词的代码发给 Deepseek 认真阅读开场白之后,正式开始对话 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改 用 XML 来进行更为规范的设定,而不是用 Lisp(对您来说有难度)和 Markdown(运行下来似乎不是很稳定) 完整提示词:v 1.3 特别鸣谢:李继刚的【思考的七把武器】在前期为提供了很多思考方向;Thinking Claude 这个项目是现在最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源;Claude 3.5 Sonnet 是最得力的助手。
2025-02-03
我现在需要根据一系列的 yaml 和 markdown 构建一个知识库,并且需要支持 AI 问答,每次 AI 问答的结果都要保存成一个新的内容放到知识库中,请问从经济效益来看,有哪些服务可以使用?
目前从经济效益的角度来看,以下一些服务可能有助于您构建这样的知识库并支持 AI 问答以及结果保存: 1. 云服务提供商,如阿里云、腾讯云、AWS 等,它们提供可扩展的计算和存储资源,您可以根据实际需求灵活配置,避免过度投入硬件成本。 2. 开源的知识管理和问答系统框架,例如使用 Elasticsearch 结合相关插件来实现问答功能,成本相对较低,但可能需要一定的技术投入进行搭建和维护。 3. 一些专门针对知识管理和 AI 应用的 SaaS 服务,它们通常按使用量计费,初期投入较小,适合小规模应用。 需要注意的是,具体选择哪种服务取决于您的业务规模、技术能力、预算以及对性能和功能的要求。
2025-02-01
AI系统都是由ML驱动的吗
并非所有的AI系统都是由机器学习(ML)驱动的。AI(人工智能)是一个广泛的领域,涵盖了许多不同的技术和方法。以下是一些主要的AI方法,除了机器学习之外,还有其他关键技术: 1. 专家系统(Expert Systems) 专家系统是一种早期的AI方法,利用规则和知识库来模拟人类专家的决策过程。它们不依赖于机器学习,而是依靠预定义的规则集。 例子: 医疗诊断系统、故障诊断系统。 技术: 知识库、规则引擎。 2. 模糊逻辑(Fuzzy Logic) 模糊逻辑是一种处理不确定性和模糊性的技术,常用于控制系统和决策支持系统。 例子: 家电控制(如洗衣机、空调)。 技术: 模糊集、模糊规则。 3. 遗传算法(Genetic Algorithms) 遗传算法是一种基于自然选择和遗传学原理的优化技术,用于解决复杂的优化问题。 例子: 路径优化、调度问题。 技术: 选择、交叉、变异。 4. 进化计算(Evolutionary Computation) 进化计算是一组基于自然进化原理的算法,包括遗传算法、进化策略和遗传规划等。 例子: 自动设计、机器人控制。 技术: 自然选择、适应性、进化。 5. 推理和规划(Reasoning and Planning) 推理和规划涉及基于逻辑和规则进行自动推理和问题求解。 例子: 自动定理证明、任务规划。 技术: 谓词逻辑、状态空间搜索。 6. 神经网络(Neural Networks) 虽然神经网络是机器学习的一部分,但它们也可以单独被视为一种独立的方法,特别是深度学习(Deep Learning),这是近年来AI发展的主要驱动力。 例子: 图像识别、自然语言处理。 技术: 反向传播、卷积神经网络、递归神经网络。 7. 强化学习(Reinforcement Learning) 强化学习是一种通过与环境交互来学习策略的机器学习方法,特别适用于动态环境中的决策问题。 例子: 游戏AI、机器人控制。 技术: 马尔可夫决策过程、策略梯度。 8. 自然语言处理(Natural Language Processing, NLP) NLP是一个专注于人机语言交互的AI子领域,使用各种技术来处理和生成自然语言文本。 例子: 语音识别、机器翻译。 技术: 句法分析、语义分析、词向量。 总结 虽然机器学习,尤其是深度学习,近年来在AI领域取得了显著的进展,并在许多应用中占据主导地位,但AI并不仅限于机器学习。其他方法如专家系统、模糊逻辑和遗传算法等在特定领域中依然发挥着重要作用。选择哪种AI技术取决于具体的应用场景和问题需求。
2024-06-17
设计一个图书管理系统的html,ajax异步查询id并展示图书的详细信息,包含图书封面图片,已有bookfindservlet,post请求
为了设计一个图书管理系统的HTML页面,并使用AJAX异步查询书籍ID并展示书籍的详细信息,包括封面图片,我们需要以下几个步骤: 1. 设计HTML页面 2. 编写AJAX请求 3. 处理AJAX响应并更新页面 假设我们已有一个名为`BookFindServlet`的后端服务,它接受POST请求并返回JSON格式的书籍详细信息。 1. 设计HTML页面 ```html <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF8"> <meta name="viewport" content="width=devicewidth, initialscale=1.0"> <title>Book Management System</title> <style> body { fontfamily: Arial, sansserif; margin: 20px; } bookdetails { margintop: 20px; display: none; } bookdetails img { maxwidth: 200px; display: block; marginbottom: 10px; } </style> </head> <body> <h1>Book Management System</h1> <label for="bookid">Enter Book ID:</label> <input type="text" id="bookid" name="bookid"> <button onclick="fetchBookDetails">Search</button> <div id="bookdetails"> <h2>Book Details</h2> <img id="bookcover" src="" alt="Book Cover"> <p><strong>Title:</strong> <span id="booktitle"></span></p> <p><strong>Author:</strong> <span id="bookauthor"></span></p> <p><strong>Description:</strong> <span id="bookdescription"></span></p> </div> <script> function fetchBookDetails { const bookId = document.getElementById.value; const xhr = new XMLHttpRequest; xhr.open; xhr.setRequestHeader; xhr.onreadystatechange = function { if { const response = JSON.parse; if { document.getElementById.src = response.coverImage; document.getElementById.innerText = response.title; document.getElementById.innerText = response.author; document.getElementById.innerText = response.description; document.getElementById.style.display = 'block'; } else { alert; document.getElementById.style.display = 'none'; } } }; xhr.send; } </script> </body> </html> ``` 2. 编写AJAX请求 在上面的HTML文件中,`fetchBookDetails`函数使用`XMLHttpRequest`来发送AJAX请求。这些步骤详细解释如下: 1. 获取用户输入的书籍ID:从输入框中读取用户输入的书籍ID。 2. 创建并配置XMLHttpRequest对象:使用`POST`方法向`BookFindServlet`发送请求,并设置请求头以指示发送的内容类型。 3. 处理响应: 如果请求成功(即状态码为200),解析JSON响应。 更新页面上的元素以显示书籍的详细信息(如封面图片、书名、作者和描述)。 3. 处理AJAX响应并更新页面 响应处理部分的JavaScript代码如下: ```javascript xhr.onreadystatechange = function { if { const response = JSON.parse; if { document.getElementById.src = response.coverImage; document.getElementById.innerText = response.title; document.getElementById.innerText = response.author; document.getElementById.innerText = response.description; document.getElementById.style.display = 'block'; } else { alert; document.getElementById.style.display = 'none'; } } }; ``` 总结 通过上述步骤,我们创建了一个简单的图书管理系统HTML页面,使用AJAX向后端服务发送查询请求,并在收到响应后动态更新页面内容。这种方法使用户能够在不刷新页面的情况下查看书籍的详细信息,提高了用户体验和系统的交互性。
2024-05-22
streamlit是什么
Streamlit 是一个用于数据科学和机器学习的 Python 库,它允许开发人员创建可视化应用程序,而无需编写复杂的前端代码。Streamlit 库的核心是一个基于 Python 的微服务架构,它使用 Flask 作为其 Web 服务器,并使用 React 作为其前端库。Streamlit 库提供了一个简单的 API,允许开发人员创建可视化应用程序,而无需了解 HTML、CSS 或 JavaScript。它还提供了一个内置的模板系统,允许开发人员快速创建可视化应用程序,并在本地或云端部署它们。 Streamlit 库的一个主要优势是它的易用性。开发人员可以使用 Python 代码创建可视化应用程序,并在几分钟内将它们部署到云端。此外,Streamlit 库还提供了一个强大的社区,开发人员可以在其中分享他们的代码和经验,并获得帮助和支持。 总的来说,Streamlit 是一个强大而易用的库,它为数据科学和机器学习开发人员提供了一个快速、简单的方法来创建可视化应用程序。
2024-05-14