Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

生成式人工智能或者专门的书籍教程是什么意思?这种人工智能有什么用?现在市面上有免费的吗?要是没有免费的我去翻外网也可以

Answer

生成式人工智能是一种能够创建新内容的人工智能技术。以下是关于生成式人工智能的一些详细信息:

课程方面: 台湾大学李宏毅教授的生成式 AI 课程,主要介绍了其基本概念、发展历程、技术架构和应用场景等内容。课程共 12 讲,每讲约 2 小时。通过学习该课程,可掌握基本概念和常见技术,能使用相关框架搭建简单模型,了解发展现状和未来趋势。学习内容包括:

  1. 什么是生成式 AI:定义和分类,与判别式 AI 的区别,应用领域。
  2. 生成式模型:基本结构和训练方法,评估指标,常见模型及其优缺点。
  3. 生成式对话:基本概念和应用场景,系统架构和关键技术,基于模型的对话生成方法。
  4. 预训练语言模型:发展历程和关键技术,优缺点,在生成式 AI 中的应用。
  5. 生成式 AI 的挑战与展望:面临的挑战和解决方法,未来发展趋势和研究方向。

改变创意工作方面: 生成式人工智能在创意工作中发挥着重要作用。例如,生成模型经过训练后,可针对特定内容领域进行“微调”,催生了用于生物医学、法律、法语等的专用模型,以及适用于不同目的的 GPT-3 等。NVIDIA 的 BioNeMo 是用于在超级计算规模上训练、构建和部署大型语言模型的框架,适用于生成化学、蛋白质组学和 DNA/RNA 等内容。但使用生成式人工智能仍需人工参与,人类要输入提示让其创建内容,创造性的提示会产生创造性的输出,“即时工程师”可能成为新职业。该领域已出现 DALL-E 2 图像提示书和提示市场。

学习资源

  1. 教材:《生成式 AI 导论 2024》,李宏毅。
  2. 参考书籍:《深度学习》,伊恩·古德费洛等。
  3. 在线课程:李宏毅的生成式 AI 课程。
  4. 开源项目:OpenAI GPT-3、字节跳动的云雀等。

学习方法:根据课程内容和资源,制定适合自己的学习计划,多实践、多思考。

目前市面上有部分免费的生成式人工智能资源,但也有收费的。需要注意的是,未经许可翻外网可能存在法律风险,请您谨慎选择。

Content generated by AI large model, please carefully verify (powered by aily)

References

学习笔记:《生成式AI导论2024》 李宏毅

一、课程介绍这是台湾大学李宏毅教授的生成式AI课程,主要介绍了生成式AI的基本概念、发展历程、技术架构和应用场景等内容。课程共分为12讲,每讲约2小时。二、学习目标通过学习本课程,掌握生成式AI的基本概念和常见技术,能够使用相关框架搭建简单的生成式模型,了解生成式AI的发展现状和未来趋势。三、学习内容1.什么是生成式AI生成式AI的定义和分类生成式AI与判别式AI的区别生成式AI的应用领域2.生成式模型生成式模型的基本结构和训练方法生成式模型的评估指标常见的生成式模型及其优缺点3.生成式对话生成式对话的基本概念和应用场景生成式对话系统的架构和关键技术基于生成式模型的对话生成方法4.预训练语言模型预训练语言模型的发展历程和关键技术预训练语言模型的优缺点预训练语言模型在生成式AI中的应用5.生成式AI的挑战与展望生成式AI面临的挑战和解决方法生成式AI的未来发展趋势和研究方向四、学习资源1.教材:《生成式AI导论2024》,李宏毅2.参考书籍:《深度学习》,伊恩·古德费洛等3.在线课程:李宏毅的生成式AI课程4.开源项目:OpenAI GPT-3、字节跳动的云雀等五、学习方法

学习笔记:《生成式AI导论2024》 李宏毅

一、课程介绍这是台湾大学李宏毅教授的生成式AI课程,主要介绍了生成式AI的基本概念、发展历程、技术架构和应用场景等内容。课程共分为12讲,每讲约2小时。二、学习目标通过学习本课程,掌握生成式AI的基本概念和常见技术,能够使用相关框架搭建简单的生成式模型,了解生成式AI的发展现状和未来趋势。三、学习内容1.什么是生成式AI生成式AI的定义和分类生成式AI与判别式AI的区别生成式AI的应用领域2.生成式模型生成式模型的基本结构和训练方法生成式模型的评估指标常见的生成式模型及其优缺点3.生成式对话生成式对话的基本概念和应用场景生成式对话系统的架构和关键技术基于生成式模型的对话生成方法4.预训练语言模型预训练语言模型的发展历程和关键技术预训练语言模型的优缺点预训练语言模型在生成式AI中的应用5.生成式AI的挑战与展望生成式AI面临的挑战和解决方法生成式AI的未来发展趋势和研究方向四、学习资源1.教材:《生成式AI导论2024》,李宏毅2.参考书籍:《深度学习》,伊恩·古德费洛等3.在线课程:李宏毅的生成式AI课程4.开源项目:OpenAI GPT-3、字节跳动的云雀等五、学习方法

生成式人工智能如何改变创意工作

但是,一旦生成模型经过训练,就可以使用更少的数据针对特定内容领域进行“微调”。这催生了用于生物医学内容([BioBERT](https://arxiv.org/abs/1901.08746))、法律内容([Legal-BERT](https://arxiv.org/abs/2010.02559))和法语文本([CamemBERT](https://camembert-model.fr/))的BERT专用模型,以及用于各种特定目的的GPT-3。NVIDIA的[BioNeMo](https://www.nvidia.com/en-us/gpu-cloud/bionemo/)是一个用于在超级计算规模上训练、构建和部署大型语言模型的框架,适用于生成化学、蛋白质组学和DNA/RNA。OpenAI发现,只需100个特定领域数据的具体示例即可大幅提高准确性和相关性GPT-3的输出。为了有效地使用生成式人工智能,您仍然需要在流程的开始和结束时进行人工参与。首先,人类必须向生成模型输入提示才能让它创建内容。一般来说,创造性的提示会产生创造性的输出。“即时工程师”很可能成为一个既定的职业,至少在下一代更智能的人工智能出现之前是这样。该领域已经催生了一本[82页](https://dallery.gallery/the-dalle-2-prompt-book/)的DALL-E 2图像提示书,以及一个[提示市场](https://promptbase.com/),只需支付少量费用即可购买其他用户的提示。这些系统的大多数用户在达到预期结果之前需要尝试几种不同的提示。

Others are asking
怎么进入人工智能这个行业
要进入人工智能行业,可以从以下几个方面入手: 1. 学习基础知识:了解人工智能的发展历史、基本概念和原理,包括神经网络、机器学习等。 2. 掌握相关技能:例如编程(如 Python)、数学(如线性代数、概率论)等。 3. 深入研究特定领域:如计算机视觉、自然语言处理等,选择自己感兴趣的方向进行钻研。 4. 实践项目:通过实际参与项目,积累经验和提升能力。 5. 持续学习:人工智能领域发展迅速,要不断跟进最新的技术和研究成果。 人工智能作为一个领域始于二十世纪中叶,最初符号推理流行,后因方法局限性出现“人工智能寒冬”。随着计算资源便宜和数据增多,神经网络方法在多个领域展现出色性能,过去十年“人工智能”常被视为“神经网络”的同义词。
2025-02-20
2024 年中国人工智能+产业规模
目前关于 2024 年中国人工智能+产业规模的相关信息如下: 国家统计局数据显示,2022 年全国研究与试验发展(R&D)经费投入总量首次超过 3 万亿元,达到 30782.9 亿元,比上年增加 2826.6 亿元,增长 10.1%,表明国家对科技创新和算力设施的重视和持续投入。我国算力设施产业链规模巨大,已达到万亿元级别。2022 年我国算力核心产业规模达到 1.8 万亿元,预计到 2023 年,中国算力产业规模将超过 3 万亿元。 在企业数量方面,截至 2024 年 3 月,全国算力存量企业共有 75,343 家。其中,广东省、北京市和江苏省的企业数量位居前三,分别有 10,315 家、7,167 家和 6,728 家。此外,人工智能企业数量也超过 4400 家。 德勤的报告指出,中国 AI 产业快速发展,得益于政策支持、经济增长和技术创新。成长型 AI 企业作为产业创新的重要力量,数量占比高达九成,活跃于各行业领域。预计到 2025 年,中国人工智能核心产业规模将突破 5000 亿元。 在影视行业,若假设 2027 年 AI 影视市场可以获得国内总市场份额的 10%,则国内 AI 影视总市场规模预计将达约 380 亿元以上;若假设 2030 年可以获得 25%以上市场份额,则国内 AI 影视总市场规模将达千亿级别。 营销行业或成生成式 AI 最早实现商业化落地的行业之一,未来,AI 技术还将持续推动营销行业的深刻变革。
2025-02-20
人工智能(AI)、机器学习(ML)、深度学习(DL)、生成式AI(AIGC)的区别与联系
AI(人工智能)是一个广泛的概念,旨在让机器模拟人类智能。 机器学习(ML)是AI的一个分支,指计算机通过数据找规律进行学习,包括监督学习(使用有标签的训练数据,学习输入和输出之间的映射关系,如分类和回归)、无监督学习(处理无标签数据,让算法自主发现规律,如聚类)和强化学习(从反馈中学习,以最大化奖励或最小化损失,类似训练小狗)。 深度学习(DL)是一种机器学习方法,参照人脑构建神经网络和神经元,由于网络层数较多被称为“深度”。神经网络可用于监督学习、无监督学习和强化学习。 生成式 AI(AIGC)能够生成文本、图片、音频、视频等内容形式。 它们之间的联系在于:深度学习是机器学习的一种重要方法,机器学习又是实现人工智能的重要途径,而生成式 AI 是人工智能的一个应用领域。例如,生成式 AI 中的一些技术可能基于深度学习和机器学习的算法。2017 年 6 月,谷歌团队发表的论文《Attention is All You Need》首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖于循环神经网络或卷积神经网络,对相关技术的发展具有重要意义。大语言模型(LLM)如谷歌的 BERT 模型,可用于语义理解(如上下文理解、情感分析、文本分类),但不擅长文本生成,对于生成式 AI,生成图像的扩散模型不属于大语言模型。
2025-02-19
人工智能简史
人工智能作为一个领域始于二十世纪中叶。最初,符号推理流行,带来了如专家系统等重要进展,但因从专家提取知识并以计算机可读形式表现及保持知识库准确的复杂性和高成本,20 世纪 70 年代出现“人工智能寒冬”。 随着时间推移,计算资源便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现卓越性能,过去十年中“人工智能”常被视为“神经网络”的同义词。 在国际象棋对弈程序方面,早期以搜索为基础,发展出阿尔法贝塔剪枝搜索算法,后来采用基于案例的推理,如今能战胜人类棋手的程序基于神经网络和强化学习。 在创建“会说话的程序”方面,早期如 Eliza 基于简单语法规则,现代助手如 Cortana、Siri 或谷歌助手是混合系统,未来有望出现完整基于神经网络的模型处理对话,如 GPT 和 TuringNLG 系列神经网络已取得巨大成功。 最初,查尔斯·巴贝奇发明计算机用于按明确程序运算,现代计算机仍遵循相同理念。但有些任务如根据照片判断人的年龄无法明确编程,这正是人工智能感兴趣的。 译者:Miranda,原文见 https://microsoft.github.io/AIForBeginners/lessons/1Intro/README.md
2025-02-17
人工智能时代对社会有什么冲击
人工智能时代对社会的冲击主要体现在以下几个方面: 1. 劳动力市场:预计在未来几年对劳动力市场产生重大影响,包括好的和坏的方面,但工作变化速度比多数人想象的慢,人们不必担心缺乏事情可做。 2. 能力放大:能使人类天生的创造和彼此有用的欲望得到前所未有的放大,社会将重新进入不断扩张的世界。 3. 深度学习:是一种有效的算法,计算能力和数据量越大,解决难题的能力越强,将随着规模而变得更好,对全球人民生活产生有意义的改善。 4. 个人助理:人工智能模型将很快作为自主的个人助理,代表用户执行特定任务。 5. 资源分配:获得充足的计算和能源对于实现人工智能民主化和防止不平等至关重要。 6. 风险控制:控制人工智能的风险对于最大限度地发挥其优势并确保积极的未来至关重要。 同时,在教育方面,孩子将拥有虚拟导师,能够提供个性化教学,类似概念还可应用于医疗保健改进、创建各种软件等领域,带来共享的繁荣。
2025-02-16
什么是人工智能
人工智能(Artificial Intelligence)是一门研究如何使计算机表现出智能行为的科学,例如做一些人类所擅长的事情。 最初,查尔斯·巴贝奇发明了计算机,用于按照明确的程序(即算法)进行数字运算。现代计算机虽更先进,但仍遵循受控计算理念。若知道实现目标的每一步骤及顺序,就能编写程序让计算机做事。 然而,像“根据照片判断一个人的年龄”这类任务,因无法明确大脑完成此任务的具体步骤,所以难以编写程序让计算机完成,这类任务正是人工智能感兴趣的。 人工智能分为 ANI(artificial narrow intelligence 弱人工智能)和 AGI(artificial general intelligence)。ANI 只可做一件事,如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等;AGI 能做任何人类可以做的事。 在人工智能术语方面: 机械学习是让电脑在不被编程的情况下自己学习的研究领域,是学习输入输出的映射,一般有输入 A 必然输出 B 的软件。 数据科学是分析数据集,从数据中获取结论与提示,输出结果往往是幻灯片、结论、PPT 等。 神经网络/深度学习有输入层、输出层和中间层(隐藏层)。
2025-02-16
免费语音转文本的AI工具有什么
以下是一些免费的语音转文本的 AI 工具: 1. 飞书妙记:https://www.feishu.cn/product/minutes ,是飞书的办公套件之一。 2. 通义听悟:https://tingwu.aliyun.com/home ,阿里推出的 AI 会议转录工具。 3. 讯飞听见:https://www.iflyrec.com/ ,讯飞旗下智慧办公服务平台。 4. Otter AI:https://otter.ai/ ,用于转录采访和会议纪要。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。 另外,为您推荐一些在线 TTS 工具: 1. Eleven Labs:https://elevenlabs.io/ ,ElevenLabs Prime Voice AI 是一款功能强大且多功能的 AI 语音软件,能生成逼真、高品质的音频,可高保真地呈现人类语调和语调变化,并能根据上下文调整表达方式。 2. Speechify:https://speechify.com/ ,是一款人工智能驱动的文本转语音工具,可作为 Chrome 扩展、Mac 应用程序、iOS 和 Android 应用程序使用,用于收听网页、文档、PDF 和有声读物。 3. Azure AI Speech Studio:https://speech.microsoft.com/portal ,Microsoft Azure Speech Studio 是一套服务,赋予应用程序“听懂、理解并与客户进行对话”的能力,提供 100 多种语言和方言的语音转文本和文本转语音功能,还提供自定义的语音模型。 4. Voicemaker:https://voicemaker.in/ ,可将文本转换为各种区域语言的语音,并允许创建自定义语音模型,易于使用,适合为视频制作画外音或帮助视障人士。 还有一些给视频配音效的 AI 工具,它们具有以下功能特点: 1. 支持 50 多种语言的配音,音质自然流畅。 2. 提供实时配音功能,适用于直播和演讲。 3. 将语音转录为文本,方便后期字幕制作和编辑。 4. 与多种生产力和学习工具整合。 比如 Vidnoz AI 具有以下特点: 1. 支持 23 多种语言的配音,音质高保真。 2. 支持文本转语音和语音克隆功能。 3. 提供语音参数自定义和背景音乐添加工具。 4. 提供面向个人和企业的经济实惠的定价方案。 在选择视频配音工具时,请考虑支持的语言数量、语音质量、自定义选项和价格等因素。
2025-02-23
想学习Ai制作用哪些免费软件好
以下是一些适合学习 AI 制作的免费软件: 1. 图像制作: 最透明的选项:Adobe Firefly(https://www.adobe.com/sensei/generativeai/firefly.html) 开源选项:Stable Diffusion(https://stablediffusionui.github.io/) 最佳免费选项:Bing 或 Bing Image Creator(https://www.bing.com/images/create)(使用 DALLE),Playground(https://playgroundai.com/)(允许您使用多个模型) 最佳质量图像:Midjourney(https://midjourney.com/) 2. 数字人制作: HEYGEN:人物灵活,五官自然,视频生成很快,但中文人声选择较少。 DID:制作简单,人物灵活,免费版下载后有水印。 KreadoAI:免费,功能齐全,但音色较 AI。 对于想出点子,最佳免费选项是必应(https://www.bing.com/search?q=Bing+AI&showconv=1&FORM=hpcodx),付费选项是 ChatGPT 4.0。 在制作视频方面: 用于在视频中为人脸制作动画的最佳工具是 DiD(https://www.did.com/)。 用于从文本创建视频的最佳工具是 Runway v2(https://app.runwayml.com/)。 最佳语音克隆:ElevenLabs(https://beta.elevenlabs.io/speechsynthesis)
2025-02-23
runway是每天都有免费生成次数吗
Runway 并非每天都有免费生成次数。目前只有 Gen2 每天有免费额度。使用 Runway 制作视频时,每次生成可能会消耗一定积分,例如每次生成消耗 5 积分。对于普通用户来说,免费额度可能用于实验和寻找灵感,但对于需要生成大量内容的专业人士,可能需要付费订阅。
2025-02-20
免费生成音乐的ai 软件
以下是一些免费生成音乐的 AI 软件: :与 DAW 集成的生成音乐工具,100%免版权费。 :为创意媒体提供的伦理音乐 AI。 :AI 音乐创作平台和探索声音宇宙的个人音乐制作人。 :通过音乐赋予您新的创作和表达方式。 :使用 AI 改变您的歌唱声音。 :为您的创造力和生产力提供 AI 音乐。 :使用 AI 生成声音、音效、音乐、样本、氛围等。 :带有 AI 助手并支持本地 VST 插件的网页 DAW。 :Audacity®音频编辑器的网页版。 此外,Riffusion 推出了 FUZZ 这一全新音乐生成模型,基于扩散模型,支持永久免费开放(只要服务器能撑住)。FUZZ 通过生成声谱图(Spectrogram)并转换为音频,可输入提示词(音乐类型、乐器、情绪等)生成风格匹配的音乐,支持无缝风格过渡,如从“爵士小号独奏”平滑切换到“电子舞曲节奏”。
2025-02-20
免费好用的文生视频软件 做小说漫画推文
以下是一些免费好用的文生视频软件,可用于将小说做成漫画推文视频: 1. Stable Diffusion(SD):这是一种 AI 图像生成模型,能够基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个适用于创建小说中场景和角色图像的 AI 图像生成工具。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 将小说转换成 AI 视频通常包括文本分析、角色与场景生成、视频编辑与合成等多个步骤。您可以根据具体需求选择合适的工具来完成您的小说漫画推文视频制作。
2025-02-20
免费的文生视频软件 做小说推文
以下是一些免费的可用于将小说做成视频的文生视频软件及相关网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 将小说转换成 AI 视频通常包括文本分析、角色与场景生成、视频编辑与合成等多个步骤。您可以根据自己的需求选择合适的工具来进行操作。
2025-02-20
大模型和小模型区别是什么?是否大模型都属于生成式AI,小模型属于判别式AI,为什么大模型有幻觉小模型没有?
大模型和小模型的区别主要体现在以下几个方面: 1. 规模和参数数量:大模型通常具有更多的参数和更复杂的架构,能够处理更大量和更复杂的数据。 2. 能力和性能:大模型在语言理解、生成等任务上往往表现更出色,能够生成更准确、丰富和连贯的内容。 3. 应用场景:大模型适用于广泛的通用任务,而小模型可能更专注于特定的、较狭窄的领域。 并非大模型都属于生成式 AI,小模型都属于判别式 AI。生成式 AI 能够生成新的内容,如文本、图片等;判别式 AI 则主要用于对输入进行分类或判断。模型的分类与其大小并无直接的必然联系。 大模型出现幻觉的原因主要是其通过训练数据猜测下一个输出结果,可能会因错误或不准确的数据导致给出错误的答案。而小模型相对来说数据量和复杂度较低,出现幻觉的情况相对较少,但这并非绝对,还取决于模型的训练质量、数据的准确性等多种因素。优质的数据集对于大模型减少幻觉现象非常重要。
2025-02-21
生成式AI教育场景应用 项目式学习 中小学案例
以下是一些中小学在生成式 AI 教育场景应用中采用项目式学习的案例: 北京市新英才学校: 开设“AI 创作家”小学课后服务特色课程,12 个五、六年级的学生在老师的引导和帮助下,主导设计一款实用的桌游。 学生们提出解决学校面积大导致新生和访客迷路的问题,决定制作一款学校地图桌游。 课程中,学生有时听老师讲解人工智能知识和工具使用方法,有时自己写 prompt 与大语言模型对话,还使用文生图 AI 工具生成桌游卡牌背后的图案,手绘第一版学校地图,选择游戏机制并梳理游戏流程。 在教育领域,生成式 AI 带来了诸多改变: 解决了教育科技长期以来在有效性和规模之间的权衡问题,可大规模部署个性化学习计划,为每个用户提供“口袋里的老师”,如实时交流并给予发音或措辞反馈的语言老师。 出现了众多辅助学习的产品,如教授新概念、帮助学习者解决各学科问题、指导数学作业、提升写作水平、协助创建演示文稿等。
2025-02-18
生成式AI教育场景应用 中小学案例
以下是北京市新英才学校在中小学教育场景中生成式 AI 的应用案例: 特色课程方面:学校开设了“AI 创作家”小学课后服务特色课程,12 个五、六年级的学生在老师的引导下,用 AIGC 工具设计一款实用的桌游。学生主导从收集需求、定义问题到设计背景、机制、内容、视觉,再到测试、迭代的全过程。例如,为解决学校面积大导致新生和访客迷路的问题,学生决定做一款学校地图桌游。课程中,学生学习人工智能知识、使用工具写 prompt 与大语言模型对话,还使用 OpenInnoLab平台生成桌游卡牌图案、手绘地图、选择游戏机制、梳理游戏流程。此外,还邀请中国传媒大学的吴卓浩教授合作,采用“大学生,小学生同上一节课”的方式,大学生为小学生讲解 AI 工具、试玩桌游。本学期,学生们测试并迭代桌游,使用 3D 打印机打印配件,用 ChatGPT 和 Midjourney 增强视觉设计,用 Kimi 辅助编写说明书,还计划让学生尝试用文生音乐工具 Suno 制作歌曲加入桌游 2.0 版本。 英语主课方面:初中部的英语课也融入了 AIGC 工具。魏一然协助初中部的英文老师杨佳欣和刘奕玚进行探索。在课程初期,更多是老师带着学生使用 AIGC 工具,prompt 由学生提出,老师引导。例如,在研究学校食堂食物浪费问题时,老师带着学生与 ChatGPT 对话,了解处理方法,让 ChatGPT 为学生生成生词解释和例句,形成生词库,并灵活加工生词生成题目、游戏或文章帮助学生复习单词。在关于社交媒体的英语辩论课上,尝试让学生自主使用 AIGC 工具做辩论准备。
2025-02-18
中小学AI教育场景 生成式 全息
以下是关于中小学 AI 教育场景生成式的相关内容: 北京市新英才学校在中小学 AI 教育方面进行了积极探索。跨学科项目老师带着学生用 AIGC 做学校地图桌游,英语老师在 AIGC 帮助下备课和授课,生物和信息科技老师合作带着学生训练 AI 模型以识别植物。数字与科学中心 EdTech 跨学科小组组长魏一然深入参与其中。 在英语课上,对于初中以上学生,一开始更多是老师带着使用 AIGC 工具,由学生提出 prompt,老师引导。例如在研究学校食堂食物浪费问题时,老师带着学生与 ChatGPT 对话获取信息,还让 ChatGPT 生成单词解释和例句,加工生词生成题目、游戏或文章帮助学生复习单词。在社交媒体的英语辩论课上,尝试让学生自主使用 AIGC 工具做辩论准备。 教育科技长期以来在有效性和规模之间权衡,而有了 AI 这种状况不再存在。现在可以大规模部署个性化学习计划,为每个用户提供“口袋里的老师”。像 Speak、Quazel、Lingostar 已在做实时交流并给予反馈的语言教学。Photomath、Mathly 指导学生解决数学问题,PeopleAI、Historical Figures 通过模拟与杰出人物聊天教授历史。学生在作业中也利用 Grammarly、Orchard、Lex 等工具提升写作水平,处理其他形式内容的产品如 Tome、Beautiful.ai 协助创建演示文稿。
2025-02-17
影视行业的生成式AI工具有哪些?帮我分一下类
以下是影视行业常见的生成式 AI 工具分类: 视频和图像类:Civitai、Kling AI、Viggle、Hailuo、Hedra、RunPod、Higgsfield、ThinkDiffusion、neural frames、Genmo、fal、LTX Video、CogVideoX、Morph Studio、Domo、Haiper、Pony Diffusion、Leonardo AI、Rubbrband 音频类:ElevenLabs、Hailuo、Cartesia、Sync、Tunes by Freepik 3D 类:Playhouse、Playbook、Tripo AI 故事板类:SAGA 在视频大类的分类下,按场景分,主要有以下几类: 1. 纯 AI 视频生成(RunwayML 等为代表) 2. 数字人(Heygen 等) 3. 营销类视频生成及编辑(生成内容以模板化,商业化内容为主) 4. 视频编辑(全面编辑,长剪短等) 此外,全球最大的生成式 AI 视频竞赛之一 Project Odyssey 第二季已开始,相关信息如下: 赛事官网:https://www.projectodyssey.ai/ 注册地址:https://projectodyssey.myflodesk.com/season2 赛事 Discord:https://discord.com/invite/projectodysseyai 提交地址:https://www.projectodyssey.ai/submission 时间线: 12 月 2 日:Project Odyssey 第二季开放报名 12 月 9 日:比赛规则公布 12 月 16 日:报名用户可解锁免费试用、完整规则正式发布、作品提交正式开启 1 月 16 日:提交截止,进入评审阶段 2 月 14 日:直播颁奖 参赛类别: 叙事类:通过鲜明的角色和深刻的故事情节,讲述能够打动人心的故事。 音乐视频:将视觉效果与原创音乐完美结合,打造震撼体验。 品牌创意:构思创意广告或活动视频,为虚拟品牌注入灵魂。(短于 60 秒) 创意预告片:制作极具吸引力的预告片或片头,为电影或剧集呈现特别概念。(短于 2 分 30 秒)
2025-02-16
可以查看GPTs是怎么设置的吗
以下是关于 GPTs 设置的详细步骤: 1. 放入完整的 Schema,并点击 Format 进行验证,如果不报错并显示出 Available Action 的列表,则代表成功。 2. 进行授权,输入 ClientID YOUR_ACCESS_KEY,如 ClientID 123456,并点击 Save。 3. 点击对应 Action 的 Test 验证 Action 是否可以调用。如果遇到返回数据过多造成异常的情况,也代表成功,只需在提示词中限定接口返回的数量即可。 4. 为了 GPTs 后期发布和分享,需要配置 Privacy Policy,其位置一般在网站的底部或者菜单的底部。复制 Privacy Policy 网页地址,如 Privacy policy 地址为:https://unsplash.com/privacy 。 5. 完善 GPTs 的基本配置。 6. 提示词调用方面,根据图片中各个对应关系,执行的操作需要指定 action 的名称,需要显示的字段名称指定具体的位置,比如图片作者,则使用 user.name,这样更加精确,不容易出错。完整提示词如下。注意,如果遇到图片目前无法直接显示,可以使用下载链接的方式查看,如下为应对方案的提示词和效果。如果有更好的方案,欢迎提供。 实操配置 Gapier Actions API 的步骤如下: 1. 登录地址:,点击 Copy Link 进行复制 Actions API 链接。 2. 打开 ChatGPT,点击创建 GPTs>Configure>Create new action。了解平台上支持的功能,输入来自 Gapier 的 Actions API 并点击 Import,导入成功。 3. 在 Gapier 复制授权码用于授权。在 Authentication 下选择配置图标,进入授权页面。开始配置授权码: Authentication Type:选择 API Key Auth Type:选择 Basic 输入从网站上复制的授权码,并点击 Save。若需要分享给他人或者公开发布,需要配置隐私策略码,在网页上寻找并复制,回到 GPT 上进行配置。 4. 确定调用的 Action,并在 Prompt 中引用。查看 Action 的方式分为两种,方式一:GPTs>Configure>Actions 页面;方式二:网页查看,地址为。回到 GPT>Configure 页面,引用 Action,比如调用思维导图的 API,直接输入调用 GenerateMindMap API 即可。此外,另外一种引用的方式是:只要在 Instructions 中申明清楚需求,GPT 会自动选择合适的 API。保存后试用。 创建一个 Http 服务让 GPTs 调用的步骤如下: 1. 创建一个每次产生一个随机数的 Http 服务,体验地址如下:https://gptaction.iaiuse.com/api/random 。 2. 直接在 Instructions 里面写,让它去调用接口。窗口最下面有个 Actions,这里就可以设置它和外部系统的接口。 3. 打孔 Add actions 界面,录入相关代码在 Schema 里面。点击下面的 Test 按钮,就能看到 ChatGPT 如何和服务进行交互。第一次允许它会提示是否允许外部服务,点击右边的小三角可以看到对话框,最右边那个隐私政策就是前面设置的。针对每个 action 都可以设置独立的隐私政策。通过这样一个简单的示例,了解 GPTs 如何和外部的服务进行交互,扩展它的能力。
2025-02-09
deepseek是免费的吗?
DeepSeek 目前网页登录很方便,国内能访问。其官方目前提供的服务完全免费,任何人随时随地可用,比如通过网页(https://www.deepseek.com/zh )即可使用。但需要注意的是,官方 App 免费,而 API 服务需按量付费。
2025-01-28
购物推荐的aiagent 目前有好用的吗
以下是一些好用的购物推荐的 AI Agent: AutoGPT GUI:其 GUI 已开放 waitlist,可在 https://news.agpt.co/ 注册。 MULTI·ON plugin by MULTI·ON:今年 2 月开始使用,能在笔记本电脑上自动执行许多任务。现开发了 ChatGPT 插件,功能强大。链接:https://www.multion.ai/ ,演示:https://twitter.com/DivGarg9/status/1648394059483054081 。 BabyBeeAGI:由 Yohei 本人开发,有更强的任务管理等能力,但速度较慢,适合处理复杂任务。链接:https://replit.com/@YoheiNakajima/BabyBeeAGI?v=1 。 MiniAGI:基于 GPT3.5Turbo/4 的最小通用自主代理,保留简单实用功能,可执行多种任务,如订比萨。链接:https://github.com/muellerberndt/miniagi 。 此外,智谱的 AutoGLM 经过深度测试,展现出了较好的场景理解能力,如能准确区分“帮我买一杯咖啡”和“帮我买一包咖啡豆”并打开相应应用,但目前离好用还有一定距离,存在语音识别偏差、复杂界面操作稳定性待提升、只支持安卓等问题。 Cursor 虽然免费版只有 chat 功能,但其中的 Agent 功能只要给一个模糊指令,就会自动规划和解决问题。Cline 作为一个 AI 助手,能力有保障,长期霸榜 OpenRouter token 消耗榜,新版本还推出检查点功能。实际体验中,DeepSeekV3 和 Gemini 2.0 Flash Thinking 可作为不错的候选。
2025-01-26
在comfyUI中可以接入哪些api,又和3D相关的吗
在 ComfyUI 中可以接入以下与 3D 相关的 API: 1. @CSM_ai:可以将文本、图像或草图转换为 3D 素材,并直接应用于游戏中,无需后期处理。体验地址:https://cube.csm.ai ,https://x.com/xiaohuggg/status/1763758877999587757?s=20 2. Move AI 推出的 Move API:可以从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。链接:https://move.ai/api ,https://x.com/xiaohuggg/status/1761590288576061573?s=20 3. ComfyUI 3D Pack 引入 3D 图像处理:可以快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。链接:https://github.com/MrForExample/ComfyUI3DPack/tree/main ,https://x.com/xiaohuggg/status/1755824687811346514?s=20 此外,ZHO 博主有关于 ComfyUI 的更新记录: 1. 4 月 18 日,ComfyUI Stable Diffusion 3 API 已更新为 V1.5 版,图生图和 SD3 Turbo 都可以正常使用,但 SD3 图生图模式不支持选择比例,SD3 Turbo 模型不支持负面提示词。使用方法是先申请 API,然后填入 config.json 文件即可(每账户 25 免费积分),SD3 每张图 6.5 积分(比较贵)。项目地址:https://github.com/ZHOZHOZHO/ComfyUIStableDiffusion3API ,SD3 API ComfyUI 节点测试成功。 2. 4 月 17 日,Stability AI 刚刚发布了 Stable Diffusion 3 和 Stable Diffusion 3 Turbo,现在已经可通过 Stability AI 开发者平台 API 使用,SAI 计划在不久的将来通过会员资格提供模型权重。详情:https://bit.ly/3W43FjY
2025-01-14
有什么AI模型可以制作瞬息宇宙?比如Stable Diffusion,还有别的吗?
以下是一些可以用于制作类似效果的 AI 模型: 1. Adobe Firefly:内置在各种 Adobe 产品中,不过在质量方面稍逊于 DALLE 和 Midjourney,但它只使用有权使用的图像进行训练。 2. Stable Diffusion:开源模型,可以在任何高端计算机运行。开始时需要学会正确制作提示,一旦掌握能产生很好的结果,尤其适合将 AI 与其他源的图像结合。 3. DALLE:来自 OpenAI,已纳入 Bing(需使用创意模式)和 Bing 图像创建器,系统可靠但效果比 Midjourney 稍差。 4. Midjourney:2023 年中期最好的系统,学习曲线最低,只需键入特定指令就能得到很好的结果,需要 Discord。 此外,在游戏制作领域,已经出现了用于游戏中几乎所有资产的生成式人工智能模型,从 3D 模型到角色动画,再到对话和音乐。但文中未提及具体的模型名称。
2025-01-10
科学家现在完全了解gpt是怎么工作的吗
目前科学家尚未完全了解 GPT 的工作原理。以下是一些关于 GPT 工作原理的相关知识: Openai 的科学家认为,GPT 产生智能是因为神经网络将知识进行了复杂的压缩,在询问问题时将其中的知识解码(解压缩)。大语言模型的数据压缩能力越强,意味着其 AGI 智能越强。遵循最小描述长度原理和奥卡姆剃刀原则,最佳解释应是对数据进行尽可能短而准确描述的模型,模型描述长度越短,泛化性越好,也就越智能。 GPT 中的知识存在方式包括:LLM 中有两类神经元,单语义神经元只对输入里某个特殊的知识点产生响应,多语义神经元则相反。在模型学习过程中,为了增加模型参数的利用效率,“单语义神经元”会被分配给重要特征,“多语义神经元”会分配给不太重要的特征,而对更加不重要的特征,模型完全不进行编码。此外,存在知识回路,某个任务的 Prompt 输入 Transformer 后,在网络中存在一些完成这个任务的关键路径,信息主要沿着这条路径向上传播,在传播过程中不断进行信息传递或知识加工,最终完成任务,这与人脑的某些信息处理回路相似。 GPT3 的训练是将模型暴露于大量文本的过程,包含 3000 亿个文本标记的数据集用于生成模型的训练示例。训练时,我们只向模型展示特征并要求它预测下一个单词,模型的预测会有错误,计算其预测中的误差并更新模型,以便下次做出更好的预测,重复数百万次。GPT3 实际上一次生成一个 token 的输出。 GPT 全称是生成式预训练转换器模型(Generative Pretrained Transformer)。生成式指的是大模型根据已有的输入为基础,不断计算生成下一个字词(token),从而逐字完成回答的过程。例如,一开始给大模型一些提示词 Prompt,大模型会结合自身“大脑中存储的知识”进行计算推理,算出下一个单词的概率最大并输出,新的输出会和过去的输入一并成为新的输入,用来计算下一个词,直到计算出下一个词是的概率最大,于是结束输出。
2024-12-31