Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

斯坦福大学新出的AI工具storm

Answer

以下是关于斯坦福大学新出的 AI 工具 STORM 的相关信息: STORM 是斯坦福大学开发的创新写作系统,能够自动化编写具有维基百科深度的长篇文章。它通过模拟人类写作过程中的预写、起草和修订阶段,实现自动化的信息收集和大纲创建。相关链接:https://arxiv.org/abs/2402.14207 ,https://x.com/xiaohuggg/status/1762308686259929162?s=20

Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

🔗https://x.com/xiaohuggg/status/1762319994833232353?s=205️⃣✍️STORM:斯坦福大学开发的创新写作系统自动化编写具有维基百科深度的长篇文章。通过模拟人类写作过程中的预写、起草和修订阶段,自动化信息收集和大纲创建。🔗https://arxiv.org/abs/2402.14207🔗https://x.com/xiaohuggg/status/1762308686259929162?s=206️⃣🐾Sora最新视频:创造未知生物根据提示,创造逼真的从未存在过的动物,自然纪实风格。🔗https://x.com/xiaohuggg/status/1762296483792191505?s=207️⃣🤝微软与Mistral合作Mistral AI推出性能接近GPT-4的Mistral Large模型,支持复杂多语言任务。🔗https://x.com/xiaohuggg/status/1762291157776892282?s=208️⃣🗣️MeloTTS:多语言文本到语音库支持多种语言,包括英语、中文等,支持实时语音合成。🔗https://x.com/xiaohuggg/status/1762279049056153743?s=20

XiaoHu.AI日报

🔗https://x.com/xiaohuggg/status/1762319994833232353?s=205️⃣✍️STORM:斯坦福大学开发的创新写作系统自动化编写具有维基百科深度的长篇文章。通过模拟人类写作过程中的预写、起草和修订阶段,自动化信息收集和大纲创建。🔗https://arxiv.org/abs/2402.14207🔗https://x.com/xiaohuggg/status/1762308686259929162?s=206️⃣🐾Sora最新视频:创造未知生物根据提示,创造逼真的从未存在过的动物,自然纪实风格。🔗https://x.com/xiaohuggg/status/1762296483792191505?s=207️⃣🤝微软与Mistral合作Mistral AI推出性能接近GPT-4的Mistral Large模型,支持复杂多语言任务。🔗https://x.com/xiaohuggg/status/1762291157776892282?s=208️⃣🗣️MeloTTS:多语言文本到语音库支持多种语言,包括英语、中文等,支持实时语音合成。🔗https://x.com/xiaohuggg/status/1762279049056153743?s=20

AIGC Weekly #27

近年来,生成式人工智能的进展使得在文本、视觉和音频等多个领域中创造新内容成为可能。这些模型通常依赖于将原始数据首先转换为一系列标记的压缩格式。在音频方面,神经音频编解码器可以将波形有效地压缩为紧凑的表示形式,这可以被反转以重构原始音频信号的近似值。通过将音频表示为一系列离散的标记,可以使用基于Transformer的序列到序列模型进行音频生成。与AutoLM等许多生成音频模型不同,SoundStorm能够并行生成标记,从而将推理时间减少了100倍,并产生了相同质量的音频和更高的语音和声学条件一致性。[heading2][AI或死亡:引领用户研究新时代](https://bootcamp.uxdesign.cc/ai-[content]本文讨论了传统用户研究方法在现代产品开发中的局限性,以及人工智能(AI)在用户研究中的应用。随着产品交付速度的加快,传统用户研究方法已经无法跟上节奏,导致产品团队在决策过程中缺乏及时、丰富和可行的用户见解。AI可以帮助用户研究克服这些挑战,通过处理复杂任务、快速筛选大型非结构化数据集并进行智能预测和判断,AI已经开始重塑行业。AI在用户研究中的潜在价值巨大,可以限制偏见、弥合文化和语言障碍、进行上下文、定位和触发式研究、24/7收集数据、无限扩展并在采访时分析数据,以实时揭示行为和态度。AI在用户研究中的应用已经开始出现,分为“启动器”和“执行者”两种类型的工具。在未来,AI将成为用户研究的重要工具,帮助企业更好地理解和满足用户需求。

Others are asking
最近国内外 有什么新出的AI产品
以下是国内外新出的一些 AI 产品: 图像类产品: 国内: 可灵:由快手团队开发,用于生成高质量的图像和视频,图像质量高,最初采用内测邀请制,现向所有用户开放,价格相对较高,重度用户年费可达几千元,平均每月使用成本在 400 到 600 元,也有临时或轻度使用的免费点数和较便宜包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,生成图像质量高、细节丰富,操作界面简洁直观、用户友好度高,能与阿里其他产品和服务无缝整合,重点是现在免费,每天签到获取灵感值即可,但存在某些类型图像无法生成、处理非中文语言或国际化内容不够出色、处理多元文化内容可能存在偏差等局限性。 搜索类产品: 国内:大模型厂商推出的 ChatBot 产品(智谱清言、Kimi Chat、百小应、海螺 AI 等),搜索厂商或创业团队推出的 AI 搜索产品(360 AI 搜索、秘塔、博查 AI、Miku 等)。 海外:Perplexity、You、Phind 等。 中国公司和团队的出海产品:ThinkAny、GenSpark、Devv 等。 PPT 类产品: 国内:爱设计 PPT,背后有实力强大的团队,对市场需求有敏锐洞察力,把握住了 AI 与 PPT 结合的市场机遇,已确立市场领先地位,代表了当前国内 AI 辅助 PPT 制作的最高水平,能提高制作效率并保证高质量输出。
2025-01-06
斯坦福大学新出的AI工具storm,storm的主要功能有哪些,如何使用
STORM 是斯坦福大学开发的创新写作系统,主要功能包括: 1. 自动化编写具有维基百科深度的长篇文章。 2. 通过模拟人类写作过程中的预写、起草和修订阶段,实现自动化信息收集和大纲创建。 关于如何使用,目前提供的信息中未明确提及具体的使用方法。但您可以通过以下途径获取更多使用相关的信息: 1. 访问相关链接:https://arxiv.org/abs/2402.14207 、https://x.com/xiaohuggg/status/1762308686259929162?s=20 。 此外,还有一种用于语音增强和去发声的随机再生模型 StoRM : 1. 代码获取:https://github.com/spuhh/storm 2. 演示查看:https://www.inf.unihamburg.de/en/inst/ab/sp/publications/storm 3. 论文查阅:https://arxiv.org/abs/2212.11851 其核心在于随机再生方法,能够结合预测模型和基于扩散的生成模型的优势,生成更清晰、更自然的语音输出。在实际应用中,可从受损的语音信号中恢复出干净的语音,且通过减少逆向扩散步骤的数量和避免使用复杂的修正器,显著降低了计算负担。在实验中,其在多个标准数据集上的表现均超过了现有的预测性和生成性语音增强方法。源代码和音频示例已公开,方便研究人员和开发者进一步探索和应用。
2025-01-03
openAI新出的o1是什么
OpenAI 于北京时间 9 月 13 号凌晨 1 点多宣布推出模型 o1perview 与 o1mini(真正的 o1 版本将在后续开放),拥有 Plus 版本的用户会陆续收到新模型权限,并可在 Web 客户端中尝鲜体验。 在评估结果方面: o1 在 2024 美国数学奥林匹克竞赛(AIME)资格赛中跻身美国前 500 名学生之列。 o1 在竞争性编程问题(Codeforces)中排名第 89 个百分位(这个版本的模型还没发布),而 o1perview 拿到了 62 个百分位。 在物理、生物和化学问题的基准(GPQA),o1 与 o1perview 都超过了人类博士水平的准确性。 关于“超过人类博士水平”的测试,OpenAI 在新 page 中答复:“我们还在 GPQA diamond 上评估了 o1,这是一个困难的智力基准测试,用于测试化学、物理和生物学方面的专业知识。为了将模型与人类进行比较,我们招募了拥有博士学位的专家来回答 GPQAdiamond 的问题。我们发现 o1 的表现超越了这些人类专家,成为第一个在这个基准测试上做到这一点的模型。”但 OpenAI 也表示“这些结果并不意味着 o1 在所有方面都比博士更有能力——只是说明该模型在解决一些预期博士能够解决的问题上更加熟练。在其他几个机器学习基准测试上,o1 改进了最先进的水平。” 推理模型的准确率不断攀升,这意味着 AI 技术可以渗透到更多行业、更多高精尖业务中去。OpenAI 推出的新模型为整个行业注入了强心剂,带来了新的活力和希望。从 OpenAI 提出的通往 AGI(通用人工智能)的分级来看,我们正在从第一级向第二级迈进,未来可能会见证 AI 从单纯的生成工具向真正的智能体转变。此外,4o 模型和 o1 在推理方面差距较大,红色线代表 4o 的得分,绿色线代表 o1 的得分,o1 在各项得分结果上均优于 4o。
2024-09-18
大学生怎样用AI帮助自己学习?
以下是大学生利用 AI 帮助自己学习的一些方法: 1. 要求 AI 解释概念:可以向 AI 提问,让其解释各种学习中的概念,以获得良好的结果。例如,可参考。但要注意,因为 AI 可能会产生幻觉,所以对于关键数据要根据其他来源仔细检查。 2. 制作提问类的 GPT 辅助学习:如 CFU 大师(Check for Understanding),基于布鲁姆对理解这一认知维度的拆分理论,设计层层递进的引导问题检验学习者的理解程度。例如,其关于被动语态的提问非常精妙,能帮助学生理解应用而非刷题背诵知识点。 3. 利用个性化学习计划:AI 可以大规模部署个性化的学习计划,为每个用户提供一个“口袋里的老师”,理解其独特需求,并回答问题或测试技能。例如像等已经在做这样的事情。 4. 学习特定科目:有一些应用可以指导学生解决数学问题,如。 5. 提升写作水平:借助像 Grammarly、这样的工具克服写作难题。 6. 处理其他形式内容:使用协助创建演示文稿等。 更多关于 AI 时代学习的未来,可了解。
2025-02-06
多模态是什么?如何使用多模态模型构建 AI 智能体
多模态是指对同一概念的多维度理解,例如人类可以边看、边交谈,还能同时听着背景音乐和察觉危险,而仅靠语言来描述和理解世界是远远不够的。拥有多模态能力的模型可以更全面地学习世界,理解人类的行为和需求,提高任务解决能力,并克服单一模态的局限性,是让 AI 能在现实世界中运行极为重要的一环。 2023 年 9 月 GPT4v 的发布把大语言模型的竞赛带入了多模态模型(LMM Large Multimodal Models)的时代,如 ChatGPT 可以看图说话,还能通过内置的 DallE 3 直接画图;几个月后 Google 的 Gemini 正式推出,直接支持了文本、视频和声音多种模态。今年 5 月,OpenAI 完成了 GPT4 的实时听说和视频模态输入,发布了 GPT4o,向智能体方向迈进了一大步。 多模态大模型由解码器、backbone、Generator 等部件组成,左侧多模态理解,右侧生成输出。其架构基于大圆模型,能识别页面组件结构和位置绝对值信息,并与组件、文本映射。 在应用方面,多模态模型有着广泛的用途。例如 Stable Diffusion 模型可用于带货商品图生成、模特服装展示、海报生成、装修设计等。吉梦 AI 提供 AI 视频生成等能力,吐司是类似的在线生成平台,具备多种 AI 能力。 关于模型训练,需要大量图像数据和标签化处理。AI 视频生成原理主要基于特定架构,如基于 Sara 的整体架构,采用 diffusion Transformer 架构,以扩散模型通过随机造点、加噪和去噪得到连续图像帧,输入视频可看成若干帧图片,经处理后生成视频。Meta 的视频生成模型能生成视频和声音,可替换视频中的物体和人脸,其把 diffusion 架构换成纯 transformer 架构,基于 LLAMA3 训练,与 diffusion 在 CLIP 等方面有区别。 要使用多模态模型构建 AI 智能体,需要考虑实时性,保持模型能力不变的情况下缩小参数规模,升级架构来提升性能,最好让终端也参与进来分担一部分模型的计算量。同时,让科技变简单,设计出从未有过的硬件产品或重新设计现有的产品,以适应这种毫无机械感、完全类人化的交互方式。
2025-02-06
批改作文时使用什么ai
在批改作文时,可以利用以下 AI 技术和方案: 1. 抓取错词错句: 依赖模型深厚的语言处理能力和对长文本的细致分析能力,精确定位每一个错误,并在理解上下文的基础上提出修改建议。 具备深层次语义理解,能在复杂语境中辨识不恰当词汇和错误句子构造。 基于大规模数据识别,辨别出罕见的词汇或句子搭配。 能够基于上下文相关性评估,有效识别语法正确但语境不适宜的用词。 吸收众多语法规则知识,检测句子是否遵守语法标准。 2. 好词好句识别评测: 模型能模拟一定水平的文学素养,辨别出具有表现力、形象生动或富含智慧的词汇和句子。 有能力辨识不同的写作风格和修辞技巧,挑选出提升文章感染力的佳词妙句。 能够对句子的情感倾向和语气进行解析,识别出有效表达作者意图和情感的优质语句。 3. 作文综合评价评分: 可以综合考虑文章的内容、结构、语言等多个维度,给出全面细致的评价。 按照预定的评分标准,如内容完整性、逻辑性、语言准确性等,进行客观评分。 能够根据学生的写作特点和水平提供个性化的评价和建议。 保证评价标准的一致性,减少主观差异带来的评分不公。
2025-02-06
作文批改ai
以下是关于作文批改 AI 的相关内容: 在评价作文时,需要考虑多个因素,包括错别字、词、标点识别,好词好句识别、内容评价、逻辑结构评价、语言表达评价、段落评价等。我们可以利用大模型高效、准确、丰富知识的优秀特点,对学生作文进行综合打分。 场景一:抓取错词错句 在作文批改过程中,识别错词错句及优化病句的建议,依赖于模型深厚的语言处理能力和对长文本的细致分析能力。该模型能够精确地定位每一个错误,并在理解上下文的基础上,提出符合学生年级和作文主题的修改建议。其具备以下能力: 1. 深层次语义理解:大型语言模型具备深入理解句子内涵的能力,即便处于复杂语境,也能有效辨识出不恰当的词汇和错误的句子构造。 2. 大规模数据识别:这些模型在训练过程中接触了巨量的文本资源,这让它们能够辨别出哪些词汇或句子搭配在正式书面语中较为罕见,进而准确标出错词错句。 3. 上下文相关性评估:模型有能力基于上下文来判定词语和句子的恰当性,即便是语法正确但语境不适宜的用词也能被有效识别。 4. 语法规则习得:在训练过程中,模型吸收了众多的语法规则知识,这使其能够检测句子是否遵守了语法标准。 场景二:好词好句识别评测 在运用修辞技巧方面,学生作文中的隐喻、双关等深层次含义,对解读能力提出了更为严峻的挑战。GLM4Plus 模型具备洞悉这些弦外之音的能力,能够挖掘作文背后的深层思想。具体表现为: 1. 文学素养模拟:经过训练,大型模型能够模仿一定水平的文学品质,辨别出那些具有表现力、形象生动或富含智慧的词汇和句子。 2. 风格与修辞的辨识:该模型有能力辨别不同的写作风格和修辞技巧,进而挑选出那些能够提升文章感染力的佳词妙句。 3. 情感与语气的解析:模型能够对句子的情感倾向和语气进行解析,识别出那些能有效表达作者意图和情感的优质语句。 场景三:作文综合评价评分 作文的内容往往涉及特定的文化背景和历史知识,这对于评价者来说是一个挑战。GLM4Plus 模型凭借其丰富的知识库,能够精准把握这些文化细节,确保评价的准确性。逻辑结构和论证分析是评价作文不可或缺的部分。具体特点如下: 1. 综合评价能力:大型模型可以综合考虑文章的内容、结构、语言等多个维度,给出全面而细致的评价。 2. 标准化的评分系统:模型可以根据预定的评分标准,如内容完整性、逻辑性、语言准确性等,对作文进行客观评分。 3. 个性化反馈:模型能够根据学生的写作特点和水平提供个性化的评价和建议,帮助学生有针对性地提高。 4. 一致性保证:与人工评分相比,模型评分可以保证评价标准的一致性,减少主观差异带来的评分不公。 此外,如果担心 AI 削弱孩子思考力,正确的用法能助力拓展思维边界。比如将任务改成让孩子提交一份他和 AI 共同完成作文的聊天记录,作文需要由 AI 来写,孩子要对 AI 的作文进行点评批改、让 AI 迭代出更好地文章。对话记录里孩子能否说清楚 AI 写的作文哪里好哪里不好、要怎么改(孩子可能还得给 AI 做示范),才是评价的关注点。
2025-02-06
作文批改ai
以下是关于作文批改 AI 的相关内容: 在评价作文时,需要考虑多个因素,包括错别字、词、标点识别,好词好句识别、内容评价、逻辑结构评价、语言表达评价、段落评价等。我们可以利用大模型高效、准确、丰富知识的优秀特点,对学生作文进行综合打分。 场景一:抓取错词错句 在作文批改过程中,识别错词错句及优化病句的建议,依赖于模型深厚的语言处理能力和对长文本的细致分析能力。该模型能够精确地定位每一个错误,并在理解上下文的基础上,提出符合学生年级和作文主题的修改建议。其具备以下能力: 1. 深层次语义理解:大型语言模型具备深入理解句子内涵的能力,即便处于复杂语境,也能有效辨识出不恰当的词汇和错误的句子构造。 2. 大规模数据识别:这些模型在训练过程中接触了巨量的文本资源,这让它们能够辨别出哪些词汇或句子搭配在正式书面语中较为罕见,进而准确标出错词错句。 3. 上下文相关性评估:模型有能力基于上下文来判定词语和句子的恰当性,即便是语法正确但语境不适宜的用词也能被有效识别。 4. 语法规则习得:在训练过程中,模型吸收了众多的语法规则知识,这使其能够检测句子是否遵守了语法标准。 场景二:好词好句识别评测 在运用修辞技巧方面,学生作文中的隐喻、双关等深层次含义,对解读能力提出了更为严峻的挑战。GLM4Plus 模型具备洞悉这些弦外之音的能力,能够挖掘作文背后的深层思想。具体表现为: 1. 文学素养模拟:经过训练,大型模型能够模仿一定水平的文学品质,辨别出那些具有表现力、形象生动或富含智慧的词汇和句子。 2. 风格与修辞的辨识:该模型有能力辨别不同的写作风格和修辞技巧,进而挑选出那些能够提升文章感染力的佳词妙句。 3. 情感与语气的解析:模型能够对句子的情感倾向和语气进行解析,识别出那些能有效表达作者意图和情感的优质语句。 场景三:作文综合评价评分 作文的内容往往涉及特定的文化背景和历史知识,这对于评价者来说是一个挑战。GLM4Plus 模型凭借其丰富的知识库,能够精准把握这些文化细节,确保评价的准确性。逻辑结构和论证分析是评价作文不可或缺的部分。GLM4Plus 模型能够识别并评估论点的合理性,确保作文的逻辑性和论证的有效性得到恰当的评价。具有以下特点: 1. 综合评价能力:大型模型可以综合考虑文章的内容、结构、语言等多个维度,给出全面而细致的评价。 2. 标准化的评分系统:模型可以根据预定的评分标准,如内容完整性、逻辑性、语言准确性等,对作文进行客观评分。 3. 个性化反馈:模型能够根据学生的写作特点和水平提供个性化的评价和建议,帮助学生有针对性地提高。 4. 一致性保证:与人工评分相比,模型评分可以保证评价标准的一致性,减少主观差异带来的评分不公。 此外,如果担心 AI 削弱孩子思考力,正确的用法能助力拓展思维边界。比如将任务改成让孩子提交一份他和 AI 共同完成作文的聊天记录,作文需要由 AI 来写,孩子要对 AI 的作文进行点评批改、让 AI 迭代出更好地文章。对话记录里孩子能否说清楚 AI 写的作文哪里好哪里不好、要怎么改(孩子可能还得给 AI 做示范),才是评价的关注点。
2025-02-06
怎么开始学习AI使用课程?
以下是关于如何开始学习 AI 使用课程的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 微软相关课程: 如需了解云计算中的人工智能主题,可以考虑参加《》课程。 人工智能的商业应用案例方面,可以学习《》(和欧洲工商管理学院 INSEAD 共同开发)。 经典机器学习可参考《》。 使用 Azure 认知服务(Azure Cognitive Services)来创建实用的人工智能应用,可从《》等微软课程开始学习。
2025-02-06