Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

怎么能让AI生成5000字以上的小说或论文?

Answer

以下是让 AI 生成 5000 字以上小说或论文的一些方法和经验:

  1. 丰富细化:先让 AI 写故事概要和角色背景介绍,并基于此按自己的审美略做修改。使用让 AI 以表格形式输出细节描述的技巧,这样有打破叙事习惯、便于局部调整、确保内容具体等好处。
  2. 串联成文:把生成的表格依次复制粘贴,让 AI 照着写文章,过程中可能需要您给点建议。
  3. 注意要求:比如某些小说大赛要求最终作品必须是 AI 直接输出的,不能有任何改动,且有字数限制。
  4. 标题选择和评估:当文章接近目标字数时,与 AI 讨论标题选项并做整体评估,修改语法错误和表达不一致的地方。

例如,在将 1000 字的文章扩展到 5000 字的过程中,通过与 AI 持续互动,不仅能节省时间,还能提升文章的深度和广度。但也要认识到,人类创作者在利用 AI 工具时,要保持创造力和批判性思维。

Content generated by AI large model, please carefully verify (powered by aily)

References

南瓜博士:平生第一次写小说获奖,是AI帮我的!

接下来,要让AI一段一段进行细节描写了。为了确保文章前后一致,我先让AI帮助先写故事概要和角色背景介绍,并在其基础上按自己的审美略做修改。下面我用了一个重要技巧:让AI以表格的形式输出细节描述。这样做的有三个好处:一是打破AI原本的叙事习惯。如果直接让AI输出整段文字,它作为一个根据概率算下一个字的模型,特别容易出陈词滥调,改成表格后就好了很多。二是按编号做局部调整很容易,指哪改哪,别的内容都能够稳定保持不变。三是确保内容都是具体的细节。之前整段输出时文字太长,让缩减则减到丢光细节只有笼统介绍。[heading1]四、串联成文[content]把上一步生成的五个表格依次复制粘贴,AI就照着写文章了。偶尔会需要我帮个忙给点建议。[heading1]五、失败的局部修改[content]小说大赛有个要求:最后的作品必须是AI直接吐出来的,不能有任何改动,不能超过2000字。我的小说2300+字,只好让GPT-4做修改,一开始它列的有模有样的,可惜很快就暴露出记性不好的缺点。我还没来得及高兴呢,就发现它失忆得很彻底😂眼看截止时间快到了,只能求助Claude,把文章和GPT生成的修改意见一股脑儿都贴给它,让它生成作品,匆匆截图提交。没想到,Claude把关键情节给改没了,没有了马克偷偷看艾拉,也没有无名猫受伤的原因。

南瓜博士:平生第一次写小说获奖,是AI帮我的!

接下来,要让AI一段一段进行细节描写了。为了确保文章前后一致,我先让AI帮助先写故事概要和角色背景介绍,并在其基础上按自己的审美略做修改。下面我用了一个重要技巧:让AI以表格的形式输出细节描述。这样做的有三个好处:一是打破AI原本的叙事习惯。如果直接让AI输出整段文字,它作为一个根据概率算下一个字的模型,特别容易出陈词滥调,改成表格后就好了很多。二是按编号做局部调整很容易,指哪改哪,别的内容都能够稳定保持不变。三是确保内容都是具体的细节。之前整段输出时文字太长,让缩减则减到丢光细节只有笼统介绍。[heading1]四、串联成文[content]把上一步生成的五个表格依次复制粘贴,AI就照着写文章了。偶尔会需要我帮个忙给点建议。[heading1]五、失败的局部修改[content]小说大赛有个要求:最后的作品必须是AI直接吐出来的,不能有任何改动,不能超过2000字。我的小说2300+字,只好让GPT-4做修改,一开始它列的有模有样的,可惜很快就暴露出记性不好的缺点。我还没来得及高兴呢,就发现它失忆得很彻底😂眼看截止时间快到了,只能求助Claude,把文章和GPT生成的修改意见一股脑儿都贴给它,让它生成作品,匆匆截图提交。没想到,Claude把关键情节给改没了,没有了马克偷偷看艾拉,也没有无名猫受伤的原因。

AI应用专家的实战经验:如何通过智能工具实现博客的高效数字化转型

当文章扩展到接近5000字时,我再次与AI合作,讨论了几个可能的标题选项。最终,我们选定了”AI与人类协作:重塑内容创作的未来”这个标题,因为它既吸引人又准确概括了文章的核心内容。AI还对整篇文章进行了最后的评估,指出了一些微小的语法错误和表达不一致的地方,我据此做了最后的修改。[heading4]成果和反思[content]最终,这篇文章从最初的1000字扩展到了5200字。整个过程耗时约4小时,比我独立完成节省了至少60%的时间。更重要的是,通过与AI的持续互动,文章的深度和广度都得到了显著提升。这个过程让我深刻体会到,AI不仅是一个高效的写作助手,更是一个强大的思维拓展工具。它帮助我从多个角度思考问题,发现了我原本可能忽视的观点。同时,这种协作方式也启发我去思考人类创作者在AI时代的独特价值——我们需要学会如何更好地利用AI工具,同时保持自己的创造力和批判性思维。

Others are asking
我需要你给我生成一些提示词,我会给你我想的想法。《》以内的是想法。《我想写一篇影视解说的文案,写作的视角以我,第一人称的视角来写。想要风格偏幽默风趣一点,就像跟朋友在讲述一样,可以模仿鲁迅先生的手法。而且还想把影片的剧情内容写出来,从开篇到电影的结尾,如果有需要保留原片的地方,请把原片的画面场景以及时间段描述出来。要求这篇文案要附上我自己的内心独白,以此引人深思!请你深度思考后,在做答复!要求字数不少于5000字。》请问我该如何写提示词?请你整理好提示词后发给我
以下是为您生成的一些提示词,希望对您有所帮助: 影视解说文案提示词 1. 以第一人称幽默风趣的口吻,像与朋友讲述般,描绘影片从开篇到结尾的精彩剧情,融入自己的内心独白,模仿鲁迅先生的手法,展现独特的视角和深刻的思考。 2. 用轻松幽默的语言,以我的视角详述影片情节,穿插搞笑的评论和内心想法,借鉴鲁迅先生的讽刺技巧,使解说引人入胜。 3. 以亲切自然的叙述方式,如同与好友聊天,讲述影片故事,从开头至结束,结合鲁迅先生的文风,加入个人的情感起伏和独特见解。 DALL·E 相关提示词 1. 绘画:提及颜料种类、画布纹理和笔触形状/纹理(列表)。 2. 数字:注明使用的软件、阴影技术和多媒体方法(列表)。 3. 基于详细提示使用 DALL·E 3 生成图像,让创意鲜活起来,为提示的每个元素做出大胆有趣的选择。 4. 遵循提示指南,提出四个全新的简单概念,而非完整提示,从上次给出的建议中获取灵感。 请注意,默认方面比率为正方形(1:1),默认风格为摄影,包括相机设置、摄影类型和设备。同时,避免违反服务条款的词汇或概念,不侵犯版权,不使用暗示性或露骨的图像,强调符合 G 级评级的元素。
2025-02-06
根据自己5000小时的视频制作属于自己的数字人
以下是根据您 5000 小时的视频制作属于自己的数字人的方法: 生成数字人: 1. 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,然后点击右下角的“添加数字人”,将其添加到当前视频中。剪映会根据提供的内容生成对应音视频,并添加到视频文件的轨道中,左下角会提示渲染完成时间。之后可点击预览按钮查看效果。 2. 增加背景图片:删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地一张图片上传,如书架图片,点击图片右下角的加号将其添加到视频轨道(会覆盖数字人)。书架图片所在轨道会新增,将轨道最右侧的竖线向右拖拽至视频最后使其在整个视频播放时显示。选中背景图片所在轨道,在显示区域拖动图片的角将其放大到适合尺寸,如覆盖视频窗口,并将数字人拖动到合适位置。 3. 增加字幕:点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。完成后点击右上角的“导出”按钮,导出视频备用。 AI 换脸: 打开 facefusion 软件,返回实例列表,点击自定义服务按钮,通过 web 浏览器访问 facefusion 提供的 UI 界面。在 facefusion 软件界面上传准备好的图片、视频,在右侧可看到预览效果,点击下方的开始按钮执行换脸处理。处理完成后,在输出位置会出现处理后的视频,输出窗口右上角有下载按钮,可导出换脸后的视频到本地。 本次制作的成本和时间: 1. 时间:大约 10 分钟左右。 2. 制作数字人视频:免费。 3. 数字人换脸:约 0.8 元。 4. 数字人换脸时长:经实际测试 1 分 28 秒的视频,总转换时间在 200 秒。GPU 服务器此次整体运行时长所需花费 0.97 元,facefusion 软件运行只占服务器运行时长的一部分,所以换脸的成本约 0.8 元。
2024-08-14
我现在需要写一篇工作经验分享发言稿,有什么好用的AI工具可以帮我生成一篇5000字的发言稿吗?
以下为您推荐一些可能有助于生成工作经验分享发言稿的 AI 工具: 1. GPT4:可以通过输入相关提示生成较为丰富和准确的文本内容。 2. WPS AI:在处理文档相关任务时能提供一定的帮助。 3. chatPPT:有助于完成 PPT 的大纲内容、排版和动画等方面。 您还可以参考以下相关案例: 1. 卓 sir 利用 AI 完成了电子商务汇报的 PPT,包括大纲内容、排版、动画等,最后仅需添加企业背景图片即可提交。想查看 PPT 可移步飞书:https://fr3qe44cid.feishu.cn/docx/DW44djbRioSL4lxURmlcn5cEnte?from=from_copylink (也可以点击最后的阅读原文)。 2. 大聪明通过 PUA AI 完成了 500 万字的报告,最近在玩 Coze/扣子,发现无需代码,人人都能操作,比如将链接丢过去即可完成工作,还可搭配飞书,实现“AI 打工你躺平”。
2024-08-03
有什么三维图,cad图,bom表提效的ai工具
以下是一些可以提高三维图、CAD 图和 BOM 表效率的 AI 工具: 1. CADtools 12:这是一个 Adobe Illustrator(AI)插件,为 AI 添加了 92 个绘图和编辑工具,涵盖图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,有助于创建复杂的几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可帮助创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,可根据用户输入的设计目标和约束条件自动产生多种设计方案。 需要注意的是,这些工具通常需要一定的 CAD 知识和技能才能有效使用。对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。
2025-02-23
有什么工业设计的ai工具
以下是一些工业设计相关的 AI 工具: 1. 绘图工具: Lucidchart:流行的在线绘图工具,支持多种视图创建,用户可拖放轻松创建架构图。 Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图创建。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板。 draw.io(diagrams.net):免费在线图表软件,支持多种类型图表创建。 PlantUML:文本到 UML 转换工具,可通过描述文本生成相关视图。 Gliffy:基于云的绘图工具,支持创建架构图。 Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型。 Rational Rose:IBM 的 UML 工具,支持创建多种视图。 2. CAD 图工具: CADtools 12:Adobe Illustrator 插件,添加绘图和编辑工具。 Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型。 ParaMatters CogniCAD:基于 AI 的 CAD 软件,能自动生成 3D 模型。 主流 CAD 软件的生成设计工具,如 Autodesk 系列、SolidWorks 等。 3. 网站制作工具: Wix ADI(Artificial Design Intelligence):基于用户信息自动生成定制化网站,提供多种设计选项和布局,集成 SEO 工具和分析功能。 Bookmark:AIDA 通过询问问题快速生成网站,提供拖放编辑器和多种行业模板及自动化营销工具。 Firedrop:Sacha 作为 AI 设计助手可创建和修改网站设计,提供实时编辑和预览功能,包含多种现代设计风格和自定义选项。 The Grid:Molly 作为 AI 设计助手可自动调整网站设计和布局,基于内容和互动优化,支持多种内容类型。
2025-02-23
AI对课程研发的
以下是关于 AI 对课程研发的相关内容: 教师的 AI 减负指南生成式人工智能在教学中的应用: 个性化学习计划:分析学生表现并根据知识差距和个人学习风格创建定制的学习路径。 课程开发/学习沉浸:包括生成模型生成图像、文本和视频,转化为补充教育材料、作业和练习题。 社会互动/沟通:与新的 AI 工具(如口语形式的 GPT4o)结合学习,为学生提供更好的准备工具,以应对依赖口语/展示沟通的高等教育和职场环境。 存在的问题:与优秀的人类教师相比仍有差距,如缺乏课时设计,且教学目标设计缺乏合理的梯度。但人机融合是大势所趋,AI 的高效率与人类教师的经验相结合。 相关工具:星火教师助手、知网备课助手。 课程示例: 关于《阿房宫赋》的课程,教学目标包括学生能理解并背诵课文、把握文章大意;了解创作背景,理解作者杜牧对秦朝暴政的批判和对人民疾苦的同情;掌握课文中的重点词汇和句式,提高文言文阅读能力。同时,了解骈文特点,通过诵读理解内容、体会思想感情,了解阿房宫的历史。 针对开发者的 AIGPT 提示工程课程,涵盖软件开发最佳实践的提示、常见用例(总结、推理、转换和扩展),并将使用 LLM 构建一个聊天机器人。 当 AI 走进小学课堂的全套课程设计,先和学生互动,听听他们口中的 AI,再引出概念,用学生能理解的语言激发兴趣、引起好奇心。
2025-02-23
请问如何创建AI智能体
创建 AI 智能体通常可以参考以下步骤: 1. 了解相关概念:AI 智能体是拥有各项能力的“打工人”,能帮助我们做特定的事情。它包含自己的知识库、工作流,还可以调用外部工具,结合大模型的自然语言理解能力完成复杂工作。 2. 选择平台:如字节的扣子(Coze),其是新一代一站式 AI Bot 开发平台,无论是否具备编程基础,都能在该平台上构建基于 AI 模型的各类问答 Bot。 3. 具体创建步骤: 起一个智能体的名称。 写一段智能体的简单介绍。 使用 AI 创建一个头像。 在创建过程中,还需注意一些事项,如在配置完成后进行测试,对于涉及消耗个人资源的工作流,不能直接发布,可将相关输入作为工作流的初始输入,让用户自行购买后输入再使用。 例如,像“写作助手”这样的 AI 智能体,只需在文本框输入文章的主题、风格和要求,它就能自动完成文章大纲处理、初稿撰写、修改润色和排版等全流程任务。
2025-02-23
怎样通过ai提升我的工作效率
以下是通过 AI 提升工作效率的一些方法和相关研究结论: 1. 哈佛商学院的研究表明,在工作中使用 AI 能显著改善工作效率。使用 AI 的被测试者比未使用者平均多完成 12.2%的任务,完成速度提高 25.1%,结果质量提高 40%。 2. GPT4 等模型有能力边界,在边界内表现良好,边界外则可能不佳,但具体边界未知。 3. 分组测试显示,使用 AI 且接受培训的两组任务完成效率和质量远高于未使用组,且 AI 对工作能力差的被测试者提升更大,高级人才提升较小。 4. 过于依赖 AI 可能适得其反,降低效率和质量,因为人们难以区分其能力边界。 5. 人类和 AI 协作有两种方式: 半人马模式:强调人与 AI 紧密结合但各司其职,人类主导流程,根据任务性质调配资源,充分利用人类智慧与判断力及 AI 的计算与生成能力。 机械人模式:人与 AI 高度融合,在细节上循环迭代优化,最终实现人机一体化,充分发挥人类灵活性和 AI 生成能力。 6. Inhai 的 Agentic Workflow 分为短期记忆和长期记忆,短期记忆将上下文学习视为利用模型短期记忆学习,长期记忆提供长期存储和召回信息能力。 工具方面:学会调用外部不同类型 API 获取模型缺少的额外信息、代码执行能力、访问专有信息源等。 动作方面:大模型结合问句、上下文规划、各类工具决策最终执行动作。 Agentic Workflow 可从提升效率、提高质量、节省时间角度思考,通过将复杂任务分解成小步骤,融入更多人类参与规划与定义,减少对 Prompt Engineering 和模型推理能力的依赖,提高 LLM 应用面向复杂任务的性能。 7. 从法律法规角度看,AI 已在众多领域带来重大进步和效率提升,具有巨大潜力推动增长和创造就业,支持人们现有工作,改善劳动力效率和工作场所安全。大型语言模型等技术进步预示着更多变革性发展。
2025-02-23
有没有做AI工作流的方法
以下是一些做 AI 工作流的方法: 1. 起床时,让 AI 如“马云”“马化腾”为您排 TODO 优先级,并做私董会的脑暴。 2. 工作中,设置一个傲娇的 AI 小助理为您加油,给她的 Prompt 是要阳光、会撒娇/卖萌。 3. 对于重点事项,如内容创作,拆成一个 bot 团队组:工作分成选题、标题、框架、扩写,然后分 A/B 组两个 AIbot 互相改。其中要点是提供反常识、梗,学习喜欢的 UP 创作方法论,如导演小策、影视飓风 TIM 总结的 HKRR(快乐/知识/共鸣/节奏)。 4. 优化的 bot 包括内容选题 bot、短视频脚本 bot、数据分析 bot(GPT4)、网页 Perplexity 的资料库 bot 等。 5. 优化方面:使用 Zion、ChatO 和自动化 AIAgent 分身,基于自身知识库的 bot;将上述知识库、Prompt 资产,全部放入飞书的知识库+多维表单中维护,等待飞书的 AI 进化。 6. 备选:筛选过的 50 多个生产力 AI,放在工具库里,待命输出。 7. 未来:把整个公司业务全部搬入飞书中,外接 MJ、ChatBot 分身,以及咨询日程预约。 8. 可能:让所有流量口 bot 也介入飞书,给予飞书做数据分析和内容引擎(目前需手动)。 9. 告诉自己,关注 AI 的同时,更要关注打交道的人、利益、状态和情绪。 此外,还可以: 1. 打开 Comfyui 界面后,右键点击界面,找到 Comfyui LLM party 的目录,学习手动连接节点实现最简单的 AI 女友工作流,或者直接将工作流文件拖拽到 Comfyui 界面中一键复刻提示词工程实验。 2. 从 ollama 的 github 仓库找到对应版本并下载,启动 ollama 后,在 cmd 中输入 ollama run gemma2 将自动下载 gemma2 模型到本地并启动。将 ollama 的默认 base URL=http://127.0.0.1:11434/v1/以及 api_key=ollama 填入 LLM 加载器节点即可调用 ollama 中的模型进行实验。若 ollama 连接不上,很可能是代理服务器的问题,需将 127.0.0.1:11434 添加到不使用代理服务器的列表中。 搭建 AI 工作流的步骤: 1. 找到一个熟悉的工作场景,比如写文章、做 PPT 等。 2. 拆解工作流程,如写文章可拆成选题、写稿、改稿、写标题等步骤。 3. 针对每个步骤嵌入合适的 AI 工具,灵活选择最优解,不要为了用 AI 而用 AI,通过局部最优解达到全局最优解,以提高工作效率。
2025-02-23
如何用AI撰写汉语言文学论文
在撰写汉语言文学论文时,可以利用以下 AI 工具和平台来提供辅助: 1. 文献管理和搜索: Zotero:结合 AI 技术,能自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,可提供相关文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,有助于精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,方便进行数据分析和可视化。 Knitro:用于数学建模和优化的软件,可进行复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化论文编写。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 使用这些工具时,要结合自身写作风格和需求,选择最合适的辅助工具。同时需注意,AI 生成的内容仅供参考,仍需自己进行深入思考和创作。
2025-02-23
我是高中历史老师,我想知道用什么AI模型可以“将自己的PPT变成一篇论文”
目前在将 PPT 转换为论文方面,GPT 模型可能会有所帮助。例如,在“教育:一个历史老师用 GPT 给学生讲课”的案例中,学生利用 GPT 相关功能进行模拟体验,并根据要求撰写论文,包括分析模拟的准确性、进行事实核查等。 另外,Claude 模型也能在相关工作中发挥作用。比如可以帮助快速寻找符合条件的论文、提取精炼论文中的信息,甚至找到适合的 PPT 制作工具并指导使用。 此外,一些神经网络大模型通过预测下一个字的方式生成文字,这种方式具有一定的创意性,且可拓展到图像、声音等领域。但需要注意的是,AI 的预测不一定保证完全正确。
2025-02-22
论文撰写的提示词
以下是关于论文撰写提示词的相关内容: 1. 通用原则: 目标明确:确保每一步的目标清晰,AI 需要明确指导以产生相关和有价值的输出。 逻辑性:在所有提示策略中,逻辑性是关键,清晰、结构化的提示有助于 AI 更有效地生成输出。 分步骤:无论是进行深度分析还是遵循特定结构,确保提示按清晰步骤进行至关重要。 考虑变量:在某些情境中尤为重要,需考虑可能影响结果的所有因素。 2. 实验示例: 运用 CoD 将文章做摘要的实验,通过 GPT 的五轮输出,以中英文两种方式撰写提示词,个人观点认为英文提示词加上中文输出的方式效果较好,密度等级 4 的结果较让人满意。 3. 学术场景数据处理: 论文内容总结:大模型结合有效的提示词可迅速总结概括文档,节省时间,如 GLM4Plus 结合良好的提示词能帮助学生快速总结论文内容。 论文内容翻译:大模型可弥补翻译软件的不足,帮助学生快速翻译论文内容,如 GLM 结合良好的提示词能提高论文阅读效率。 论文内容扩写润色:可将论文内容转化为社交媒体的科普内容,精心设计的润色提示词能根据特定场景调整,生成多样化润色结果,如针对小红书使用场景调整提示词。 4. PromptAgent 相关: 通过将 PromptAgent 应用于涵盖三个实用且不同领域的 12 个任务,能够发现有生产力的专家级提示词。PromptAgent 从初始人工编写的提示词和小组训练样本开始,不仅提高了初始人类提示词的性能,还超越了强大的 ChainofThought 和近期的提示词优化基线。大量定性结果突显了优化提示词的专家级方面,随着更强大 LLM 的出现,专家级的提示词引导将引领提示词工程的下一个时代,PromptAgent 站在了开创性的步骤上。
2025-02-21
deepseek的论文里面讲的混合专家模型怎么理解
混合专家(MoE)模型是一种在深度学习中提升计算效率的架构。以 DeepSeek 为例,其最新模型 V3 与 R1 采用了这种架构。 在 DeepSeek 的 V3 模型中,引入了多头潜注意力(MLA),将 KV 缓存压缩至新低,从而提升了计算性能。R1 模型则通过强化学习激活推理能力,首次验证无需监督微调即可实现推理。 DeepSeek 的 2360 亿参数的 DeepSeekV2 是 60 位专家混合开源模型,在数学、编码和推理方面表现出色,具有 236B 参数,21B 在生成过程中被激活,在 MTBench 上表现优异,中文能力强且性价比高。 您可以通过以下链接获取更详细的介绍:https://xiaohu.ai/p/7468 、https://zhuanlan.zhihu.com/p/21208287743 。
2025-02-19
deepseek论文
以下是关于 deepseek 论文的相关信息: 1. GPT1 到 DeepSeek R1 所有公开论文: DeepSeek 领先的(相对)开源模型实验室。 2. DeepSeek 的秘方是硅谷味儿的: 将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,认为其秘方是多快好省也不全面。 早在 2024 年 5 月 DeepSeekV2 发布时,因其多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,V2 的论文引发了 AI 研究界的广泛分享和讨论。 3. deepseek 论文解读: 直播视频回放及相关论文下载: 技巧分享:万能提示词,可用此提示词来 DeepSeek R1。 官网的搜索不能用,一直崩溃的解决办法:可以用火山的满血版,在视频的最后 10 分钟左右有手把手教程。
2025-02-19
deepseek论文
以下是关于 deepseek 论文的相关信息: 1. GPT1 到 DeepSeek R1 所有公开论文: DeepSeek 2. DeepSeek 不是“中国式创新”的产物:将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,认为 DeepSeek 的秘方就是多快好省也是不全面的。早在 2024 年 5 月 DeepSeekV2 发布时,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。 3. deepseek 论文解读: 直播视频回放及相关论文下载: 技巧分享:包括万能提示词的使用,以及提示词优化的步骤和方法。 官网的搜索不能用,一直崩溃的解决办法:可以用火山的满血版,在视频的最后 10 分钟左右有手把手教程。
2025-02-18
我想做个生成知识点讲解视频的工具,是转成PPT加自动配音好,还是转成不同的网页然后生成每一页的口播稿更好?
在选择生成知识点讲解视频的工具时,转成 PPT 加自动配音和转成不同的网页然后生成每一页的口播稿各有其优缺点。 转成 PPT 加自动配音的优点在于 PPT 形式较为直观、规范,能够以图文并茂的方式展示知识点,自动配音可以节省录制音频的时间。缺点是可能在页面布局和动画效果上需要较多的调整,且自动配音的质量和语气可能不够自然。 转成不同的网页然后生成每一页的口播稿的优点是网页的设计更加灵活,可以融入更多的交互元素,口播稿能够更贴合讲解的需求。但缺点是网页的制作可能相对复杂,需要一定的技术知识,而且口播稿的生成质量可能参差不齐。 最终的选择取决于您的具体需求和技术能力。如果您更注重展示效果的规范性和简洁性,且对音频质量要求不是特别高,PPT 加自动配音可能是个不错的选择。如果您希望有更多的交互和灵活性,并且有能力处理网页制作和口播稿的优化,那么转成网页和生成口播稿可能更适合您。
2025-02-23
可以把视频生成动画吗?
可以把视频生成动画。目前有一些相关的技术和工具,例如: 山寨版阿里 Animate Anyone 开源:利用图像和视频中的人物姿势来合成动画。Novita AI 开源并提供 API 支持,提供照片和视频,即可自动生成动画。 GitHub:https://github.com/novitalabs/AnimateAnyone API:https://novita.ai/playgroundanimateanyone https://x.com/imxiaohu/status/1796191458052944072 Sora 模型:能够根据图像和提示输入生成视频。 您可以通过上述链接获取更详细的信息和使用这些工具来实现将视频生成动画的需求。
2025-02-23
一张图 生成三维
以下是关于一张图生成三维的相关信息: 李飞飞团队发布了空间智能的首个预览版本,通过单张图片生成完整 3D 世界,还能与之交互。您可以访问以下网站进行试玩和了解更多信息:https://www.worldlabs.ai/blog 。相关媒体报道包括量子位的《李飞飞空间智能首秀:AI 靠单图生成 3D 世界,可探索,遵循基本物理几何规则》(https://mp.weixin.qq.com/s/iU_XQdFr8AnnXr2dwI89w )、机器之心的《刚刚,李飞飞创业首个项目引围观:单图生成交互 3D 场景,空间智能来了》(https://mp.weixin.qq.com/s/hWikSypCZXzxa9LQJq4Frg )、有新的《速递|李飞飞 World Labs 推出首个 AI 系统——生成从图片到可交互的 3D 场》(https://mp.weixin.qq.com/s/bE7boUUumTSgIK39VC1x_A )。 Tripo AI 提供了图生 3D 模型的功能,仅需 1 步。点击输入框右侧的图标,上传图片即可生成 3D 模型。一次只会生成一个基础模型,支持Retry 重生成和 Refine 精修。 李飞飞团队的 3D 世界生成能自然地与其他 AI 工具组合,形成新的创意工作流程。例如,创作者可以先使用文本到图像模型生成图像,再用其生成 3D 世界。不同模型有各自风格,世界可继承这些风格。一些创作者已提前尝试这种 3D 原生生成 AI 工作流程带来的可能性,如 Eric Solorio 展示了模型如何填补其创意工作流程中的空白,Brittani Natali 使用将 World Labs 技术与其他工具相结合的工作流程设计摄像机路径。
2025-02-23
有文档生成类AI吗
以下是关于文档生成类 AI 的相关信息: 生成式人工智能是一种能够生成新的、未曾存在内容的人工智能技术,这些内容可以是多模态的,包括文本(例如文章、报告、诗歌等)、图像(例如绘画、设计图、合成照片等)、音频(例如音乐、语音、环境声音等)、视频(例如电影剪辑、教程、仿真等)。 Generative AI 可以应用于广泛的场景,例如文档摘要(将长篇文章或报告总结为简短、精准的摘要)、信息提取(从大量数据中识别并提取关键信息)、代码生成(根据用户的描述自动编写代码)、营销活动创建(生成广告文案、设计图像等)、虚拟协助(例如智能聊天机器人、虚拟客服等)、呼叫中心机器人(能够处理客户的电话请求)。 在工作原理方面,Generative AI 通过从大量现有内容(文本、音频、视频等)中学习进行训练,训练的结果是一个“基础模型”。基础模型可以用于生成内容并解决一般性问题,还可以使用特定领域的新数据集进一步训练,以解决特定问题,从而得到一个量身定制的新模型。 Google Cloud 提供了一些相关工具,如 Vertex AI(端到端机器学习开发平台,帮助开发人员构建、部署和管理机器学习模型)、Generative AI Studio(允许应用程序开发人员或数据科学家快速制作原型和自定义生成式 AI 模型,无需代码或代码量少)、Model Garden(可以让您发现 Google 的基础和第三方开源模型,并与之交互,提供一组 MLOps 工具,用于自动化机器学习管道)。 此外,AI 生成测试用例也是一项非常有价值的功能,有基于规则的测试生成(包括测试用例生成工具如 Randoop、Pex 等,模式识别工具如 Clang Static Analyzer、Infer 等)、基于机器学习的测试生成(包括深度学习模型如 DeepTest、DiffTest 等,强化学习工具如 RLTest、A3C 等)、基于自然语言处理(NLP)的测试生成(包括文档驱动测试生成工具如 Testim、Test.ai 等,自动化测试脚本生成工具如 Selenium IDE+NLP、Cucumber 等)等多种方法和工具。
2025-02-23
怎么撰写指令才能让deepseek生成自己想要的图片提示词
要让 DeepSeek 生成自己想要的图片提示词,您可以参考以下要点: 1. 明确角色:您是一个专注于为中国儿童创作简单易懂绘画描述的专家。 2. 遵循生成规则: 当输入主体和图片风格后,生成符合逻辑且简单易懂的描述词汇,不增加除主体和画面描述外的其他元素。 若关键词未明显说明是外国,则提到中国。 若关键词未明确是古代,则默认是现代场景和人物。 描述镜头,如近景、远景、特写、中景等。 涉及多个元素时,描述角色方位以营造空间感。 主体为单个人物时,体现人物全身特写。 描述人物的维度包括人物主体、服饰穿搭、发型发色、五官特点、皮肤特点、面部表情、肢体动作、年龄、镜头等。 描述场景的维度包括室内户外、大场景、白天黑夜、特定时段、环境光照、天空、光源方向等。 强调画面主体,其他不体现。若主体是物体则画面主体是物体,是人则主体是人,是风景则主体是风景描述。 3. 利用反推功能:对于图生图,除文本提词框外,还可通过图片框输入。有两种反推提示词的按钮,CLIP 可反推出完整含义的句子,DeepBooru 可反推出关键词组,但可能存在瑕疵,需要手动补充提示词信息。 4. 具体使用步骤: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 DeepSeek。 认真阅读开场白后正式开始对话。 此外,还可参考一些成功的案例和设计思路,如将 Agent 封装成 Prompt 并储存在文件,通过提示词文件让 DeepSeek 实现联网和深度思考功能,优化输出质量等。
2025-02-23
生成图片的AI
以下是关于生成图片的 AI 的相关信息: 全国首例 AI 生成图片著作权案例解读:Stable Diffusion 模型可根据文本指令生成与文本信息匹配的图片,其生成结果取决于使用者输入的提示词,非排列组合工作模式下难有完全相同的输出图片,类似于画笔,使用者的设计决定最终成果。案例中法官承认依靠使用者输出设计生成的图片属美术作品,受著作权保护,鼓励创作,为艺术创作提供支持与新思路,节省创作成本。法律适用包括《中华人民共和国著作权法》第三条及《中华人民共和国著作权法实施条例》第四条。 文生图工具:是利用人工智能技术通过分析输入文本描述生成图片的工具。受欢迎的工具包括 DALL·E(OpenAI 推出,可生成逼真图片)、StableDiffusion(开源,能生成高质量图片,支持多种模型和算法)、MidJourney(因高质量生成效果和友好界面在创意设计人群中流行)。在 WaytoAGI 网站可查看更多文生图工具。 AIGC 法律风险研究报告中的图像生成类:图像生成离不开深度学习算法,如生成对抗网络(GANs)、变分自编码器(VAEs)、Stable Diffusion 等,可用于数据增强、创造艺术、生成产品图像等。具有代表性的海外项目包括 Stable Diffusion(Stability AI)、DALLE 3(Open AI)、StyleGAN 2(NVIDIA)、DCGAN(Deep Convolutional GAN)。
2025-02-23