Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

国内大模型领域关键人物、关键院校

Answer

以下是国内大模型领域的关键人物、关键院校及相关信息:

  • 8 月正式上线的国内大模型:
    • 北京:
      • 百度(文心一言):https://wenxin.baidu.com
      • 抖音(云雀大模型):https://www.doubao.com
      • 智谱 AI(GLM 大模型):https://chatglm.cn
      • 中科院(紫东太初大模型):https://xihe.mindspore.cn
      • 百川智能(百川大模型):https://www.baichuan-ai.com/
    • 上海:
      • 商汤(日日新大模型):https://www.sensetime.com/
      • MiniMax(ABAB 大模型):https://api.minimax.chat
      • 上海人工智能实验室(书生通用大模型):https://intern-ai.org.cn
    • 聊天状态下能生成 Markdown 格式的:智谱清言、商量 Sensechat、MiniMax
    • 目前不能进行自然语言交流的:昇思、书生
    • 受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值)
    • 特色功能:昇思——生图,MiniMax——语音合成
    • 阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。
  • 中文大模型评测收集与调研:
    • InfoQ + 极客帮:https://www.guotaixia.com/post/5124.html
    • GAOKAO-Bench:地址:https://github.com/OpenLMLab/GAOKAO-Bench ,是一个以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架
    • 清华安全大模型测评:地址:http://115.182.62.166:18000 ,清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的 40 余个二级安全类别
    • JioNLP 个人测评:评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM 评测数据集 ,考察 LLM 模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。题型介绍:选择题来源于中国大陆国内各种专业性考试,重点在于考察模型对客观知识的覆盖面,占比 32%;主观题来源于日常总结,主要考察用户对 LLM 常用功能的效果。
    • EduTEP:华东师范大学计算机科学与技术学院 EduNLP 团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP 对比多种大模型在教育领域中的综合性能,针对 K12 教育发布首个 CALM-EDU 评测框架与 CALM-EDU001 评测报告
    • 娱乐资本论:我们的测试并非旨在提供学术上的严谨标准,我们的目标是:从实用的角度出发,分析这些大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现
  • 中国大模型面临的真实问题:
    • OpenAI 对字节跳动可能存在的违规使用其技术和知识产权的指控,字节跳动回应在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中,但强调该模型仅用于测试,从未计划上线或对外使用,且自 2023 年 4 月公司引入 GPT API 调用规范检查后已停止这种做法。
    • 2024 年也有更多被指“套壳”国内大模型的事件,比如斯坦福大学 AI 团队主导的 Llama3-V 开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。大模型的建设方式粗浅地分为三类。
Content generated by AI large model, please carefully verify (powered by aily)

References

8月正式上线的国内大模型

5⃣️五家北京企业机构:百度(文心一言)https://wenxin.baidu.com抖音(云雀大模型)https://www.doubao.com智谱AI(GLM大模型)https://chatglm.cn中科院(紫东太初大模型)https://xihe.mindspore.cn百川智能(百川大模型)https://www.baichuan-ai.com/3⃣️三家上海企业机构:商汤(日日新大模型)https://www.sensetime.com/MiniMax(ABAB大模型)https://api.minimax.chat上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn今天这8个大模型,在聊天状态下——能生成Markdown格式的:智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的:昇思(可以对文本进行是否由AI生成的检测,类似论文查重,准确度不错)、书生受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有15元的预充值额度进行体验,完成企业认证后可以进行充值)特色功能:昇思——生图,MiniMax——语音合成阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中,广东省2家和其他省市1家也将陆续开放据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品

附:中文大模型评测收集与调研

https://www.guotaixia.com/post/5124.html[heading2]GAOKAO-Bench[content]地址:https://github.com/OpenLMLab/GAOKAO-BenchGAOKAO-bench是一个以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架[heading2]清华安全大模型测评[content]地址:http://115.182.62.166:18000清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的40余个二级安全类别[heading2]JioNLP个人测评[content]评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM评测数据集考察LLM模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。题型介绍:选择题来源于中国大陆国内各种专业性考试,重点在于考察模型对客观知识的覆盖面,占比32%;主观题来源于日常总结,主要考察用户对LLM常用功能的效果。给了一些标准[heading2]EduTEP[content]华东师范大学计算机科学与技术学院EduNLP团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP对比多种大模型在教育领域中的综合性能,针对K12教育发布首个CALM-EDU评测框架与CALM-EDU001评测报告[heading2]娱乐资本论[content]我们的测试并非旨在提供学术上的严谨标准,我们的目标是:从实用的角度出发,分析这些大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现

中国大模型面临的真实问题:登顶路远,坠落一瞬

OpenAI的反应迅速而坚决。他们立即暂停了相关账号,并表示将进行进一步调查。如果指控属实,OpenAI可能会要求字节跳动更改其做法,甚至可能终止其账户。这种严厉的态度,展现了OpenAI对其技术和知识产权的坚决保护。面对这一指控,字节跳动的回应颇具策略性。他们承认在2023年初,技术团队在大模型探索的初期确实有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。然而,他们强调这个模型仅用于测试,从未计划上线或对外使用。更重要的是,字节跳动表示,自2023年4月公司引入GPT API调用规范检查后,这种做法就已经停止了。其实,不光是这些在23年披露出来的国内事件,在24年也有更多被指“套壳”国内大模型的事件,比如说斯坦福大学AI团队主导的Llama3-V开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。这些现象其实背后都指向了大模型的建设方式。在这里,我们粗浅地将大模型的建设方式分为三类:

Others are asking
高职院校学生寒假实习安全告知书 用那个AGI生成比较专业
目前的知识库中没有关于使用哪个 AGI 生成高职院校学生寒假实习安全告知书更专业的相关内容。但一般来说,您可以尝试使用一些知名且成熟的自然语言处理模型,如 ChatGPT 等,不过在使用生成的内容时,仍需要您进行仔细的审核和修改,以确保其符合实际情况和相关法律法规的要求。
2025-01-13
我想利用现有的20万条政务相关数据,基于qwen2.5 70B大模型构建自己的政务服务大模型,该如何做,请给出具体实现流程,谢谢!
以下是基于 qwen2.5 70B 大模型利用 20 万条政务相关数据构建政务服务大模型的大致流程: 1. 数据准备:对 20 万条政务相关数据进行清洗、预处理和标注,使其适合模型学习。 2. 模型选择与下载:选择 qwen2.5 70B 大模型,并按照相关说明进行下载。 3. 本地部署: 启动 OpenAI 兼容的 API 服务,根据硬件配置设置相关参数,如 tensorparallelsize(设置使用的 GPU 数量)、maxmodellen(定义最大输入序列长度)、maxnumbatchedtokens(设置 Chunked Prefill 的块大小)、maxnumseqs(限制并发处理的序列数量)。 遇到问题可参考相关内容。 4. 与模型交互:可以使用 Curl 或 Python 等方法与部署的模型进行交互,对于更高级的使用方式,可以探索如之类的框架。 5. 模型训练:模型训练是一个复杂且计算量极大的过程,需要大量的计算资源和时间。 需要注意的是,构建大模型是一个复杂的任务,需要具备一定的技术知识和经验。在实际操作中,可能会遇到各种问题,需要不断调试和优化。
2025-02-06
模型测评
以下是关于模型测评的相关内容: Llama2 模型评测:为了解其中文问答能力,筛选了具有代表性的中文问题进行提问,测试了 Meta 公开的 Llama27BChat 和 Llama213BChat 两个版本,未做任何微调和训练。测试问题涵盖通用知识、语言理解等八个类别,使用特定 Prompt 进行测试,测试结果见相应文档。发现该模型对于中文问答的对齐效果一般,基于中文数据的训练和微调十分必要。 小七姐:文心一言 4.0、智谱清言、KimiChat 小样本测评:测评机制包括以同组提示词下 ChatGPT 4.0 生成的内容做对标参照,能力考量涵盖复杂提示词理解和执行、推理能力、文本生成能力、提示词设计能力、长文本归纳总结能力,测评轮次包括复杂提示词理解和执行、推理能力、文本生成能力、提示词设计能力、长文本归纳总结能力,每轮次均有不同的任务和模型测试次数。 斯坦福发布大模型排行榜 AlpacaEval:相对于人工标注,全自动化的 AlpacaEval 经济成本和时间成本低。从统计角度探讨了区分模型的评估数据,AlpacaEval 支持两种模式的模型评估方式,评测过程分为选择评估集并计算输出、计算 golden 输出、选择自动标注器并计算胜率三步。
2025-02-06
请用思维导图描述AI智能体大语言模型平台汇总图(带图标LOGO)
以下是为您生成的关于 AI 智能体大语言模型平台的汇总思维导图: 1. 基础层 为大模型提供硬件支撑,数据支持等,例如 A100、数据服务器等等。 2. 数据层 静态的知识库 动态的三方数据集 3. 模型层 LLm(largelanguagemodel,大语言模型),例如 GPT,一般使用 transformer 算法来实现。 多模态模型,即市面上的文生图、图生图等的模型,训练所用的数据与 llm 不同,用的是图文或声音等多模态的数据集。 4. 平台层 模型与应用间的平台部分,比如大模型的评测体系,或者 langchain 平台等,提供模型与应用间的组成部分。 5. 表现层(应用层) 用户实际看到的地方。 此外,在翻译场景中: 语言翻译技术经历了从传统规则翻译到深度学习翻译的逐步发展,每一次革新都显著提高了翻译的准确性和自然度。 传统机器翻译存在局限性,基于规则和统计模型,常常出现死板和字面化的结果,尤其在遇到多义词、习语或文化差异时,翻译往往不自然,且容易误导。 深度学习翻译技术通过大规模语料库学习,能够更好地理解上下文和语境,提供更加流畅、准确的翻译。 大模型翻译技术引入后,通过海量数据学习,能够精准捕捉语言的深层语义和文化背景,提供更符合语境的翻译,显著提升了翻译的准确性与流畅度。 在学术场景中: 大模型技术能够快速总结论文内容、进行精准翻译,节省研究者阅读和整理文献的时间。 文献预处理时,需将海量文献的格式转换为可供模型解析的文本格式,可借助平台工具完成文件内容的提取。 可将文件内容自动化提取并结合大语言模型进行批量分析或任务处理,适用于文档总结、信息提取等场景。
2025-02-06
大模型在软件开发公司(主java+vue)的应用场景有哪些
大模型在以 Java 和 Vue 技术为主的软件开发公司中,具有以下一些应用场景: 1. 代码自动生成:大模型可以根据需求描述生成 Java 或 Vue 的代码片段,提高开发效率。 2. 代码优化建议:分析现有代码,提供优化的建议和策略,提升代码质量。 3. 智能错误检测与修复:快速识别代码中的错误,并提供可能的修复方案。 4. 需求分析与理解:帮助更好地理解和梳理复杂的业务需求,转化为技术实现的思路。 5. 自动化测试用例生成:根据代码和需求生成有效的测试用例,提高测试效率和覆盖度。 6. 技术选型辅助:在面临新的项目或技术难题时,提供相关技术选型的参考和建议。
2025-02-06
以图生图有什么好用的模型
以下是一些好用的以图生图模型和相关产品: 1. Tusiart: 首页包含模型、帖子、排行榜,可查看不同模型的详细信息,如checkpoint、lora等。 checkpoint是生图必需的基础模型,lora是低阶自适应模型,可有可无,常用于控制细节。 还有ControlNet用于控制特定图像,VAE类似于滤镜可调整饱和度,以及Prompt提示词和负向提示词。 图生图功能可根据上传图片和所选模型等信息重绘。 2. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 3. Retrato:AI工具,可将图片转换为非凡肖像,有500多种风格选择,适合制作个性头像。 4. Stable Diffusion Reimagine:新型AI工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 5. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的AI工具,能将上传的照片转换为芭比风格。 需要注意的是,这些AI模型可能存在性能不稳定、生成内容不当等局限,使用时需仔细甄别。
2025-02-05
什么是AI大模型?
AI 大模型是一个复杂且涉及众多技术概念的领域。以下为您详细介绍: 1. 概念:生成式 AI 生成的内容称为 AIGC。 2. 相关技术名词及关系: AI 即人工智能。 机器学习是电脑找规律学习,包括监督学习(有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归)、无监督学习(学习的数据没有标签,算法自主发现规律,经典任务如聚类)、强化学习(从反馈里学习,最大化奖励或最小化损失,类似训小狗)。 深度学习是一种参照人脑有神经网络和神经元的方法(因有很多层所以叫深度),神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 是大语言模型。对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的 BERT 模型,可用于语义理解(如上下文理解、情感分析、文本分类),但不擅长文本生成。 3. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制(SelfAttention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。Transformer 比 RNN 更适合处理文本的长距离依赖性。
2025-02-05
Coze + 飞书 + 飞书多维表格:通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出。由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,无需开发任何插件、APP,能实现跨平台的稍后读收集与智能阅读计划的推荐。其设计思路包括简化“收集”,实现跨平台收集和通过输入 URL 完成收集;自动化“整理入库”,自动整理关键信息并支持跨平台查看;智能“选择”推荐,根据收藏记录和用户兴趣生成阅读计划——这个方法具体如何操作?
以下是关于通过飞书机器人与 Coze 搭建的智能体进行对话,并利用飞书多维表格存储和管理稍后读数据,实现跨平台的稍后读收集与智能阅读计划推荐的具体操作方法: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口完成收集输入。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用飞书·稍后读助手: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。但目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 至此,专属 AI 稍后读智能体大功告成,您可以尽情享受相关服务。
2025-01-27
数字孪生的关键技术
数字孪生的关键技术包括以下方面: 利用定制软件实现工厂的数字孪生,如 Wistron 利用 Omniverse SDK 定制软件将 NVIDIA DGX 和 HGX 工厂实现数字孪生,大幅缩短调试周期。 运用生成式 AI 进行天气预测,如 CoreDev 可通过超高分辨率 AI 预测严重风暴。 构建端到端的机器人系统,让 AI 理解物理世界,需要 AI 计算机、监测分析计算机和执行任务的机器人三位一体。 提供模拟环境,如 Omniverse 提供模拟环境,教会机器人如何成为机器人。 实现软件定义的仓储、工厂,让机器人自主协同工作。 解决数字人构建中的工程关键点,如构建像人一样思考的 AI Agent、实现灵魂驱动躯壳、保证实时性、实现多元跨模态、处理拟人化场景等。
2025-01-02
图片反推关键词
在图片反推关键词方面: 对于图生图功能,除文本提词框外还有图片输入口,可通过图片给 AI 创作灵感。随便一张照片拖入后,文本输入框旁有两个反推提示词的按钮,CLIP 能反推出完整含义的句子,DeepBooru 能反推出关键词组。例如一张小男孩的图片,CLIP 反推的提示词为“a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art”,DeepBooru 反推的提示词为“shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers”。但两种方式生成的提示词可能有瑕疵,需要手动补充信息,调整宽度和高度,以及注意提示词相关性和重绘幅度等参数。 第二十一期港风胶片活动中,有利用上一期活动图片反推工作流,使用唯美港风图片进行反推提示词,在大模型后接一个墨悠_胶片 lo 的方法 1,上一期活动链接为;还有利用抱脸的 joycaption 图片反推提示词,然后在哩布上跑 flux 文生图工作流的方法 2。 在【SD】最强控制插件 ControlNet(6)全局重绘 inpaint 中,有时需要去掉画面中的主体形象,填补复杂背景,可使用 inpaint 重绘功能。先将图放入 WD 1.4 标签器(Tagger)中裁剪保留背景部分,然后反推提示词,如“outdoors,no humans,tree,scenery,grass,sky,cloud,day,blue sky,mountain,road,house,path,building,nature,cloudy sky”,检查无误后发送到文生图中。开启 ControlNet,使用 inpaint 模型涂抹人物部分生成,可调整控制权重和模式。也可尝试图生图中的“局部重绘”功能,但可能效果不佳。
2024-12-14
我想看关于使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节的实操
以下是关于使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节的实操: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 根据视频脚本生成短视频的 AI 工具有多种,例如: 1. :ChatGPT 可以生成视频小说脚本,而剪映则可以根据这些脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。这种方法可以快速实现从文字到画面的转化,节省大量时间和精力。 2. :在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. :这是一个 AI 视频生成器,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户可以提供文本描述,Pictory 将帮助生成相应的视频内容。 4. :提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. :这是一个 AI 视频创作工具,它能够将文本转化为风格化的视频内容,适用于多种应用场景。 6. :专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 这些工具各有特点,适用于不同的应用场景和需求,能够帮助内容创作者、教育工作者、企业和个人快速生成吸引人的视频内容。 在游戏《神谕》中,ChatGPT 生成对话内容和剧情的能力表现如下: 对于故事线,ChatGPT 可以通过 System Prompt 介绍游戏的故事背景和小机器人的人设。结合游戏中发生的关键事件,通过文字传递给 ChatGPT,生成游戏中关键的故事情节介绍,最后以小机器人自述的形式呈现出来。具体实现过程中有几种选择: 1. 离线生成:将 ChatGPT 作为离线工具使用,生成一次性剧情文案,并保存到游戏中。缺点是文案一旦确定就固定下来了,略显单调。 2. 实时生成:每次都让 ChatGPT 自由发挥,在关键的节点,将历史上下文信息发送给 ChatGPT 来生成实时文案,优势是每次发挥都在既定主题基础上有所差异,有一定随机性。但是实际的缺点是,每次生成的延迟较大,会让游戏为了等待剧情文案,而产生明显的停顿感。 因此选择:每局对局开始前,会为游戏的关键节点一次性生成所有文案。这样,每次游戏都可以产生不同的文案,且游戏过程中就不会因为剧情体验到明显的停顿感。剧情的故事格式,由预定义的 json 来表达,每次 ChatGPT 只需要替换填充内容即可。 对于实时对话,与剧情类似,不过最大的难点是如何让小机器人区分出来,您是希望跟它聊天,还是在让它执行某些指令,甚至能否边聊天边执行指令。背后最大的挑战是 ChatGPT 要支持生成类似“多模态”的返回信息。这里的“多模态”是指在您对话的内容中,可以同时返回“对话”和“代码”,而且以某种限定的格式返回,从而方便程序解析出来。类似的 prompt 描述为:按照上述的 prompt,大概率 ChatGPT 能输出符合要求的内容格式。
2024-12-10
如何使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节?
使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节,可以按照以下步骤进行: 1. 利用 ChatGPT 等 AI 工具对小说内容进行分析。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-12-10
使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节怎么办?
使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节,可以按照以下步骤进行: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-12-10