Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

NLP相关概念

Answer

以下是关于 NLP 相关概念的详细介绍:

一、NLP、NLU、NLG 的关系

自然语言处理(NLP)中包含了自然语言理解(NLU)和自然语言生成(NLG)。

二、NLP 的定义

自然语言处理(Natural Language Processing,NLP)是研究人与计算机之间使用自然语言进行有效通信,希望机器能像人一样具备正常人的语言理解能力。有别于计算机语言,“自然语言”是人类发展过程中形成的一种信息交流方式,包括汉语、英语、法语等世界上所有的语种语言。“处理”包含理解、转化、生成等过程。“自然语言处理”就是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工,以实现人机间的信息交流。

三、NLP 的用途

如文字校对、信息检索、机器翻译、问答系统、聊天机器人、文章摘要、舆情监测、情绪分析等都涉及到 NLP 相关技术。

四、NLP 的技术原理

按照内容构成的层次,NLP 的基本技术原理可以分成 5 个层次:

  1. 词法分析:找到词汇的各个词素,从中获得语言学信息。
  2. 句法分析:对句子和短语的结构进行分析,目的是要找出词、短语等的相互关系以及各自在句中的作用。
  3. 语义分析:找出词义、结构意义及其结合意义,从而确定语言所表达的真正含义或概念。
  4. 篇章分析:分析篇章结构,识别不同部分之间的语义联系,结合内外部信息,在整体上理解篇章。
  5. 内容生成

五、NLU

专注于让计算机理解人类语言的含义。NLU 系统试图理解句子和词语背后的含义,而不是仅仅处理单个词语。NLU 能够识别文本中的情感、意图和实体,并将其转化为计算机可以理解的结构化信息。

六、NLG

专注于让计算机生成人类可以理解的语言。NLG 系统将结构化数据转化为自然语言文本,例如新闻报道、产品描述、聊天机器人回复等。NLG 能够根据不同的需求和场景,生成不同风格和语气的文本。

七、NLP 任务

主要包含 3 大类任务:

  1. 自然语言理解任务(NLU,Natural Language Understanding):特点是能看到完整上下文信息,然后做广义分类任务,典型任务如文本情感分析,词性标注,信息检索等。
  2. 有条件自然语言生成任务(conditioned-NLG,Natural Language Generation):特点是 seq2seq,典型任务例如机器翻译,自动摘要等。
  3. 无条件自然语言生成任务(unconditioned-NLG):特点是开放性的句子生成,典型任务如问答系统(QA)、对话机器人(ChatBot)等。一开始针对不同任务会使用不同的模型,后来发现 NLG 任务能通过 in-context learning + prompt 来完成 NLU 任务,于是逐渐收敛到了 NLG 任务。
Content generated by AI large model, please carefully verify (powered by aily)

References

几个故事告诉你 NLP、NLU、NLG 分别是什么

最后,我们来总结一下这些“小故事”,从图灵奠定自然语言处理的根基,到SHRDLU实现了理解、生成自然语言,大约过去了20年时间,在这短短20年里,科技突飞猛进的速度让我们瞠目结舌(虽然现在的你可能觉得当时的技术很原始)。虽然现在的自然语言处理已经被归到人工智能学科下,但我们仍能看清楚这三者之间的关系,即:自然语言处理(NLP)中包含了自然语言理解(NLU)和自然语言生成(NLG)。如下图所示:而这三者分别干的事情如下:1.NLP:它涉及各种技术和方法,使计算机能够分析、理解和生成人类语言,例如文本和语音。NLP的目标是让计算机像人类一样理解和使用语言,从而实现人机交互的自然化。2.NLU:专注于让计算机理解人类语言的含义。NLU系统试图理解句子和词语背后的含义,而不是仅仅处理单个词语。NLU能够识别文本中的情感、意图和实体,并将其转化为计算机可以理解的结构化信息。3.NLG:专注于让计算机生成人类可以理解的语言。NLG系统将结构化数据转化为自然语言文本,例如新闻报道、产品描述、聊天机器人回复等。NLG能够根据不同的需求和场景,生成不同风格和语气的文本。好了,讲了这么多,不知道今天有没有把这三个概念学会?如果想学习更多人工智能知识,欢迎关注我。谢谢。以上。

自然语言处理

自然语言处理(Natural Language Processing,NLP)是研究人与计算机之间,使用自然语言进行有效通信。就是希望机器能像人一样,具备正常人的语言理解能力。有别于计算机语言,“自然语言”是人类发展过程中形成的一种信息交流方式,包括汉语、英语、法语等世界上所有的语种语言。“处理”包含理解、转化、生成等过程。“自然语言处理”就是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。实现人机间的信息交流,[heading2]用途[content]如文字校对、信息检索、机器翻译、问答系统、聊天机器人、文章摘要、舆情监测、情绪分析等都涉及到NLP相关技术。[heading2]技术原理[content]按照内容构成的层次,NLP的基本技术原理可以分成5个层次:1.词法分析。找到词汇的各个词素,从中获得语言学信息;2.句法分析。对句子和短语的结构进行分析,目的是要找出词、短语等的相互关系以及各自在句中的作用;3.语义分析。找出词义、结构意义及其结合意义,从而确定语言所表达的真正含义或概念;4.篇章分析。分析篇章结构,识别不同部分之间的语义联系,结合内外部信息,在整体上理解篇章;5.内容生成

(2)初探LLM基座模型

作者:小A,aaronxic,[知乎个人主页](https://www.zhihu.com/people/aaronxic)发表时间:2023年7月8日原文地址:https://zhuanlan.zhihu.com/p/640784855[heading2]开篇[content]大家好,我是小A。今天给大家带来本系列的第二篇内容,主要介绍LLM基座模型里常见的3种transformer架构,encoder-only,encoder-decoder和decoder-only[heading2]NLP任务速览[content]在深入介绍LLM网络结构之前,我们先简单了解一下NLP(Natural Language Processing)都包含了哪些任务。主要包含3大类任务自然语言理解任务(NLU,Natural Language Understanding)。特点是能看到完整上下文信息,然后做广义分类任务,典型任务如文本情感分析,词性标注,信息检索等。有条件自然语言生成任务(conditioned-NLG,Natural Language Generation)。特点是seq2seq,典型任务例如机器翻译,自动摘要等。无条件自然语言生成任务(unconditioned-NLG)。特点是开放性的句子生成,典型任务如问答系统(QA)、对话机器人(ChatBot)等。一开始针对不同任务会使用不同的模型,后来发现NLG任务能通过in-context learning+prompt来完成NLU任务,于是逐渐收敛到了NLG任务。

Others are asking
剧本分析(NLP):AI 读取剧本,分析情节、角色发展,甚至预测观众反应。
以下是关于剧本分析(NLP)中 AI 读取剧本并进行相关处理的一些信息: 人物剧本与角色状态: 对人物如李洛云进行“剧本推演”,每天生成 20 40 个时间段剧本,依据人物背景和增长记忆体生成。 可使用 LLM 生成英文提示词用于 Stable Diffusion 出图,图存于“手机相册”用于对话多模态中的图片回复。 选择剧本和图片生成朋友圈文案。 拟人行为: 反感度系统:通过 LLM 分析对话判断角色是否产生反感度。 延迟回复:根据状态忙闲或是否睡觉决定回复时间。 接受多轮输入,一并回复:避免每一条输入回复一句,不像真人。 响应拆分与响应延迟:将一大段响应文本拆分成多段,模拟人类打字速度(3 5 字/秒),回复时概率性使用表情包,有概率主动聊天(与亲密度正相关)。 微信朋友圈:根据每天人物剧本挑选 1 2 个发布朋友圈并配图,目前内容由 AI 生成但手工发布。 将小说做成视频的制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)提取关键场景、角色和情节。 2. 生成角色与场景描述:用工具(如 Stable Diffusion 或 Midjourney)生成视觉描述。 3. 图像生成:用 AI 图像生成工具创建图像。 4. 视频脚本制作:将关键点和图像组合成脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)转换语音,添加背景音乐和音效。 6. 视频编辑与合成:用视频编辑软件(如 Clipfly 或 VEED.IO)合成。 7. 后期处理:剪辑、添加特效和转场提高质量。 8. 审阅与调整:观看视频并根据需要调整。 9. 输出与分享:完成编辑后输出并分享。 Inworld AI: Inworld AI 是一家专注于游戏和人工智能的初创公司,开发了 Inworld 的 AI 角色引擎,可将游戏 NPC 进行 AI 化并集成到游戏中。该引擎超越大语言模型,增加可配置的安全性、知识、记忆、叙事控制、多模态等功能,使 NPC 能够自我学习和适应,具有情绪智能。其角色引擎可创建具有独特个性和上下文意识的角色,无缝集成到实时应用中,内置优化规模和性能的功能。Character Brain(性格大脑)引擎使 AI NPC 能够学习和适应,具有情绪智能的关系导航能力、记忆和回忆能力,并能自主发起目标、执行动作并遵循动机。功能包括目标和行动、长期记忆、个性、情绪等。
2025-03-20
NLP包括哪些任务,现在的GPT是否都已覆盖,CV类包括哪些任务,现在由哪些网络模型覆盖
NLP 包括的任务有文本分类、情感分析、命名实体识别、信息抽取、机器翻译、问答系统、摘要生成等。目前 GPT4 在一系列 NLP 任务上表现出色,优于现有的大型语言模型,但不能说已完全覆盖所有 NLP 任务。 CV 包括的任务有图像分类、目标检测、图像分割、图像生成、视频分析等。在 CV 领域,一些常见的网络模型有生成对抗网络(GANs)、变分自编码器(VAEs)、流模型、扩散模型、视觉变压器(ViT)、Swin 变压器等。
2025-03-16
AI领域,传统机器学习,nlp,深度学习,大语言模型,rag,agent,请生成一张让普通人能看懂的AI领域概念图
以下是为您生成的 AI 领域概念图的相关解释: 人工智能(AI):一种目标,让机器展现智慧。 生成式人工智能(GenAI):一种目标,让机器产生复杂有结构的内容。 机器学习:一种手段,让机器自动从资料中找到公式,包括监督学习、无监督学习、强化学习。 监督学习:有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归。 无监督学习:学习的数据没有标签,算法自主发现规律,如聚类。 强化学习:从反馈里学习,最大化奖励或最小化损失。 深度学习:一种更厉害的手段,参照人脑有神经网络和神经元(因为有很多层所以叫深度),神经网络可用于多种学习方式。 大语言模型(LLM):是一类具有大量参数的“深度学习”模型。对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类。 AIGC(Artificial Intelligence Generated Content):利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。 ChatGPT:一个应用实例,通过投喂大量资料预训练后,会通过聊天玩“文字接龙游戏”。它是美国 OpenAI 公司开发的一款基于大型语言模型(LLM)的对话机器人,能够根据用户的输入生成连贯且相关的文本回复。 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制(SelfAttention)来处理序列数据,比 RNN 更适合处理文本的长距离依赖性。
2025-02-11
文档自动化的技术方案: OCR+NLP pipeline指的是什么,个人具体怎么实施
OCR(Optical Character Recognition,光学字符识别)+NLP(Natural Language Processing,自然语言处理)pipeline 是一种将 OCR 技术和 NLP 技术相结合的文档自动化处理流程。 OCR 用于将文档中的图像或扫描的文字转换为可编辑的文本。 NLP 则对转换后的文本进行分析、理解和处理,例如提取关键信息、分类、情感分析等。 对于个人实施 OCR + NLP pipeline,大致可以按照以下步骤进行: 1. 选择合适的 OCR 工具和服务:有许多开源和商业的 OCR 工具可供选择,根据您的需求和技术能力进行评估和选用。 2. 准备数据:收集和整理需要处理的文档,并确保其质量适合 OCR 处理。 3. 进行 OCR 处理:使用选定的 OCR 工具对文档进行转换。 4. 选择 NLP 框架和模型:根据具体的任务和需求,选择适合的 NLP 框架和预训练模型。 5. 数据预处理:对 OCR 输出的文本进行清洗、预处理,以便 NLP 模型能够更好地处理。 6. 训练和优化 NLP 模型(如果需要):如果通用模型不能满足需求,可以使用标注数据进行训练和优化。 7. 集成和部署:将 OCR 和 NLP 部分集成在一起,并部署到实际应用环境中。 需要注意的是,实施过程中可能会遇到一些技术挑战,例如文档格式的复杂性、OCR 识别的准确性、NLP 模型的适应性等,需要不断调试和优化。
2025-02-08
我想要学习nlp的知识,请告诉我该如何入门
以下是学习 NLP 入门的一些建议: 1. 理解基本概念: 明确自然语言处理(NLP)包含自然语言理解(NLU)和自然语言生成(NLG)。 了解 NLP 涉及各种技术和方法,目标是让计算机像人类一样理解和使用语言,实现人机交互自然化。 认识到 NLU 专注于让计算机理解人类语言含义,能够识别文本中的情感、意图和实体等,并转化为结构化信息。 知道 NLG 专注于让计算机生成人类可理解的语言,能根据需求和场景生成不同风格和语气的文本。 2. 学习相关课程: 可以学习如“和 Cursor AI 一起学 Python 编程”中关于 Python 基础语法与文本处理,以及利用 Python 进行自然语言处理的课程。 掌握 Python 的基本语法和结构,能够进行简单的文本数据处理。 3. 深入学习技术: 了解机器学习是人工智能的子领域,核心是让计算机通过数据学习提高性能。 明白深度学习是机器学习的子领域,尝试模拟人脑工作方式,创建人工神经网络处理数据。 认识到大语言模型是深度学习在自然语言处理领域的应用,像 ChatGPT、文心一言等,被训练来理解和生成人类语言。 希望以上建议对您学习 NLP 入门有所帮助。
2025-01-26
NLP是什么
自然语言处理(Natural Language Processing,NLP)是研究人与计算机之间使用自然语言进行有效通信的领域。它希望机器能具备像人一样的语言理解能力。 “自然语言”是人类发展过程中形成的信息交流方式,包括各种语种。“处理”包含对自然语言的形、音、义等信息进行理解、转化、生成等操作和加工,如对字、词、句、篇章的输入、输出、识别、分析、理解、生成等。 NLP 的用途广泛,如文字校对、信息检索、机器翻译、问答系统、聊天机器人、文章摘要、舆情监测、情绪分析等都涉及到相关技术。 其技术原理按照内容构成的层次,可分成 5 个层次: 1. 词法分析:找到词汇的各个词素,获取语言学信息。 2. 句法分析:分析句子和短语的结构,找出词、短语等的相互关系及在句中的作用。 3. 语义分析:确定词义、结构意义及其结合意义,明确语言所表达的真正含义或概念。 4. 篇章分析:分析篇章结构,识别不同部分之间的语义联系,结合内外部信息整体理解篇章。 5. 内容生成 在人工智能学科下,自然语言处理(NLP)包含了自然语言理解(NLU)和自然语言生成(NLG)。 1. NLP:涉及各种技术和方法,使计算机能够分析、理解和生成人类语言,实现人机交互的自然化。 2. NLU:专注于让计算机理解人类语言的含义,能够识别文本中的情感、意图和实体,并转化为结构化信息。 3. NLG:专注于让计算机生成人类可以理解的语言,将结构化数据转化为自然语言文本,能根据不同需求和场景生成不同风格和语气的文本。 在深度学习和自然语言处理(NLP)中,Embedding 是一种特征工程方法,用于将高维度的数据(如单词、短语、句子等)转换为低维度的向量,目的是降低数据的抽象和复杂性,帮助模型理解语义关系。例如在电影推荐系统和文本分类中都有应用。
2024-11-18
用文生图来画插画风格的系统流程图、概念图有哪些快速上手的prompt、平台和教程
以下是关于用文生图来画插画风格的系统流程图、概念图的快速上手的 prompt、平台和教程: 平台:Tusiart Prompt 提示词: 用英文写您想要 AI 生成的内容,不用管语法,仅使用单词和短语的组合去表达需求,单词、短语之间用英文半角逗号隔开。 描述逻辑通常包括人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。 教程: 1. 定主题:确定您需要生成的图的主题、风格和要表达的信息。 2. 选择基础模型 Checkpoint:按照主题找内容贴近的 checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:在生成内容基础上,寻找内容重叠的 lora 以控制图片效果及质量。 4. ControlNet:可控制图片中特定图像,如人物姿态、特定文字等,高阶技能可后续学习。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. 负向提示词 Negative Prompt:用英文写您想要 AI 避免产生的内容,单词和短语组合,中间用英文半角逗号隔开。 8. 采样算法:一般选 DPM++2M Karras,也可留意 checkpoint 详情页上模型作者推荐的采样器。 9. 采样次数:选 DPM++2M Karras 时,采样次数在 30 40 之间。 10. 尺寸:根据喜好和需求选择。 辅助网站: 1. http://www.atoolbox.net/ :通过选项卡方式快速填写关键词信息。 2. https://ai.dawnmark.cn/ :每种参数有缩略图参考,更直观选择提示词。 3. https://civitai.com/ :可抄作业,复制图片的详细参数用于生成。 下次作图时,可先选择模板,点击倒数第二个按钮快速输入标准提示词。
2025-03-28
AI agt 是很么概念
AI Agent 是一种智能代理系统,具有以下特点和概念: 是从年前到现在比较火的概念,被认为是大模型未来的主要发展方向。 中间的“智能体”通常是 LLM 或大模型,通过为其增加工具、记忆、行动、规划这四个能力来实现。 目前行业里主要用到的是 langchain 框架,它把 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。 准确来说,指的是一种智能代理系统,接近人类大脑,可形成记忆、达成行动规划、自动交互、主动预测。 目前其概念在市场上未达成共识,存在被滥用现象。 应用特点包括个性化,能随着用户使用了解用户习惯和想法并作出喜好预测;能自主完成任务,如 Auto GPT 可在用户输入目标后自主执行任务、递归开发和调试代码;能实现多 Agent 协作,如斯坦福大学的 SmallVille 项目。 应用大多集中在 2B 场景,面向个人消费者的产品少。 包括 Chain(通常一个 AI Agent 可能由多个 Chain 组成)、Router(可使用判定让 Agent 走向不同的 Chain)、Tool(Agent 上的一次工具调用)等概念。 例如微信虚拟女友中的 AI Agent 包括 Responser Agent(主 agent,用于回复用户)、Background Agent(背景 agent,用于推进角色当前状态)、Daily Agent(用于生成剧本、配套图片和每日朋友圈)。
2025-03-28
介绍AI基本概念和目前发展阶段
AI 的基本概念: 人工智能(AI)是指让计算机模拟人类智能的技术。 主要分支包括机器学习、深度学习、自然语言处理等,它们之间存在密切联系。 目前发展阶段: 已取得显著进展,如聊天机器人具备基本对话能力,能用于客户服务和简单查询响应。 推理者如 ChatGPT 能解决复杂问题并提供详细分析和意见。 智能体虽能执行部分自动化业务,但仍需人类参与。 创新者如谷歌 DeepMind 的 AlphaFold 模型能协助人类完成新发明。 最高级别的组织型 AI 能自动执行组织的全部业务流程,但尚未完全实现。 对于新手学习 AI: 建议阅读「」熟悉术语和基础概念。 浏览入门文章了解历史、应用和发展趋势。 在「」中找到初学者课程,特别推荐李宏毅老师的课程。 通过在线教育平台按自己节奏学习并获取证书。 根据兴趣选择特定模块深入学习,掌握提示词技巧。 理论学习后进行实践,尝试使用各种产品并分享实践成果。 体验如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人。 如果希望继续精进 AI: 了解 AI 背景知识,包括基础理论、历史发展。 掌握数学基础,如统计学、线性代数、概率论。 熟悉算法和模型,如监督学习、无监督学习、强化学习。 学会评估和调优模型性能。 了解神经网络基础,包括网络结构和激活函数。
2025-03-20
描述相关概念的时候需要给ai什么指令
以下是关于给 AI 描述相关概念时的一些指令示例: 在法律法规方面,如《人工智能法案》中,指令包括发布年度报告以评估法规实施情况、审查严重事件报告、协助建立监管沙箱、组织与相关机构的会议和咨询等。 对于 Midjourney 生成 UI 界面,若指定生成某个页面(如首页、登录页等),可添加页面指令描述,如“landing page”“Profile Page”等。对于社交平台,关键词“landing page”可生成社交平台的登录页设计;对于信息类,关键词“Profile Page”可生成人力资源类产品的个人资料页。 需要注意的是,目前 Midjourney 产出的设计图更适合在 APP 设计的初始阶段提供灵感和创意,直接落地开发仍有距离,但随着 AI 技术的迭代,这种距离有望缩短。
2025-03-16
我在用AI辅助学习新概念英语第二册,但是deep seek总是报错,我应该换成什么别的AI呢?
如果您在使用 Deep Seek 辅助学习新概念英语第二册时总是报错,可以考虑换成 Wenxiaobai.com 这个平台。它高速响应,完全免费,支持各种平台使用,与 Deep Seek 官网几乎相同,速度快且稳定性高,最新版本还支持文档与图片分析。
2025-03-12
我如何AI应用产品创业思路 目前有商业和项目概念没有IT基础
以下是为您提供的关于 AI 应用产品创业思路的相关内容: 从过去的经验来看,2014 年是移动互联网的红利时代,当时有很多创业者和投资人在深圳的咖啡馆交流项目。有人参与移动互联网创业,做了一款帮人养成好习惯的 APP,积累了百万用户并拿到投资,但因商业化思考较浅等原因项目折戟。 对于现在的 AI 应用创业,有观点认为这一波 AI 更利好大厂,因为创业公司缺乏数据和场景。但也有观点指出,任何技术进步,现有的大公司虽会获利,但创业公司能创造新的价值和场景。以移动互联网为例,最大的四个应用如移动端的 IM 工具、打车、外卖、短视频,除微信外都来自创业公司,且新的技术优势应是解决新问题,而非做更好的上一代产品。此外,AI 时代有利于创业者的一个好处是,利用大模型的能力,创业公司人员更精简,很多 AI 应用创业者仅几人就能完成产品开发上线测试。而且从应用层面看,2B 的应用公司在中国可能会迎来跨越式发展的机会。 如果您没有 IT 基础但有商业和项目概念,建议您: 1. 深入研究目标市场和用户需求,找准新的问题和价值点。 2. 关注创新的应用场景,避免与大厂在已有产品上竞争。 3. 充分利用大模型的能力,优化团队结构,提高效率。 4. 考虑与有 IT 技术能力的团队或个人合作。
2025-02-25
数字人相关
以下是关于数字人的相关信息: 制作数字人的工具: 1. HeyGen:AI 驱动的平台,能创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等。 2. Synthesia:AI 视频制作平台,可创建虚拟角色并进行语音和口型同步,支持多种语言,用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人能自动转换成语音并合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化。在使用时,请遵守相关使用条款和隐私政策,并注意版权和伦理责任。 数字人简介: 数字人是运用数字技术创造出来的人,虽现阶段不能像科幻作品中的人型机器人一样具备高度智能,但已在生活各类场景中出现,且随着 AI 技术发展迎来应用爆发。目前业界对数字人没有准确定义,一般根据技术栈不同分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,表现质量与手动建模精细程度及动捕设备精密程度直接相关,随着视觉算法进步,在无昂贵动捕设备时也可通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 2. 算法驱动的数字人:相关算法开源代码众多,如 ASR 语音识别方面有 openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition);AI Agent 方面大模型有 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可用 LangChain 的模块自定义(https://www.langchain.com/);TTS 方面有微软的 edgetts(https://github.com/rany2/edgetts)、VITS(https://github.com/jaywalnut310/vits)、sovitssvc(https://github.com/svcdevelopteam/sovitssvc)。 除算法外,人物建模模型可通过手动建模(音频驱动)或 AIGC 方式生成人物动态效果(如 wav2lip 模型)实现一个最简单的数字人,但这种简单构建方式存在诸多问题,如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型及做出相应动作、数字人如何使用知识库做出某个领域的专业性回答等。
2025-03-29
论文写作相关的提示词
以下是关于论文写作相关的提示词的全面介绍: 论文内容总结: 大模型结合有效的提示词能迅速总结概括论文内容,节省时间。例如 GLM4Plus 结合良好的提示词可帮助学生快速总结。 示例: 论文内容翻译: 大模型能弥补翻译软件的不足,帮助学生快速翻译论文内容,提高阅读效率。如 GLM 结合良好的提示词可实现。 示例: 论文内容扩写润色: 可将论文内容转化为社交媒体的科普内容,将学术知识普及化。精心设计的润色提示词能根据特定场景调整,生成多样化润色结果。如针对小红书使用场景,调整提示词以匹配其口语化、轻松愉快的氛围。 示例: Chain of Density: 目标明确:确保每步目标清晰,AI 需明确指导产生相关有价值输出。 逻辑性:在所有提示策略中,逻辑性关键,清晰结构化提示助 AI 有效生成输出。 分步骤:确保提示按清晰步骤进行,如进行深度分析或遵循特定结构。 考虑变量:在某些情境中需考虑影响结果的所有因素。 运用 CoD 将文章做摘要: 个人观点认为,以英文提示词最后加上中文输出的方式效果较好,密度等级 4 的结果较让人满意。 示例: 提示词的基本示例: 提示词通过结合指令、问题、输入数据和示例构建,必须包含指令或问题,其他元素可选。如询问如何撰写大学入学申请论文,并提出希望答案包含的方面建议。 示例:“我该如何撰写我的大学入学申请论文?请给我一些建议,包括我应该包含的不同部分、我应该使用什么样的语气,以及我应该避免使用的表达。”
2025-03-29
2024年10月的AIPO活动相关云文档在哪儿?
以下是与 2024 年 10 月的 AIPO 活动相关的云文档: :包含关于 AI 模型训练的介绍与讲解,如 Eagle 插件批量收藏 3D 图表、不同步数训练时间、使用 MZ 数据集训练 Flux、云服务器训练流程、训练集收集要求、训练模型的时机、角色一致性表现、云服务器训练集设置、模型训练参数设置、模型训练启动与等待等内容。 》,列举了美国融资金额超过 1 亿美元的 AI 公司。 :包含 2024 年 10 月 24 日娜乌斯佳:AIGC 商业片落地经验分享等多个日期的智能纪要。
2025-03-28
ai教育相关产品
以下是一些与 AI 教育相关的产品信息: 文章《Koji:当大家反对用 AI 育儿时,它却“救”了我两次!》中提到了 Khanmigo AI 这款产品,它能够引导学生自己寻找答案,培养批判性思维能力。 在【已结束】AI 创客松中,有以下与儿童教育相关的小组和想法: 智慧启蒙家小组,计划开发针对儿童的 AI 教育游戏、创建 AI 驱动的儿童教育平台、设计儿童心理健康监测和干预系统。 多元探索者小组,打算开发基于 multiagent 生态的游戏化 AI 学习平台、创造模拟真实世界交互的 multiagent 系统、设计创新 AI 商业模型。 教育领域的 Top10 AI 产品数据如下: QChat,4 月访问量 14220 万次,相对 3 月变化 0.068。 CheggMate,4 月访问量 4906 万次,相对 3 月变化 0.042。 Khanmigo,4 月访问量 4570 万次,相对 3 月变化 0.015。 Brainly:AI Homework Helper,4 月访问量 3102 万次,相对 3 月变化 0.023。 Turnitin,4 月访问量 1677 万次,相对 3 月变化 0.149。 WolframAlpha,4 月访问量 983 万次,相对 3 月变化 0.054。 gauthmath,4 月访问量 656 万次,相对 3 月变化 0.558。 Socratic by Google,4 月访问量 467 万次,相对 3 月变化 0.037。 Aistote,4 月访问量 321 万次,相对 3 月变化 0.207。 PTE APEUni,4 月访问量 321 万次,相对 3 月变化 0.198。
2025-03-28
UI相关的ai工具有哪些
以下是一些与 UI 相关的 AI 工具: 1. UIzard:利用 AI 技术生成用户界面,可根据提供的信息快速生成 UI 设计。 2. Figma:基于云的设计工具,提供自动布局和组件库,其社区开发的一些 AI 插件可增强设计流程。 3. Sketch:流行的矢量图形设计工具,插件系统中部分插件利用 AI 技术辅助设计工作。 4. UIGENT1:基于 Qwen2.5Coder7B 微调,能根据提示生成标准 HTML/CSS 代码,擅长基础前端页面。 5. Galileo AI:可根据文字或图片生成完整 UI 设计,并导出 HTML 和 Figma 文件。 6. 即时设计:https://js.design/ ,可在线使用的专业 UI 设计工具,注重云端文件管理和团队协作。 7. V0.dev:https://v0.dev/ ,Vercel Labs 推出的 AI 生成式用户界面系统,能通过文本或图像生成代码化的用户界面。 8. Wix:https://wix.com/ ,用户友好的 AI 工具,无需编码知识即可创建和自定义网站。 9. Dora:https://www.dora.run/ ,通过一个 prompt,借助 AI 3D 动画生成强大网站。 请注意,部分内容由 AI 大模型生成,请仔细甄别。
2025-03-27
有没有ai小说相关的文档
以下是为您找到的与 AI 小说相关的文档内容: 关于 DeepSeek 小说家的文档: 2025 年 2 月 9 日的智能纪要中,财猫将介绍 Deepseek 模型的飞书文档发送到评论区,以便🌈AJ 收录到 v to agi。财猫补充 AGI 之路的文档,以控制 AI 生成小说的字数。🌈AJ 收录财猫的文章《如何用 AI 写出比人更好的文字》。 智能章节中,财猫分享 Deepseek R1 模型特点,包括对汉语理解深刻、文风欢脱、才华横溢能写高质量诗文、有极强发散能力但较难收敛会出现“幻觉”等,在写小说时生成点子很棒但难以形成完整故事。还讲解了 Deepseek re 提示词写法及相关理论,提到 reason 模型与 instruct 模型不同,回顾历史并指出过去提示词中列步骤的问题,如今模型可自行完成步骤,老框架仍有用。围绕 Deepseek REE 提示词展开讨论,指出问题空间理论仍适用,搜索部分无需人工列出,提示词两类基本盘未变但弥补模型缺点的会减少,写提示词要给 AI 足够背景信息,结构化提示词有帮助等。 相关链接: 画小二团队的《李清照》AI 视频创作流程项目文档中,关于故事创作部分: 创作穿越故事的 Prompt 包括标题、设置、主角、反派角色、冲突、对话、主题、基调、节奏和其它等方面的生成模板,并可根据模板为特定题材小说填充内容,分章节生成小说目录。
2025-03-26