Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

更通用一点,更落地一点,主题换成学习AI&LLM吧

Answer

以下是关于学习 AI&LLM 的相关知识:

一、AI 相关概念与技术

  1. 概念

    • 生成式 AI 生成的内容称为 AIGC。
    • AI 即人工智能。
  2. 机器学习

    • 电脑通过找规律进行学习,包括监督学习、无监督学习、强化学习。
    • 监督学习:使用有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归。
    • 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务如聚类。
    • 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训小狗。
  3. 深度学习

    • 一种参照人脑神经网络和神经元的方法(因有很多层所以叫深度)。
    • 神经网络可用于监督学习、无监督学习、强化学习。
  4. 生成式 AI

    • 可以生成文本、图片、音频、视频等内容形式。
  5. LLM(大语言模型)

    • 对于生成式 AI,生成图像的扩散模型不是大语言模型。
    • 对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类。

二、技术里程碑

2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。

三、RL 与 LLM 融合的本质与阐释

AI 本质是一堆 scaling law。今天能看到最好的模型规模在 10 的 25 到 26 次方 FLOPs 这种规模,且数量级还会持续增长,算力是必要条件。一个值得被 scale up 的架构是基础,要支持不断加入更多数据。现在“吃”的是 base model 的 scaling law,未来可能会“吃”用户数据源的 scaling law。alignment 也有 scaling law,只要能找到对的数据就能解决。当 next token prediction 足够好时,能够平衡创造性和事实性。多模态数据的引入可推迟数据瓶颈问题,如视频和多模态的卡点解决不了,文本的数据瓶颈就会很关键。在限定问题(如数学或写代码)上,数据相对好生成,通用问题还没有完全的解法,但有探索方向。统计模型没有问题。

Content generated by AI large model, please carefully verify (powered by aily)

References

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。

融合RL与LLM思想,探寻世界模型以迈向AGI「中·下篇」

“AI本质就是一堆scaling law..今天能看到最好的模型是10的25到26次方FLOPs这种规模。这个数量级接下来肯定还会持续增长,所以我认为算力是个必要条件,因为机器学习或者AI研究了七八十年,唯一work的东西其实是scaling Law,就是放大这几种生产要素。你需要一个同时满足scalability和generality这两点的架构,但今天其实很多架构已经不满足这两条了。transformer在已知的token space符合这两条,但放大到一个更通用的场景,也不太符合。数据也是一个生产要素,包括整个世界的数字化,和来自用户的数据。现在“吃”的是base model的scaling law,未来可能会去“吃”用户这个数据源的scaling law。因为其实alignment也有scaling law,它肯定是可以被解决的,只要你能找到对的数据。AI本质就是一堆scaling law。一个值得被scale up的架构是基础,这个架构首先得支持不断加入更多数据,然后数据才会真的成为瓶颈。我们现在说的数据瓶颈,从文本模态上,2024年就会遇到,但多模态数据的引入进来会把这个问题推迟1-2年。如果视频和多模态的卡点解决不了,那文本的数据瓶颈就会很关键。这点上其实我们也有些进展——如果限定了问题,比如数学或者写代码,数据是相对好生成的。通用的问题现在还没有完全的解法,但是存在一些方向可以去探索。统计模型没有什么问题。当next token prediction足够好的时候,它能够平衡创造性和事实性。

Others are asking
什么ai可以帮我修改简历美化简历
以下是一些可以帮助您修改和美化简历的 AI 工具: 1. 超级简历优化助手:分析简历内容并提供优化建议,帮助用户优化简历提高求职成功率。 2. ResumeMatcher:AI 驱动的开源简历优化工具,提供智能关键词匹配、深入分析见解,提升简历通过 ATS 筛选的几率。 3. KickResume:提供 AI 简历重写服务,使用 OpenAI 的 GPT4 语言模型,能在几秒钟内修复简历错误、使其更专业,并使用行业术语和关键词优化简历,帮助用户通过 ATS 筛选,生成与求职职位匹配的求职信。
2025-03-18
AIGC 检测
以下是一些常见的 AIGC 检测相关的信息: AIGC 论文检测网站和工具: 1. Turnitin:是广泛使用的学术剽窃检测工具,增加了检测 AI 生成内容的功能。使用方法是上传论文,系统自动分析并提供详细报告,标示出可能由 AI 生成的部分。 2. Copyscape:主要用于检测网络上的剽窃行为,虽不是专门的 AIGC 检测工具,但可发现可能被 AI 生成的重复内容。输入文本或上传文档,系统扫描网络查找相似或重复内容。 3. Grammarly:提供语法检查和剽窃检测功能,剽窃检测部分可帮助识别可能由 AI 生成的非原创内容。将文本粘贴到编辑器中,选择剽窃检测功能,系统提供分析报告。 4. Unicheck:基于云的剽窃检测工具,适用于教育机构和学术研究,可检测 AI 生成内容的迹象。上传文档或输入文本,系统分析并生成报告,显示潜在的剽窃和 AI 生成内容。 5. :专门设计用于检测 AI 生成内容的工具,使用先进算法分析文本,识别是否由 GPT3 或其他 AI 模型生成。上传文档或输入文本,系统提供详细报告。 6. :提供免费的 AI 内容检测工具,可识别文本是否由 AI 生成。将文本粘贴到在线工具中,点击检测按钮,系统提供分析结果。 7. GPTZero:专门设计用于检测由 GPT3 生成内容的工具,适用于教育和出版行业。上传文档或输入文本,系统分析并提供报告,显示文本是否由 GPT3 生成。 8. Content at Scale:提供 AI 内容检测功能,帮助用户识别文本是否由 AI 生成。将文本粘贴到在线检测工具中,系统分析并提供结果。 判断一张图片是否 AI 生成: 可以使用一些网站,例如 ILLUMINARTY(https://app.illuminarty.ai/)。但在测试过程中可能存在误判,比如将结构严谨的真实摄影作品识别为 AI 作图,这是因为鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。
2025-03-18
目前有哪些免费可用的 AI视频生成软件
以下是一些免费可用的 AI 视频生成软件: 1. Haiper:有免费额度,网址为 https://haiper.ai/ 。支持文生视频、图生视频、素描生视频、扩展视频,能生成 HD 超高清的视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值。图生视频只能写提示词、秒数(2s 和 4s)。还支持视频重绘,包括局部重绘。 2. DynamiCrafter:免费,网址为 https://huggingface.co/spaces/Doubiiu/DynamiCrafter 及 https://github.com/Doubiiu/DynamiCrafter?tab=readmeovfile ,可生成 2 秒图生视频,还能做短视频拼长视频。 3. Morph studio:处于内测阶段,网址为 https://app.morphstudio.com/ 。暂未对外开放,可在官网提交内测申请。在 discord 上可以免费体验,支持文生视频、图生视频,英文提示词,支持运镜、运动强度、尺寸、秒数设置,默认生成 3s 视频。 此外,清影也是一款不错的 AI 视频生成工具,在首发测试期间所有用户均可免费使用。它具有不限量使用、生成速度快、提供配乐小功能等特色。生成参数包括时长 6s、清晰度 1440x960(3:2)、帧率 16fps 等,在风景、动物、超现实、人文历史类需求以及皮克斯风格、卡通风格、摄影风格、动漫风格等方面表现突出。 截至 2023 年,我们已经发现了 21 个公开的人工智能视频生成工具,大多数起初以 Discord 机器人的形式存在,随着产品成熟,越来越多的工具开始建立自己的网站甚至开发移动应用。
2025-03-18
使用ai绘图能够将带货产品批量换背景,使用在小红书社区
以下是一些能够为带货产品批量换背景并应用于小红书社区的人员信息: 卡飞猫:15692004031,擅长摄影写真、banner 生成、替换产品。 韩君奇:13060035786,能够批量出图,做小红书种草。 阿鱼:18102592057,擅长各种类型的 AI 画图,以及 AI 视频提效。 吴燕波:15766104311,可进行日常出图,视频等。
2025-03-18
使用ai绘图实现小红书笔记图片批量生成
以下是关于使用 AI 绘图实现小红书笔记图片批量生成的相关知识: Liblibai 简易上手教程: 1. 迭代步数:AI 调整图片内容的次数。步骤越多,调整越精密,出图效果理论上更好,但生图耗时越长,且效果提升并非线性,过多可能导致效果增长曲线放平并开始震荡。 2. 尺寸:图片生成的尺寸大小。太小 AI 生成内容有限,太大则可能放飞自我。如需高清图,可设置中等尺寸并用高分辨率修复。 3. 生成批次:用本次设置重复生成的批次数。 4. 每批数量:每批次同时生成的图片数量。 5. 提示词引导系数:指图像与 prompt 的匹配程度。数字增大图像更接近提示,但过高会使图像质量下降。 6. 随机数种子:生成的每张图都有随机数种子,固定种子后可对图片进行“控制变量”操作,如修改提示词、修改 clip 跳过层等。首次生成图时无种子。 7. ADetailer:面部修复插件,可治愈脸部崩坏,为高阶技能。 8. ControlNet:控制图片中特定图像,用于控制人物姿态、生成特定文字、艺术化二维码等,也是高阶技能。 利用 AI 批量生成、模仿和复刻《小林漫画》: 1. 需求分析:主要需求是国内可直接使用且能批量生产,选用扣子搭建工作流,可能需牺牲一定质量的文案和图片效果。 2. 批量生成句子:一次性生成的句子都进行生成图片处理,建议一次不要生成太多,如设置一次生成五句。 3. 句子提取:把生成的句子逐个提取,针对每个句子绘图。 4. 图片生成:根据生成的句子结合特有画风等描述绘图。 5. 图片和句子结合:扣子工作流支持 Python 代码,但环境缺少画图、图片处理所需包,可替换成搞定设计的方式处理图片,会用 PS 脚本效果也不错。 此外,还有一些人员在不同领域涉及 AI 绘图相关工作,如韩君奇从事批量出图和小红书种草工作。
2025-03-18
使用ai换背景能够实现真实的画面效果
使用 AI 换背景能够实现较为真实的画面效果,以下为您介绍几种相关方法: 在 SD 中,若要实现更精确的蒙版,如人物的眼睛或身上配饰等,可以使用 Segment Anything 中的 GroundingDINO 模型。启用该模型后,AI 会自动下载,也可从云盘下载放到指定文件目录。在检测提示词中输入相关内容,如“eye”,AI 可自动检测并设置蒙版,还能通过预览箱体获取眼睛编号进行单一调整。选择要修改的蒙版上传到重绘蒙版中,添加提示词如“闭眼”并生成。之后可给人物换背景,加载生成的背景蒙版,选择大模型和正向提示词,如“简单背景、花、国画、工笔”,并选择蒙版模式。若效果不佳,可将图片放入图生图中用 tile 模型细化,还可在 PS 中用创成式填充修复头发。 在 PS 中,可利用“创成式填充”去掉主体以外的人物,如在水面画选区并输入提示词添加渔船,选择头部区域添加棒球帽,选择草地部分输入提示词更换,选择树输入提示词更改等。但 PS 的“创成式填充”并非无所不能,生成的图可能质量不高或不匹配,需要更多尝试和后期处理。 Google 的 Gemini 文生图 AI 在抠图、换背景、打光影方面表现出色。如能无中生有地换背景,进行商业级别的背景合成与打光,通常能在短时间内取得稳定且较好的预期结果。
2025-03-18
什么是LLM
LLM(大型语言模型)是一种具有重要意义的人工智能系统,它具有以下特点和作用: 它不仅仅是一个聊天机器人,更像是新一代操作系统的核心程序。能够协调跨多种模式的输入与输出(如文本、音频、视觉),具备代码解释和运行程序的能力,具有浏览器/上网功能,包含用于文件和内部内存存储与检索的嵌入式数据库。 是 LangChain 平台与各种大模型进行交互的核心模型,是一个能够处理语言输入和输出的抽象概念,输入是字符串形式的用户请求或问题,输出也是字符串形式的模型回答或结果。其优势在于让开发者无需关心大模型的细节和复杂性,能灵活选择和切换不同大模型,还能让开发者自己封装自己的 LLM 以实现特定的语言逻辑和功能。 是一种非常聪明的人工智能系统,能够通过学习大量的文字数据来理解和生成自然语言。可以想象成一个超级有知识的朋友,能回答各种问题、写故事、完成作文。就像一个读了很多书、知识丰富的小朋友,虽然不是真人,却是一个能处理和学习海量文字数据的计算机程序,这些数据来源广泛。如今的搜索引擎背后可能就有 LLM 的支持,能给出更准确、完整的答案,有时像真正的专家一样解答问题。 总的来说,LLM 是一种通过学习大量文本数据,能够理解和生成自然语言的人工智能系统。
2025-03-10
LLM大模型与运维
以下是关于 LLM 大模型与运维的相关内容: 部署方面: 本地部署包括三大部分:本地部署大语言模型、本地部署 FastGPT+OneAPI、本地部署 HOOK 项目或 COW。 下载并安装 Ollama:根据电脑系统,从 https://ollama.com/download 下载,双击打开点击“Install”,安装完成后将下方地址复制进浏览器中确认:http://127.0.0.1:11434/ 。 下载 qwen2:0.5b 模型:Windows 电脑点击 win+R 输入 cmd 回车,Mac 电脑按下 Command(⌘)+Space 键打开 Spotlight 搜索输入“Terminal”或“终端”,然后复制命令行粘贴回车等待自动下载完成。 训练方面: 模型训练比推理复杂得多,是一个计算量极大的过程。获取参数面临计算复杂性问题。例如训练 Llama2 70B 这样的开源模型,需要约 10TB 的文本,通常来源于互联网的抓取,大约 6000 个 GPU,运行约 12 天,费用约 200 万美元,得到的参数文件约 140GB,压缩比约 100 倍,且是有损压缩。 整体架构方面: 基础层:为大模型提供硬件支撑,数据支持,如 A100、数据服务器等。 数据层:包括静态的知识库和动态的三方数据集。 模型层:有 LLm(如 GPT,一般使用 transformer 算法)或多模态模型(如文生图、图生图等,训练数据为图文或声音等多模态数据集)。 平台层:如大模型的评测体系或 langchain 平台等,提供模型与应用间的组成部分。 表现层:即应用层,是用户实际看到的地方。
2025-03-09
RAG内LLM的主要作用,简单概括
RAG(检索增强生成)中LLM(大语言模型)的主要作用包括: 1. 利用外部检索到的知识片段生成更符合要求的答案。由于LLM无法记住所有知识,尤其是长尾知识,且知识容易过时、不好更新,输出难以解释和验证,容易泄露隐私训练数据,规模大导致训练和运行成本高,通过RAG为LLM提供额外且及时更新的知识源,有助于生成更准确和有用的回答。 2. 在RAG的工作流程中,LLM接收整合后的知识片段和特定指令,利用其推理能力生成针对用户问题的回答。 3. 事实性知识与LLM的推理能力相分离,LLM专注于运用推理能力处理外部知识源提供的信息。
2025-03-08
使用llm的爬虫工具推荐下,开源免费
以下是为您推荐的开源免费的使用 LLM 的爬虫工具: 1. Jina 开源的网页内容爬取工具:Reader API 能从网址提取出核心内容,并将其转化为干净、易于大语言模型处理的文本,确保为您的 AI 智能体及 RAG 系统提供高品质的数据输入。 2. Scrapy 库(Python 语言):在 crawlab 可以做到分布式爬取,非常高效。 3. GPT Crawler:主要运用 typescript 进行数据爬取。 4. 在开源的项目中,为实现对含有 JavaScript 内容的网页抓取,不使用 Python 自己的 request 库,而是使用 playwright 之类的浏览器,并将网页内容按照一定规则转化成 markdown 格式,方便 LLM 后续的理解和抓取。 同时,对于爬虫工具的选择,还需根据您的具体需求和技术熟悉程度来决定。
2025-03-06
llm项目
以下是一些与 LLM 项目相关的信息: 开源中文大语言模型及数据集集合: LuotuoChineseLLM:地址为,囊括了一系列中文大语言模型开源项目,包含基于已有开源模型进行二次微调的语言模型、指令微调数据集等。 Linly:地址为,提供中文对话模型 LinlyChatFlow、中文基础模型 LinlyChineseLLaMA 及其训练数据。 ChatYuan:地址为,是元语智能发布的一系列支持中英双语的功能型对话语言大模型,在微调数据、人类反馈强化学习、思维链等方面进行了优化。 ChatRWKV:地址为,开源了一系列基于 RWKV 架构的 Chat 模型(包括英文和中文),可以直接闲聊及进行诗歌、小说等创作。 无需微调,仅用提示词工程就能让 LLM 获得 tool calling 的功能:作者 ailm 提出一种仅使用提示词工程和精巧的代码设计,即可让 LLM 获得稳定的 tool calling 能力。使用多个不具备 tool calling 能力的 LLM 作为测试模型,在多个工具调用任务上实验成功率为 100%。工作基于 comfyui 开发,适合无代码基础的人员复现和修改。 XiaoHu.AI 日报 1 月 29 日: LLMsfromscratch 项目:详细解释 LLMs 的工作原理,提供创建自己的 LLM 的逐步指南,适合企业团队、初创公司和教育机构学习。链接: SliceGPT 微软开发的大语言模型压缩方法:在保持高性能的同时大幅减少模型参数,允许在更少的 GPU 上运行,提高运行速度,显著降低在消费级 GPU 上的总计算量。链接: VisualWebArena 自主智能体的视觉网络任务基准测试:评估智能体在网络环境中的规划、推理和执行任务能力,着重于视觉信息的重要性和多模态智能体评估,提供深入的定量和定性分析,揭示 LLM 智能体的限制。链接: 百川智能的 Baichuan 3 模型:中文任务评测表现卓越,超越 GPT4,在医疗领域和中华传统文化理解方面表现突出,引入创新技术,提高训练效率和数据质量。链接: Apple Vision Pro 最新宣传片:链接
2025-03-04
如何写适配多个llm的提示词
以下是关于如何写适配多个 LLM 的提示词的详细内容: 实现原理: 提示词工程主要由两部分代码组成,即提示词注入和工具结果回传。提示词注入用于将工具信息及使用工具的提示词添加到系统提示中,它包含 TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT 三个部分。TOOL_EAXMPLE 用于提示 LLM 如何理解和使用工具,编写时应注意用无关紧要的工具作示例以免 LLM 混淆。tools_instructions 是将通用工具字典转换成 LLM 可读的工具列表,实际使用时可动态调整以让 LLM 知晓可用工具及使用方法。REUTRN_FORMAT 定义了调用 API 的格式。工具结果回传则是解析 tool calling 的输出,并将工具返回的内容再次嵌入 LLM,利用正则表达式抓取输出中的“tool”和“parameters”参数,对于 interpreter 工具使用另一种正则表达式提取 LLM 输出的代码,以提高成功率。对于不接受某些角色的 LLM 接口,可改为回传给 user 角色。 相关成果: 目前绝大多数小型本地开源大语言模型以及部分商用大模型接口不支持稳定的 tool calling 功能,现有的微调 LLM 解决方案会浪费大量时间和算力。本文提出仅使用提示词工程和精巧的代码设计,让 LLM 获得稳定的 tool calling 能力。使用多个不具备该能力的 LLM 作为测试模型,在多个工具调用任务上实验成功率达 100%,且基于 comfyui 开发,适合无代码基础的人员复现和修改。
2025-03-03
帮我找一点生成小红书的 Ai 提示词测试一下看看
以下是为您提供的一些生成小红书的 AI 提示词示例: 1. 五津:DeepSeek+扣子:1 分钟生成小红书爆款单词视频 角色:您是一个专业的单词生成助手,擅长围绕各种主题挖掘相关英语单词,为用户提供精准且实用的单词、中文、美式音标内容。 技能:当用户输入主题{{zhuti}}时,分析主题内涵,运用专业知识,输出{{shuliang}}个与该主题紧密关联的英语单词、中文翻译、美式音标,将该单词用于一句英文中(不超过 15 个单词),并将这句英文句子翻译成中文句子,并以数组形式呈现。 限制:仅围绕用户输入主题输出相关英语单词、中文翻译、美式音标,不涉及其他领域内容。输出必须为符合要求的数组形式,英文单词对应变量 yingwen,中文翻译对应变量 zhongwen,美式音标对应变量 yinbiao,英文句子对应变量 juzi_yingwen,中文句子翻译对应变量 juzi_zhongwen,不得有其他格式偏差。 2. 夙愿:用 AI 化繁为简,解决复杂问题的指南 提示词链:一个月前,通过逐步构建和不断优化提示词,最终迭代出一个小红书视频标题生成助手。收集高质量的标题示例作为后续分析的基础(纯人类),询问 GPT 分析标题特点的维度(人机协同),让 GPT 根据这些维度分析标题特点(人机协同),编写提示词(纯人类),测试提示词(人机协同),迭代提示词(人机协同)。 3. 一泽 Eze:样例驱动的渐进式引导法——利用 AI 高效设计提示词,生成预期内容 引言:一个精彩的 Prompt 是驱动 AI Agent 稳定运作的核心。例如常见的“小红书爆文生成 AI”提示词,包含精确、巧妙的提示。高质量的 Prompt 极度依赖用户通过逻辑思考,从知识经验中抽象表达出关键方法与要求。
2025-03-14
我要跟AI工作流有关的文章链接,只要飞书里边的,多给一点
以下是为您提供的与 AI 工作流相关的飞书文章链接: 1. 《》 2. 《》 3. 《》 4.
2025-03-04
我需要你给我生成一些提示词,我会给你我想的想法。《》以内的是想法。《我想写一篇影视解说的文案,写作的视角以我,第一人称的视角来写。想要风格偏幽默风趣一点,就像跟朋友在讲述一样,可以模仿鲁迅先生的手法。而且还想把影片的剧情内容写出来,从开篇到电影的结尾,如果有需要保留原片的地方,请把原片的画面场景以及时间段描述出来。要求这篇文案要附上我自己的内心独白,以此引人深思!请你深度思考后,在做答复!要求字数不少于5000字。》请问我该如何写提示词?请你整理好提示词后发给我
以下是为您生成的一些提示词,希望对您有所帮助: 影视解说文案提示词 1. 以第一人称幽默风趣的口吻,像与朋友讲述般,描绘影片从开篇到结尾的精彩剧情,融入自己的内心独白,模仿鲁迅先生的手法,展现独特的视角和深刻的思考。 2. 用轻松幽默的语言,以我的视角详述影片情节,穿插搞笑的评论和内心想法,借鉴鲁迅先生的讽刺技巧,使解说引人入胜。 3. 以亲切自然的叙述方式,如同与好友聊天,讲述影片故事,从开头至结束,结合鲁迅先生的文风,加入个人的情感起伏和独特见解。 DALL·E 相关提示词 1. 绘画:提及颜料种类、画布纹理和笔触形状/纹理(列表)。 2. 数字:注明使用的软件、阴影技术和多媒体方法(列表)。 3. 基于详细提示使用 DALL·E 3 生成图像,让创意鲜活起来,为提示的每个元素做出大胆有趣的选择。 4. 遵循提示指南,提出四个全新的简单概念,而非完整提示,从上次给出的建议中获取灵感。 请注意,默认方面比率为正方形(1:1),默认风格为摄影,包括相机设置、摄影类型和设备。同时,避免违反服务条款的词汇或概念,不侵犯版权,不使用暗示性或露骨的图像,强调符合 G 级评级的元素。
2025-02-06
那我想要按照第一点来,有软件推荐吗?
以下是一些与学习提示词相关的软件推荐: 1. 对于大模型账号,性能最强的当属 ChatGPT4,国产平替有: 2. 学习资料方面,建议查看 OpenAI 的官方文档: 此外,还有中文精度版的官方 Cookbook:
2025-01-05
我需要一个工具 让我能够把看到的资料汇总到里面,慢慢的他就成为了我的一个智能助理,但凡我阅读过的东西,只要我能想到一点点相关内容,都能通过这个工具在里面找到汇总答案,同时还能链接到原来的文章或知识点,有这样的AI工具么
以下是为您整理的相关信息: 目前有一些工具和方法可以满足您的需求。例如: 1. 在“让机器理解世界/GPT 时代人类再腾飞·译者序”中提到,人类要学会深刻理解 AI 系统的工作方式与它的边界,AI 可以作为伙伴帮助我们充分发挥潜力。 2. 7 月 16 日 Jimmy Wong &吕立青的相关内容中,提到可以通过输入端输入不同模态的内容,包括音频、文本、视频等并消化,在输出端借助自己的知识或让 AI 助理基于收藏或保存的知识点来完成某些事情,如写文章、输出代码等。 3. 在“VIRTUAL”中,提到可以用 AI 搜索引擎如 felo.ai/search 搜索并归纳内容,用 AI 可视化工具 napkin.ai 转成图示。还提到可以像编程一样预先写好咒语(prompts),将日常工作中固定输入输出的部分写成“智能体”并不断迭代优化。很多 AI 网站都可以创建“智能体”,您可以手搓各种机器人为您工作,如出试题、找资料、画插图、专业翻译等,还能设置“常用语”“小助手”“bot”,如 Kimi.ai 。 综合来看,目前有多种方式和工具可以帮助您实现将资料汇总并成为智能助理的需求。
2024-12-14
AI如何综合利用,可以高效率做哪些事情,总结一下短一点
以下是 AI 综合利用能够高效率做的一些事情: 在政府领域,帮助政府为民众提供更好的服务,如扩大机构的监管、治理和福利发放能力,降低成本并增强系统安全性。包括为机构使用 AI 发布指导,帮助机构更高效、更经济、更有效地获取特定 AI 产品和服务,加速招聘 AI 专业人员并为员工提供相关培训。 推动经济增长和繁荣,通过降低监管不确定性,鼓励对 AI 的投资和应用,及时消除创新障碍。 在教学中,帮助教师节省时间和提高生产力,如分析学生表现制定个性化学习计划,生成图像、文本和视频用于课程开发和学习沉浸,结合新的 AI 工具为学生提供更好的沟通准备。但与优秀人类教师相比仍有差距,人机融合是趋势。
2024-10-26
我在用AI辅助学习新概念英语第二册,但是deep seek总是报错,我应该换成什么别的AI呢?
如果您在使用 Deep Seek 辅助学习新概念英语第二册时总是报错,可以考虑换成 Wenxiaobai.com 这个平台。它高速响应,完全免费,支持各种平台使用,与 Deep Seek 官网几乎相同,速度快且稳定性高,最新版本还支持文档与图片分析。
2025-03-12
我想让cursor帮我编程一个能在Android studio编译的Android应用,它的主要功能是接受esp32通过websocket协议发送过来的opus数据,保存opus并把数据转换成wav,再使用sherpa-onnx语音识别成文字。我该使用什么提示词让cursor帮我写出这个Android应用?
很抱歉,目前没有适用于让 Cursor 生成您所需 Android 应用的特定提示词。编写这样一个复杂的 Android 应用需要对 Android 开发、网络通信、音频处理和语音识别等多个领域有深入的了解和专业知识。您可能需要逐步向 Cursor 描述应用的架构、各个模块的功能和实现逻辑,例如先描述如何建立与 ESP32 的 WebSocket 连接,如何接收和处理 Opus 数据,如何进行数据转换以及如何调用 Sherpaonnx 进行语音识别等。但需要注意的是,仅仅依靠提示词让 Cursor 生成完整可用的复杂应用可能具有一定的局限性,建议您在具备相关基础知识的前提下,结合 Cursor 的辅助来逐步完成开发。
2025-03-06
我想让cursor帮我编程一个能在Android studio编译的Android应用,它的主要功能是接受esp32通过websocket协议发送过来的opus数据,保存opus并把数据转换成wav,再使用sherpa-onnx语音识别成文字。我该使用什么提示词让cursor帮我写出这个Android应用?
很抱歉,目前没有关于使用 Cursor 生成您所需的这种特定 Android 应用的提示词的相关内容。一般来说,您可以向 Cursor 提供以下关键信息作为提示词的参考: 1. 明确应用的功能需求,如“编写一个在 Android Studio 中编译的 Android 应用,用于接收 ESP32 通过 WebSocket 协议发送的 Opus 数据,保存 Opus 并转换为 WAV 格式,然后使用 Sherpaonnx 进行语音识别成文字。” 2. 描述应用的技术架构和关键技术点,例如“应用需基于 Android 平台,使用合适的网络库处理 WebSocket 连接,采用有效的数据存储方式保存 Opus 数据,利用特定的音频转换库将 Opus 转换为 WAV,以及集成 Sherpaonnx 语音识别库实现文字转换。” 3. 提及开发环境和工具要求,比如“在 Android Studio 开发环境中,遵循 Android 应用开发规范和最佳实践。” 但需要注意的是,Cursor 生成的代码可能并不完全满足您的需求,还需要您进行进一步的修改和完善。
2025-03-06
你好,我想用ai将一张图片形式的数字表格转换成excel,应该使用哪款模型?
很抱歉,上述提供的内容中没有直接提及将图片形式的数字表格转换成 Excel 可用的具体模型。但您可以尝试以下几种常见的方法和工具: 1. 一些 OCR(光学字符识别)软件,如 ABBYY FineReader、Adobe Acrobat Pro 等,它们通常具有将图片中的表格转换为可编辑文本的功能,然后您可以将其粘贴到 Excel 中进行整理。 2. 在线 OCR 服务,例如百度 OCR、腾讯 OCR 等,操作相对便捷。 3. 某些专门用于表格处理的 AI 工具,您可以通过在相关的技术论坛、社区或专业的软件评价网站上进一步搜索和了解。
2025-02-26
现在国内最好用的文生视频工具是什么,主要专注于一段文字转换成视频,文档字数300字左右,制作出的视频长度在一分钟左右
以下是一些国内好用的文生视频工具: 1. Pika:出色的文本生成视频 AI 工具,擅长动画制作且支持视频编辑。 2. SVD:若熟悉 Stable Diffusion,可安装此最新插件,能在图片基础上生成视频,由 Stability AI 开源。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频功能,但收费。 4. Kaiber:视频转视频 AI,能将原视频转换成各种风格。 5. Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 此外,还有以下工具: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析并生成素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持多模态输入转化为视频。 3. Pictory:允许用户提供文本描述生成相应视频内容。 4. VEED.IO:提供 AI 图像和脚本生成器,帮助规划视频内容。 5. 艺映 AI:专注人工智能视频领域,提供文生视频等服务。 国内的还有: 1. Hidreamai:有免费额度,支持文生视频、图生视频,提示词中文、英文均可,能控制运镜等,可生成 5 秒和 15 秒的视频。 2. ETNA:由七火山科技开发,能根据简短文本描述生成 8 15 秒的视频,画质可达 4K,支持中文,时空理解。 您可以根据自己的具体需求和使用场景进行选择。更多的文生视频网站可查看:https://www.waytoagi.com/category/38 。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-15
介绍一个文稿转换成视频的ai工具
以下为您介绍一些文稿转换成视频的 AI 工具: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果您熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 若您想用 AI 把小说做成视频,可参考以下制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 以下是一些可利用的工具及网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址: 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。网址: 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-01-04