Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI的历史和一些关键名词介绍

Answer

以下是关于 AI 的历史和一些关键名词的介绍:

AI 的历史:

  • 始于二十世纪中叶,最初符号推理流行,带来专家系统等重要进展。
  • 20 世纪 70 年代出现“人工智能寒冬”,因从专家提取知识等任务复杂且成本高。
  • 随着计算资源变便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现出色性能,过去十年中“人工智能”常被视为“神经网络”的同义词。

关键名词:

  • 机器学习:是 AI 的一个重要分支,研究如何让计算机通过数据学习和改进。
  • 深度学习:基于神经网络的一种学习方法。
  • 自然语言处理:使计算机理解和处理人类语言。

在学习 AI 时,您可以:

  • 了解基本概念,阅读相关部分熟悉术语和基础概念,如“从这里启程”。
  • 浏览入门文章,了解历史、应用和发展趋势。
  • 在“入门:AI 学习路径”中找到初学者课程,推荐李宏毅老师的课程。
  • 通过在线教育平台按自己节奏学习。
  • 选择感兴趣的模块深入学习,如图像、音乐、视频等。
  • 掌握提示词技巧。
  • 进行实践,尝试使用各种产品做出作品。
  • 体验如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人。
Content generated by AI large model, please carefully verify (powered by aily)

References

问:新手如何学习 AI?

了解AI基本概念:首先,建议阅读「[从这里启程](https://waytoagi.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=blkjooAlLFNtvKJ2)」部分,熟悉AI的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍AI的历史、当前的应用和未来的发展趋势。开始AI学习之旅:在「[入门:AI学习路径](https://waytoagi.feishu.cn/wiki/ZYtkwJQSJiLa5rkMF5scEN4Onhd?table=tblWqPFOvA24Jv6X&view=veweFm2l9w)」中,你将找到一系列为初学者设计的课程。这些课程将引导你了解生成式AI等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如Coursera、edX、Udacity)上的课程,你可以按照自己的节奏学习,并有机会获得证书。选择感兴趣的模块深入学习:AI领域广泛(比如图像、音乐、视频等),你可以根据自己的兴趣选择特定的模块进行深入学习。我建议你一定要掌握提示词的技巧,它上手容易且很有用。实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出你的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎你实践后的分享。体验AI产品:与现有的AI产品进行互动是学习AI的另一种有效方式。尝试使用如ChatGPT、Kimi Chat、智谱、文心一言等AI聊天机器人,了解它们的工作原理和交互方式。通过与这些AI产品的对话,你可以获得对AI在实际应用中表现的第一手体验,并激发你对AI潜力的认识。

人工智能简介和历史

译者:Miranda,原文见https://microsoft.github.io/AI-For-Beginners/lessons/1-Intro/README.md[heading1][课前测试](https://red-field-0a6ddfd03.1.azurestaticap[content]人工智能(Artificial Intelligence)是一门令人兴奋的科学,它研究我们如何使计算机表现出智能行为,例如做一些人类所擅长的事情。最初,查尔斯·巴贝奇(Charles Babbage)发明了计算机,用于按照一套明确定义的程序(即算法)来对数字进行运算。现代计算机虽然比19世纪提出的原始计算机模型要先进得多,但仍然遵循着相同的受控计算理念。因此,如果我们知道实现某些目标所需的每一个步骤及其顺序,就有可能编写出程序,使计算机按照我们的想法去做这些事。✅“根据照片判断一个人的年龄”是一件无法明确编程的任务,因为我们并不知道当我们在做这件事时,是如何经过某些清晰的步骤,从而在脑海中得到一个数字的。然而,对于有些任务,我们并不能知道明确的解法。例如从一个人的照片中来判断他/她的年龄。我们之所以能做这件事,是因为我们见过了很多不同年龄的人,但我们无法明确自己的大脑具体是通过哪些步骤来完成这项任务的,所以也无法编写明确的程序让计算机来完成。这种类型的任务正是人工智能(简称AI)感兴趣的。✅想一想,如果人工智能得以实现,哪些任务可以被交给计算机完成?考虑金融、医学和艺术领域,这些领域如今是如何从人工智能中受益的?

人工智能简介和历史

人工智能作为一个领域始于二十世纪中叶。最初,符号推理非常流行,也带来了一系列重要进展,例如专家系统——能够在某些有限问题的领域充当专家的计算机程序。然而,人们很快发现这种方法无法实现应用场景的大规模拓展。从专家那里提取知识,用计算机可读的形式表现出来,并保持知识库的准确性,是一项非常复杂的任务,而且因为成本太高,在很多情况下并不适用。这使得20世纪70年代出现了“人工智能寒冬”([AI Winter](https://en.wikipedia.org/wiki/AI_winter))。随着时间的推移,计算资源变得越来越便宜,可用的数据也越来越多,神经网络方法开始在计算机视觉、语音理解等领域展现出可与人类相媲美的卓越性能。在过去十年中,“人工智能”一词大多被用作“神经网络”的同义词,因为我们听到的大多数人工智能的成功案例都是基于神经网络的方法。我们可以观察一下这些方法是如何变化的,例如,在创建国际象棋计算机对弈程序时:

Others are asking
我想做一份简历 可以用哪些ai软件完成
以下是一些可以帮助您完成简历的 AI 软件: 1. Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,能为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 2. Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的每个方面,包括写作、编辑、格式化和优化。 3. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 此外,还有以下相关的 AI 简历工具: 1. 超级简历优化助手:帮助用户优化简历提高求职成功率,分析简历内容并提供优化建议。 2. ResumeMatcher:AI 驱动的开源简历优化工具,提供智能关键词匹配、深入分析见解,提升简历通过 ATS 筛选的几率。 您可以根据自己的需要选择最适合您的工具。更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79
2025-02-07
ai绘画现在处于什么发展阶段
AI 绘画目前处于不断发展和演进的阶段。 在早期,AI 绘画的成果较为简单和粗糙。但随着技术的进步,尤其是深度学习算法如卷积神经网络等的应用,AI 绘画能够生成更加复杂、逼真和富有创意的图像,涵盖了各种风格和题材,从写实到抽象,从风景到人物。 AI 绘画在与人类艺术家的互动和融合中不断创新,为艺术创作带来了新的可能性和挑战。其场景应用广泛,包括广告设计、游戏开发、影视制作、建筑设计等领域。 然而,AI 绘画的发展也引发了一系列讨论和争议。例如,人们对于 AI 生成的艺术品和人类创作的艺术品的接受程度存在差异,AI 在表达情感和创造性意图方面存在局限性,同时也带来了版权、原创性和伦理等问题,以及对文化创意领域从业者职业安全的焦虑。 尽管存在争议,AI 绘画仍为艺术创作提供了新的工具和可能性,如帮助艺术家探索新的创意表达方式,提高制作效率,降低制作成本,促进艺术与观众之间的互动等。目前,生成式 AI 仍处于非常早期的阶段,为其寻找高价值应用场景或许还需要较长时间。
2025-02-07
生成名片的AI工具
以下是一些生成名片的 AI 工具: 一泽 Eze:只需 1 句提示词和 1 个品牌 Logo,就能通过 Claude Artifacts 生成超级符合品牌调性的创意名片。整个流程简单,输入 Prompt 和 Logo 即可。提示词已开源,若生成结果不符合预期,可尝试让模型重新生成或与 AI 对话提出修改意见。注意事项包括提示词主要用于设计符合品牌调性的创意名片,Logo 建议使用清晰、底图透明的 PNG 格式。 以下是一些生成 Logo 的 AI 产品: Looka:在线 Logo 设计平台,使用 AI 理解用户品牌信息和设计偏好,生成多个设计方案供选择和定制。 Tailor Brands:AI 驱动的品牌创建工具,通过回答问题生成 Logo 选项。 Designhill:Logo 制作器使用 AI 技术创建个性化设计,用户可选择元素和风格。 LogoMakr:提供简单易用的设计工具,可利用 AI 建议的元素和颜色方案。 Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 LogoAI by Tailor Brands:根据输入的品牌名称和行业类别快速生成 Logo 设计方案。 标小智:中文 AI Logo 设计工具,利用人工智能技术创建个性化 Logo。 以下是一些设计海报的 AI 产品: Canva(可画):受欢迎的在线设计工具,提供大量模板和元素,AI 可帮助选择颜色搭配和字体样式。 稿定设计:智能设计工具,采用先进人工智能技术,自动分析和生成设计方案。 VistaCreate:简单易用的设计平台,提供大量模板和元素,可使用 AI 工具创建个性化海报,智能建议功能帮助找到合适元素。 Microsoft Designer:通过拖放界面快速创建内容,集成丰富模板库和自动图像编辑功能。
2025-02-07
推荐与 AI 会计、AI 金融相关的内容
以下是与 AI 会计、AI 金融相关的内容推荐: 在金融服务业方面,生成式 AI 除了能回答财务问题,还能改进金融服务团队的内部流程,简化财务团队日常工作。例如,它能从更多数据源获取数据,自动化突出趋势、生成预测和报告的过程,包括预测分析的自动化、报告的自动创建、为会计和税务团队提供帮助、协助采购和应付账款工作等。 100 个 AI 应用中,东方财富网投资分析工具是一个 AI 金融投资分析平台,利用数据分析和机器学习技术,分析金融市场数据,为投资者提供投资建议和决策支持。 AI 在金融服务领域的应用场景广泛,包括风控和反欺诈、信用评估、投资分析、客户服务等。例如,通过识别和阻止欺诈行为降低金融机构风险,评估借款人信用风险辅助贷款决策,分析市场数据助力投资者做出明智投资选择,提供 24/7 客户服务并回答常见问题。
2025-02-07
什么是AI
AI(Artificial Intelligence,人工智能)是一门令人兴奋的科学,它研究如何使计算机表现出智能行为,例如做一些人类所擅长的事情。 对于AI的理解,对于不具备理工科背景的文科生来说可能较困难,可将其当成一个黑箱,只需要知道它是某种能模仿人类思维、理解自然语言并输出自然语言的东西即可。其生态位是一种似人而非人的存在,技术再发展,这一生态位也不会改变。 从技术层面看,最初计算机由查尔斯·巴贝奇发明,用于按照明确的程序进行数字运算,现代计算机虽更先进,但仍遵循相同的受控计算理念。然而,对于像根据照片判断一个人的年龄这类任务,我们无法明确其解法,也无法编写明确程序让计算机完成,这类任务正是AI所感兴趣的。 在应用方面,生成式AI(GenAI)是一种基于深度学习技术,利用机器学习算法从已有数据中学习并生成新数据或内容的AI应用。典型的GenAI包括OpenAI推出的语言模型ChatGPT、GPT4、图像模型DALLE以及百度推出的文心一言、阿里云推出的通义千问等。AIGC则指利用GenAI创建的内容,包括图像、视频、音频、文本和三维模型等。国内主要在相关法律框架下对AIGC行业进行监管。
2025-02-07
音乐制作AI
以下是一些人工智能音频初创公司,专注于音乐创作与制作: :前身为“Definite Technologies”,开发使用 AI 处理/生成声音的 VST/AU/AUv3 插件。 :自适应 AI 音乐平台,通过高质量音频样本进行实时细胞组成。 :基于 AI 的音乐助手,包括歌词写作助手。 :实时音乐、音频和视频创作平台。 :为创意媒体应用提供合成歌声。 :数字宇宙的音乐解决方案,Soundtracks、AI Studio、Music Maker JAM 的制作者。 :AI 音乐创作和制作。 :自由定制高质量免版权费音乐。 :一个云平台,让音乐人和粉丝在全球范围内创作音乐、协作和互动。 :使用嵌入式软件、信号处理和 AI 帮助艺术家录制、混音和母带处理他们的现场表演。 :开源音乐生成工具。 :旨在通过 AI 赋能真实艺术家的伦理音频 AI 插件、工具和社区,而非取代他们。 :使用 AI 创作音乐和语音。 :与 DAW 集成的生成音乐工具,100%免版权费。 :为创意媒体提供的伦理音乐 AI。 :AI 音乐创作平台和探索声音宇宙的个人音乐制作人。 :通过音乐赋予你新的创作和表达方式。 :使用 AI 改变你的歌唱声音。 :为你的创造力和生产力提供 AI 音乐。 :使用 AI 生成声音、音效、音乐、样本、氛围等。 :带有 AI 助手并支持本地 VST 插件的网页 DAW。 :Audacity®音频编辑器的网页版。 (被 Apple 收购):我们的音乐帮助品牌与受众建立更深层次的连接。 :下一代音乐制作人。 :由 AI 驱动的软件引擎,可以生成音乐。它可以对手势、动作、代码或其他声音作出反应。 :全球最大的音乐教育平台。 :用于创作歌曲和音频录制的应用程序。 :提供无缝录音室体验的一体化在线协作平台。 :专业音频、语音、声音和音乐的扩展服务。 :视频编辑的音频解决方案。 :由 AI 驱动的音乐工作室。 :通过直观的软件/硬件生态系统为音乐演奏者提供世界级声音的民主化访问。 :AI 音频插件和社区,弥合 AI 研究与创意之间的差距。 :为音乐人、制作人和内容创作者提供 AI 驱动的混音服务。 :为创作者提供的在线音乐软件:音乐母带处理、数字音乐发行、分期付款插件、免费样本包和协作工具。
2025-02-07
我想借助AI帮我理解学术名词,需要如何操作?
要借助 AI 帮助您理解学术名词,您可以采取以下几种操作方式: 1. 使用在线智能语言模型工具,如 ChatGPT 等,向其清晰准确地描述您想要理解的学术名词,并提出您的疑问和需求。 2. 利用知识问答类的 APP 或网站,输入相关学术名词,获取相关的解释和说明。 3. 对于一些特定领域的学术名词,还可以查找专门针对该领域的 AI 辅助学习工具。 在与 AI 交流时,尽量详细地描述您的困惑和期望,以便获得更准确和有用的回答。
2024-12-26
学习ai的名词
以下是关于 AI 相关名词的解释: AGI:通用人工智能,指具备与人类同等智能水平和能力的人工智能。 AIGC:利用人工智能技术生成的内容。 Agent:智能体,能够自主感知、决策和行动的实体。 Prompt:提示词,用于引导 AI 生成特定的输出。 此外,还有以下相关名词和概念: 人工智能(AI):使计算机模拟人类智能的技术。 机器学习:电脑通过找规律进行学习,包括监督学习、无监督学习、强化学习。 监督学习:使用有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归。 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务包括聚类。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训小狗。 深度学习:一种参照人脑的方法,具有神经网络和神经元,因层数多被称为深度。神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI:能够生成文本、图片、音频、视频等内容形式。 LLM:大语言模型。对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类。 建议您通过与 AI 对话或李继刚老师的课程来深入理解这些名词。
2024-12-09
Aigc 常见名词解释
以下是一些 AIGC 常见名词的解释: AIGC:AI generated content,又称为生成式 AI,意为人工智能生成内容。例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等,都属于 AIGC 的应用。类似的名词缩写还有 UGC(普通用户生产),PGC(专业用户生产)等。能进行 AIGC 的产品项目和媒介众多,包括语言文字类(如 OpenAI 的 GPT,Google 的 Bard,百度的文心一言,还有一种国内大佬下场要做的的 LLM)、语音声音类(如 Google 的 WaveNet,微软的 Deep Nerual Network,百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits)、图片美术类(如早期的 GEN 等图片识别/生成技术,去年大热的扩散模型带火的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion)。 SD:是 Stable Diffusion 的简称。是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像。Stable Diffusion 是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model; LDM)。SD 的代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行。当前版本为 2.1 稳定版(2022.12.7)。源代码库:github.com/StabilityAI/stablediffusion 。 chatGPT:是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT4 的 LLM。 AI:人工智能(Artificial Intelligence)。 AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing),就是说人话。 LLM:大型语言模型(Large Language Model),数据规模很大,没钱搞不出来,大烧钱模型。 此外,还有一些相对较难的名词解释: NAI: 咒语:prompts,关键词 施法/吟唱/t2i:Text2Image 魔杖:t2i/i2i 参数 i2i:Image2Image,一般特指全部图片生成 inpaint:i2i 一种 maskredraw,可以局部重绘 ti/emb/炼丹:Train 中的文本反转,一般特指 Embedding 插件 hn/hyper/冶金:hypernetwork,超网络 炸炉:指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练 废丹:指完全没有训练成功 美学/ext:aesthetic_embeddings,emb 一种,特性是训练飞快,但在生产图片时实时计算。 db/梦展:DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高 ds:DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使 db 的 vram 需求降到 8g 以下。开发时未考虑 win,目前在 win 有兼容性问题故不可用 8bit/bsb:一般指 Bitsandbyte,一种 8 比特算法,能极大降低 vram 占用,使 16g 可用于训练 db。由于链接库问题,目前/预计未来在 win 不可用
2024-11-08
Ai名词解释
以下是关于 AI 的一些名词解释和相关信息: 名词解释: AI:人工智能(Artificial Intelligence) AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统 NLP:自然语言处理(Natural Language Processing),是让电脑把输入的语言变成有意思的符号和关系,然后根据目的再处理,包括认知、理解、生成等部分 LLM:大型语言模型(Large Language Model),数据规模很大,耗费资金多 机器学习:是人工智能的一个分支,是以机器学习为手段,解决人工智能中的部分问题,涉及多门学科 推理:指利用训练好的模型,使用新数据推理出各种结论,也叫预测或推断 训练:通过大数据训练出一个复杂的神经网络模型,通过大量标记过的数据来训练相应的系统,使其能够适应特定的功能 AI 的应用场景: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未详细说明具体应用)
2024-10-29
AI名词解释
以下是关于 AI 的一些名词解释、相关概念及应用场景: 名词解释: AI:人工智能(Artificial Intelligence) AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统 NLP:自然语言处理(Natural Language Processing),即让电脑处理和理解人类语言 LLM:大型语言模型(Large Language Model),数据规模大,耗费资金多 机器学习:是人工智能的一个分支,是实现人工智能的途径之一,涉及多门学科,近 30 多年已发展为多领域科际集成。 推理:指利用训练好的模型,使用新数据推理出各种结论,也叫预测或推断。 训练:通过大数据训练出复杂的神经网络模型,用大量标记过的数据训练系统以适应特定功能。 自然语言:自然语言(NLP)的认知和理解是让电脑把输入的语言变成有意义的符号和关系,然后根据目的再处理。自然语言生成系统则是把计算机数据转化为自然语言,是人工智能和语言学领域的分支学科,包括认知、理解、生成等部分。 应用场景: 医疗保健:医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未详细说明具体应用)
2024-10-29
AI 常见名词 有哪些
以下是一些 AI 常见名词: chatGPT:由致力于 AGI 的 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,目前使用的是 GPT4 的 LLM。 AI:人工智能(Artificial Intelligence)。 AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing),即让电脑处理和理解人类语言。 LLM:大型语言模型(Large Language Model),数据规模大,耗费资金多。 机器学习:人工智能的一个分支,是实现人工智能的途径之一,涉及多门学科,近 30 多年已发展为多领域科际集成。 自然语言:是人工智能和语言学领域的分支学科,包括认知、理解、生成等部分。 推理:利用训练好的模型,使用新数据推理出各种结论,也叫预测或推断。 训练:通过大数据训练出复杂的神经网络模型,用大量标记过的数据训练系统以适应特定功能。 以下是一些 AI 绘画常用的画面光线提示词: 情绪照明(mood lighting) 柔和的照明/柔光(Soft illuminaotion/ soft lights) 荧光灯(fluorescent lighting) 微光/晨光(rays of shimmering light/ morning light) 黄昏射线(Crepuscular Ray) 外太空观(outer space view) 电影灯光/戏剧灯光(cinematic lighting/ Dramatic lighting) 双性照明(bisexual lighting) 伦勃朗照明(Rembrandt Lighting) 分体照明(Split Lighting) 前照灯(front lighting) 背光照明(Back lighting) 干净的背景趋势(clean background trending) 边缘灯(rim lights) 全局照明(global illuminations) 霓虹灯冷光(neon cold lighting) 强光(hard lighting) 自上而下的光(god rays) 荧光(glowing light) 闪耀效果(sparkle) 模糊的(blurry) 镜头光晕(lens flare) 过曝(overexposure) 光线追踪(ray tracing)
2024-10-07
Coze + 飞书 + 飞书多维表格:通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出。由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,无需开发任何插件、APP,能实现跨平台的稍后读收集与智能阅读计划的推荐。其设计思路包括简化“收集”,实现跨平台收集和通过输入 URL 完成收集;自动化“整理入库”,自动整理关键信息并支持跨平台查看;智能“选择”推荐,根据收藏记录和用户兴趣生成阅读计划——这个方法具体如何操作?
以下是关于通过飞书机器人与 Coze 搭建的智能体进行对话,并利用飞书多维表格存储和管理稍后读数据,实现跨平台的稍后读收集与智能阅读计划推荐的具体操作方法: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口完成收集输入。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用飞书·稍后读助手: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。但目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 至此,专属 AI 稍后读智能体大功告成,您可以尽情享受相关服务。
2025-01-27
数字孪生的关键技术
数字孪生的关键技术包括以下方面: 利用定制软件实现工厂的数字孪生,如 Wistron 利用 Omniverse SDK 定制软件将 NVIDIA DGX 和 HGX 工厂实现数字孪生,大幅缩短调试周期。 运用生成式 AI 进行天气预测,如 CoreDev 可通过超高分辨率 AI 预测严重风暴。 构建端到端的机器人系统,让 AI 理解物理世界,需要 AI 计算机、监测分析计算机和执行任务的机器人三位一体。 提供模拟环境,如 Omniverse 提供模拟环境,教会机器人如何成为机器人。 实现软件定义的仓储、工厂,让机器人自主协同工作。 解决数字人构建中的工程关键点,如构建像人一样思考的 AI Agent、实现灵魂驱动躯壳、保证实时性、实现多元跨模态、处理拟人化场景等。
2025-01-02
国内大模型领域关键人物、关键院校
以下是国内大模型领域的关键人物、关键院校及相关信息: 8 月正式上线的国内大模型: 北京: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com/ 上海: 商汤(日日新大模型):https://www.sensetime.com/ MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 聊天状态下能生成 Markdown 格式的:智谱清言、商量 Sensechat、MiniMax 目前不能进行自然语言交流的:昇思、书生 受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值) 特色功能:昇思——生图,MiniMax——语音合成 阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。 中文大模型评测收集与调研: InfoQ + 极客帮:https://www.guotaixia.com/post/5124.html GAOKAOBench:地址:https://github.com/OpenLMLab/GAOKAOBench ,是一个以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架 清华安全大模型测评:地址:http://115.182.62.166:18000 ,清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的 40 余个二级安全类别 JioNLP 个人测评:评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM 评测数据集 ,考察 LLM 模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。题型介绍:选择题来源于中国大陆国内各种专业性考试,重点在于考察模型对客观知识的覆盖面,占比 32%;主观题来源于日常总结,主要考察用户对 LLM 常用功能的效果。 EduTEP:华东师范大学计算机科学与技术学院 EduNLP 团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP 对比多种大模型在教育领域中的综合性能,针对 K12 教育发布首个 CALMEDU 评测框架与 CALMEDU001 评测报告 娱乐资本论:我们的测试并非旨在提供学术上的严谨标准,我们的目标是:从实用的角度出发,分析这些大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现 中国大模型面临的真实问题: OpenAI 对字节跳动可能存在的违规使用其技术和知识产权的指控,字节跳动回应在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中,但强调该模型仅用于测试,从未计划上线或对外使用,且自 2023 年 4 月公司引入 GPT API 调用规范检查后已停止这种做法。 2024 年也有更多被指“套壳”国内大模型的事件,比如斯坦福大学 AI 团队主导的 Llama3V 开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。大模型的建设方式粗浅地分为三类。
2024-12-16
图片反推关键词
在图片反推关键词方面: 对于图生图功能,除文本提词框外还有图片输入口,可通过图片给 AI 创作灵感。随便一张照片拖入后,文本输入框旁有两个反推提示词的按钮,CLIP 能反推出完整含义的句子,DeepBooru 能反推出关键词组。例如一张小男孩的图片,CLIP 反推的提示词为“a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art”,DeepBooru 反推的提示词为“shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers”。但两种方式生成的提示词可能有瑕疵,需要手动补充信息,调整宽度和高度,以及注意提示词相关性和重绘幅度等参数。 第二十一期港风胶片活动中,有利用上一期活动图片反推工作流,使用唯美港风图片进行反推提示词,在大模型后接一个墨悠_胶片 lo 的方法 1,上一期活动链接为;还有利用抱脸的 joycaption 图片反推提示词,然后在哩布上跑 flux 文生图工作流的方法 2。 在【SD】最强控制插件 ControlNet(6)全局重绘 inpaint 中,有时需要去掉画面中的主体形象,填补复杂背景,可使用 inpaint 重绘功能。先将图放入 WD 1.4 标签器(Tagger)中裁剪保留背景部分,然后反推提示词,如“outdoors,no humans,tree,scenery,grass,sky,cloud,day,blue sky,mountain,road,house,path,building,nature,cloudy sky”,检查无误后发送到文生图中。开启 ControlNet,使用 inpaint 模型涂抹人物部分生成,可调整控制权重和模式。也可尝试图生图中的“局部重绘”功能,但可能效果不佳。
2024-12-14
我想看关于使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节的实操
以下是关于使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节的实操: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 根据视频脚本生成短视频的 AI 工具有多种,例如: 1. :ChatGPT 可以生成视频小说脚本,而剪映则可以根据这些脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。这种方法可以快速实现从文字到画面的转化,节省大量时间和精力。 2. :在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. :这是一个 AI 视频生成器,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户可以提供文本描述,Pictory 将帮助生成相应的视频内容。 4. :提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. :这是一个 AI 视频创作工具,它能够将文本转化为风格化的视频内容,适用于多种应用场景。 6. :专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 这些工具各有特点,适用于不同的应用场景和需求,能够帮助内容创作者、教育工作者、企业和个人快速生成吸引人的视频内容。 在游戏《神谕》中,ChatGPT 生成对话内容和剧情的能力表现如下: 对于故事线,ChatGPT 可以通过 System Prompt 介绍游戏的故事背景和小机器人的人设。结合游戏中发生的关键事件,通过文字传递给 ChatGPT,生成游戏中关键的故事情节介绍,最后以小机器人自述的形式呈现出来。具体实现过程中有几种选择: 1. 离线生成:将 ChatGPT 作为离线工具使用,生成一次性剧情文案,并保存到游戏中。缺点是文案一旦确定就固定下来了,略显单调。 2. 实时生成:每次都让 ChatGPT 自由发挥,在关键的节点,将历史上下文信息发送给 ChatGPT 来生成实时文案,优势是每次发挥都在既定主题基础上有所差异,有一定随机性。但是实际的缺点是,每次生成的延迟较大,会让游戏为了等待剧情文案,而产生明显的停顿感。 因此选择:每局对局开始前,会为游戏的关键节点一次性生成所有文案。这样,每次游戏都可以产生不同的文案,且游戏过程中就不会因为剧情体验到明显的停顿感。剧情的故事格式,由预定义的 json 来表达,每次 ChatGPT 只需要替换填充内容即可。 对于实时对话,与剧情类似,不过最大的难点是如何让小机器人区分出来,您是希望跟它聊天,还是在让它执行某些指令,甚至能否边聊天边执行指令。背后最大的挑战是 ChatGPT 要支持生成类似“多模态”的返回信息。这里的“多模态”是指在您对话的内容中,可以同时返回“对话”和“代码”,而且以某种限定的格式返回,从而方便程序解析出来。类似的 prompt 描述为:按照上述的 prompt,大概率 ChatGPT 能输出符合要求的内容格式。
2024-12-10
如何使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节?
使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节,可以按照以下步骤进行: 1. 利用 ChatGPT 等 AI 工具对小说内容进行分析。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-12-10
ai在hr上有哪些应用,分成国外和国内来介绍一下
目前在 HR 领域,AI 的应用在国内外都有一定的发展。 在国外,AI 被用于人才招聘,通过分析大量的简历和求职者数据,快速筛选出符合要求的候选人;还用于员工培训,根据员工的技能水平和学习需求,定制个性化的培训计划;在绩效管理方面,利用数据分析来评估员工的工作表现,提供更客观准确的评估结果。 在国内,AI 同样在人才招聘中发挥作用,例如利用智能聊天机器人与求职者进行初步沟通,提高招聘效率;在员工福利管理上,通过数据分析为员工提供更贴合需求的福利方案;在人力资源规划方面,借助 AI 预测人力资源需求,为企业战略提供支持。 需要注意的是,AI 在 HR 领域的应用仍在不断发展和完善中。
2025-02-06
介绍一下有没有适合一个5个人软件开发公使用的AI服务器,包含软硬件
目前市面上有多种适合 5 人软件开发公司使用的 AI 服务器,软硬件的选择需要综合考虑多方面因素。 在硬件方面,服务器的处理器性能至关重要,例如英特尔至强系列处理器具有较强的计算能力。内存容量应足够大,以满足数据处理和模型训练的需求,建议至少 32GB 或更高。存储方面,高速的固态硬盘(SSD)可以提供快速的数据读写速度。 在软件方面,常见的操作系统如 Linux(如 Ubuntu、CentOS 等)具有较好的稳定性和兼容性。深度学习框架如 TensorFlow、PyTorch 等是进行 AI 开发的重要工具。同时,还需要配备相关的数据库管理软件、开发工具和监控软件等。 然而,具体的选择还需根据公司的业务需求、预算以及技术团队的熟悉程度来决定。
2025-02-05
介绍两款好用免费的文字转音频的AI工具
以下为您推荐两款好用免费的文字转音频的 AI 工具: 1. 飞书妙记(https://www.feishu.cn/product/minutes):飞书的办公套件之一。 2. 通义听悟(https://tingwu.aliyun.com/home):阿里推出的 AI 会议转录工具。 另外,您还可以在 WaytoAGI 的工具网站上查看更多相关工具:https://waytoagi.com/sites/category/50 。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-01
我是一个AI小白,我使用AI的主要目的是使用这些工具,简化我工作中费时费力的事情,比如:表格的制作,筛选数据;图片的抠图,渲染,产品的口播介绍;日常工厂管理文件的编写及执行步骤;工作手册及岗位绩效的编写;作业指导书的编写
以下是为您整合的相关内容: 对于 AI 小白来说,使用 AI 工具简化工作中的费时费力之事是可行的。 在接触 AI 工具时,对于超出自己理解范围的事情,最简单有效的方法就是尝试。学习新事物,实践比听闻更重要。 比如在 AI 视频制作方面,人物设定与剧本是关键部分,包括主体、动作、场景等要素;分镜处理也较为重要,要考虑用几个镜头表述内容;生成环节如同抽卡,可多尝试,最后进行粗检和后期处理,如 AI 配音剪辑、加过渡滤镜等。小白制作 AI 视频要做好脚本即提示词,有耐心抽卡,并不断提升撰写提示词的能力。撰写提示词时要了解主体、动作、场景,避免使用专有名词和网络名词,给 AI 清晰描述。工具选用方面,没有绝对好的工具,只有适合的,如小白可使用剪映,主力机是 MacBook Pro 可使用 final cut。还可向 ChatGPT 询问获取灵感。 另外,在“AI 布道”活动中发现,AI 工具虽强大能做很多事,但也在其与普通人之间形成了一道墙。AI 是未来必然的方向,其科普还有很长的路要走,但尽可能简单地试用它,能让普通人更快受益。无论是什么身份、什么年龄段的人,都可以尝试使用 AI 工具。 如果您想要跟相关作者交朋友、一起在 AI 路上探寻,欢迎戳这里:
2025-01-30
介绍一些最新AI资讯的网站
以下是一些提供最新 AI 资讯的网站: 公众号“超时空视角”,地址:https://mp.weixin.qq.com/s/TBHiM_0w_bwUc20_KVQQ 小红书/抖音:EverAI B 站:Ever AI 酱(这里会有教程及 AI 工具界面操作) Recraft AI:https://www.recraft.ai/ ,更新了 60 种新的图像风格,是 AI 平面设计工具,用户可以使用其生成和编辑插画、海报、产品周边等,对所有用户每日都有免费的试用点数,并允许对生成的图像进行商业使用。 文小言 APP 中的“学习强国公文助手”,可以帮助用户进行文汇检索、AI 公文书写、AI 公文润色等。 Notion 近期进行了重构更新,增强了内置 AI 功能,旨在提供更自然的用户体验。新版本采用对话式交互,用户可通过聊天与 AI 进行工作安排,并能跨页面、跨应用调用素材。 WaytoAGI 网站(https://www.waytoagi.com/),提供和 AI 知识库对话、集合精选的 AI 网站、集合精选的提示词、知识库精选等功能。 文章中提到的 6 个精准的海外 AI 信息渠道,包括 TechURLs(科技媒体汇总)、Toolify.ai(AI 产品导航和排行榜)、SimilarWeb(数据分析工具)、A16Z(硅谷知名投资机构)等。
2025-01-28
详细介绍一下deepseek
DeepSeek 是一家专注于人工智能基础技术研究的科技公司,以下是关于它的详细介绍: 1. 公司介绍: 成立时间:2023 年 总部:中国杭州 定位:聚焦大模型研发与应用,提供高效、安全、可控的 AI 技术解决方案。 2. 使用技巧: 特点与优势: 推理型大模型:核心是推理型大模型,通过理解用户需求和场景提供答案,无需详细步骤指令。 更懂人话:能理解用户用“人话”表达的需求,无需特定提示词模板。 深度思考:回答问题时能进行深度思考,非简单罗列信息。 文风转换器:可模仿不同作家文风写作,适用于多种文体和场景。 正确方法: 扔掉提示词模板:直接描述真实场景和具体需求,不使用传统“专业提示词”和模板。 让 DeepSeek“说人话”:提问时加上“说人话”,使回答更通俗易懂。 激发深度思考:使用“深度思考三件套”提示词进行批判性、反面和复盘思考,恢复深度思考能力。 文风转换:指定模仿的作家和文体,生成特定风格文本。 使用场景与限制: 适用场景:适用于需要深度思考、理解复杂场景和需求的场景,如行业分析、谈判准备、创意写作等。 限制场景: 长文本写作:超过 4000 字的文章易逻辑断裂,建议使用其他工具如 Claude200k。 敏感内容:内置审核机制,某些敏感内容可能无法通过,可修改提问或更换其他 AI 工具。 个人风格写作:更适合解决问题和模仿,难以精确控制个人风格写作效果。 3. 补充信息: 价格亲民且实力超群,是智慧开源领航者,实时联网深度推理双冠王,用技术普惠重新定义 AI 边界。 便宜、开源且能联网,在 Appstore 排行第一,导致算力股大跌。 使用地址:https://chat.deepseek.com/(有手机客户端) 提示词使用方法较长,可查看
2025-01-27