Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI是什么

Answer

AI 是一种模仿人类思维、能够理解自然语言并输出自然语言的存在。对于不具备理工科背景的人来说,可以将其视为一个黑箱。

从历史和技术角度来看,AI 的概念可以追溯到计算机科学和人工智能之父图灵。他提出的“图灵测试”为判断机器是否具有智能提供了方法。如今,像 ChatGPT 这样的 AI 产品在与人交流方面已经有了令人震惊的表现,尽管对于其是否通过图灵测试在学术界仍有争议。

目前的 AI(主要是生成式 AI 技术,也被称为大模型)能够接受和理解各种不同的输入和数据,并生成包括文字、声音、图像、视频、3D 模型等多样的内容。简单来说,可以把 AI 当人看。

Content generated by AI large model, please carefully verify (powered by aily)

References

拘灵遣将 | 不会写 Prompt(提示词)的道士不是好律师——关于律师如何写好提示词用好 AI 这件事

AI是什么?作为一个不具备理工科背景的文科生,要搞清楚“AI”其实是一件很困难的事情(什么Agents、AIGC、LLM,什么符号主义、什么语义规则傻傻分不清楚),所以最好的处理方式是就把AI当成一个黑箱,我们只需要知道AI是某种模仿人类思维可以理解自然语言并输出自然语言的东西就可以。至于AI如何去理解,其实不重要。于是我们可以发现驱动AI工具和传统道教的驱神役鬼拘灵遣将有奇妙的相似之处,都是通过特定的文字、仪轨程式来引用已有资源,驱使某种可以一定方式/程度理解人类文字的异类达成自己预设的效果,且皆需要面对工具可能突破界限(发疯)的情况。当然,不熟悉道教的朋友可以把这东西理解成某种可以理解人类文字但不是人的魔法精灵/器灵之类的东西——总之,AI的生态位就是一种似人而非人的存在。AI技术再爆炸一万倍,AI的生态位也还是一种似人而非人的存在。由此,我们可以从人类各个文明的传说中,从那些古老哲人们的智慧里寻找到当下和AI、神、精灵、魔鬼这种似人非人存在相处的原则:1.当你想让祂实现愿望时,基于祂的“非人”一面,你需要尽可能的通过语言文字(足够清晰的指令)压缩祂的自由度——(1)你不仅要清晰的告诉祂需要干什么,还需要清晰的告诉祂边界在哪里。(2)你不仅要清晰的告诉祂目标是什么,还需要清晰的告诉祂实现路径方法是哪一条。(3)你不仅要清晰的告诉祂实现路径,最好还直接给到祂所需的正确的知识。

一个希望有点意思的AI分享(一)

咱们会通过一些具体的例子,让大家对AI是什么有个印象;然后会尝试介绍一些AI的技术原理,希望你能体会到AI技术的美妙和深刻;接着我们会解释如何理解”AI能做什么“这个问题;再者我们会介绍一些具体的工具案例和资料;最后我们会简单聊一些AI的未来发展以及影响。首先来看AI是什么这个问题。我们从它的父亲说起。有一部电影叫做《模仿游戏》,它讲述的就是计算机科学和人工智能之父,图灵的故事。他在二战期间构建的机器,或者说计算机的原型,破译了德军的密码。他预见了计算机的发展,并开始考虑一个很深刻的问题:“如何判断一台机器具有智能?”在他的1950年的论文中,他提出了一种被称为“图灵测试”的方法。测试中,一位人类提问者通过文字通道向两个回应者(一个是计算机,另一个是人类)连续提问。在相当长的时间内,如果提问者无法可靠地区分哪个回应者是计算机,哪个是人类,那么可以认为这台计算机具备了智能。这是一个非常经典和深刻的方法,要实现这一点其实很困难。下面是2024年春OpenAI公司发布新一代ChatGPT聊天机器人(GPT4o)产品时的发布会视频,你可以选择从9分钟开始直接看用户和ChatGPT交流的现场展示部分。如果你之前对AI没有那么关注,相信你会感到震惊。这个体验已经非常接近和正常人类的交流。事实上如果考虑到知识丰富和情绪稳定,它应该比大多数人类更适合交流;p那么,请你想象一下,如果你是提问者,你觉得ChatGPT可以跨越图灵测试吗?虽然学术界依然存在着很多争议,但是确实有很多人认为目前的AI产品已经可以通过图灵测试。事实上,这可能比绝大多数人认为的到来得早得多。也有人说,我们需要新的标准来判定AI真正拥有智慧,比如,它是否拥有自主意识?那自主意识又是什么以及如何测定呢?这是人类面临的新问题。

一个希望有点意思的AI分享(一)

通过上面的这些例子,我们可以了解,现在的AI(准确的说,目前介绍的主要是一类叫做生成式AI的技术,小名叫大模型)可以接受和理解各种不同的输入和数据,同时可以生成包括文字、声音、图像、视频、3D模型等等多种多样的内容。回到我们最开始的章节标题,AI是什么。简单来说,就是,把AI当人看。事实上,在后面章节的讲述中,你会更加深刻的认识和赞同这一点。[heading1]未完待续……

Others are asking
长文本文件用哪个AI处理
对于处理长文本文件,以下是一些相关的 AI 工具和方法: 1. Whisper API:默认情况下仅支持小于 25MB 的文件。若文件更长,需将其分成小于 25MB 的块或使用压缩后格式。可使用 PyDub 开源 Python 软件包来拆分声频文件,但 OpenAI 对其可用性或安全性不作保证。您还可以使用提示来提高 Whisper API 生成的转录质量,例如处理特定单词或缩略语的识别错误、保留分段文件的上下文、避免标点符号的省略等。 2. 通义千问的 Qwen2.51M 大模型:推出 7B、14B 两个尺寸,在处理长文本任务中稳定超越 GPT4omini,同时开源推理框架,在处理百万级别长文本输入时可实现近 7 倍的提速。在上下文长度为 100 万 Tokens 的大海捞针任务中表现较好。对于更复杂的长上下文理解任务,可参考相关测试集。其优势包括长文本处理能力强、推理速度提升、上下文长度扩展等。开源平台有 Huggingface(https://huggingface.co/spaces/Qwen/Qwen2.51MDemo)和 Modelscope(https://www.modelscope.cn/studios/Qwen/Qwen2.51MDemo)。
2025-03-18
我应该怎么学习AI
以下是关于如何学习 AI 的建议: 一、了解 AI 基本概念 1. 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 2. 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 1. 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 2. 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。同时,建议掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 1. 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 2. 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 1. 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 2. 通过与这些 AI 产品的对话,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 六、中学生学习 AI 的特别建议 1. 从编程语言入手学习,如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 2. 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等,探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识,包括基本概念、发展历程、主要技术如机器学习、深度学习等,以及在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目,如参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态,关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展,思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-03-18
如何利用WaytoAGI系统学习AI智能体
利用 WaytoAGI 系统学习 AI 智能体可以参考以下内容: 1. 先精美地解释六大策略,参加小七姐在社区带来的共学课程及直播分享和回放,像喂饭教程般帮助理解 prompt。每个板块下有共学快闪,社区老师会带着大家动手操作并讲解思路,还提到官方最佳 prompt 有 6 个实践办法,看熟任意一个即可。 2. 了解到智能体由大语言模型衍生而来,提示词很关键。学习智能体进阶案例拆解,推荐景淮老师的相关成果。同时知晓扣子、千帆百炼属于智能体范畴,扣子更偏 ToC 应用,所以有专门讲解扣子相关内容。 3. 学习 AI agent 可能较痛苦,建议先吃透 prompt 再看相关内容。官方文档内容很全面,包含市面上 cos 的教程等。社区小伙伴参加 cos 比赛常拿大奖,有共学活动,获奖小伙伴会分享经验。cos 平台可用于工作生产,有很多功能,感兴趣可体验其官网,能进行对话感受功能。 4. 理解工具方面,AI Agent 有效使用工具的前提是全面了解工具的应用场景和调用方法。利用 LLM 强大的 zeroshot learning 和 fewshot learning 能力,AI Agent 可以通过描述工具功能和参数的 zeroshot demonstartion 或提供特定工具使用场景和相应方法演示的少量提示来获取工具知识。 5. 使用工具方面,AI Agent 学习使用工具的方法主要包括从 demonstartion 中学习和从 reward 中学习(清华有一篇从训练数据中学习的文章)。这包括模仿人类专家的行为,以及了解其行为的后果,并根据从环境和人类获得的反馈做出调整。 6. 了解具身智能,在追求人工通用智能(AGI)的征途中,具身 Agent 正成为核心的研究范式,它强调将智能系统与物理世界的紧密结合。与传统的深度学习模型相比,LLMbased Agent 不再局限于处理纯文本信息或调用特定工具执行任务,而是能够主动地感知和理解其所在的物理环境,进而与其互动。
2025-03-18
星流ai人物一致性
以下是关于星流 AI 人物一致性的相关内容: 在实现角色一致性方面,有以下几种方法和示例: 1. 可以通过特定的 prompt 格式来实现,公式为:发型+年龄性别+衣物颜色+环境+其他(动作、镜头等)。例如: 特写一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,面部被烛光照亮,表情惊讶,环境昏暗明暗对比强烈。 特写一个棕色卷发,身穿棕褐色上衣的小男孩,侧对镜头,微微仰头走在一片暗绿色的森林中,面部被手中提着的油灯照亮,环境昏暗明暗对比强烈。 一个棕色卷发,身穿棕褐色上衣的小男孩侧对镜头,看着面前桌上的蜡烛,环境昏暗明暗对比强烈。 中景拍摄一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,在一个梦幻感的暖色调房间里,全身贯注地拼装面前的积木玩具。 2. Midjourney 推出了角色一致性功能,同步支持 MJ V6 和 Niji V6。跟之前的风格一致性sref 命名基本一致,为cref。cref 背后参数cw 的值可以从 0 设到 100,cw 100 会参考原图的脸部、头发和衣服,但相应的会非常不吃 Prompt;cw 0 时,就只会参考脸部,大概约等于一个换脸。 3. PixVerse 有“角色(Character)”新功能,能实现 AI 生成视频中的角色保持一致。用户只需单击“Character”功能,上传符合要求的图像,点击创建自定义角色,训练一个新角色,然后可使用自定义角色生成视频,可在 AI 生成视频中轻松切换场景,同时保持同一角色身份。该功能目前只支持真实人脸,暂不支持动物或其他风格照片。操作说明:在主页面点击选择“Character”,点击“Create Character”,在此界面通过点击或拖动的方式上传图片,命名您创建的 Character,最后点击“Create Cha”。提示:最好使用包含真实人脸的单人图片效果最佳,脸部大小需要超过 200×200px,面部无遮挡。Character 添加完毕后,等待 20 秒左右,在看到“Success”提示后,点击“Create”进。若未等到“Success”提示便进入创作界面,会找不到创建的 Character,此时需等待 10 30 秒,待 Character 创建完成即可。 相关网址: 1. 2. 3. Midjourney 网页版:https://alpha.midjourney.com/ 4. PixVerse:https://app.pixverse.ai/ (目前可以免费使用)
2025-03-18
我需要一个直接能查询boss直聘信息的ai搜索工具
Coze 是一个提供丰富插件的平台,其中部分插件可能对您查询 boss 直聘信息有所帮助。Coze 提供的插件涵盖众多领域,包括搜索引擎、文本分析、图像识别等。其国内版本(https://www.coze.cn/store/plugin )中的一些插件具有实用功能,例如猎聘插件,可以帮助用户根据工作经验、教育经历、地理位置、薪水、职位名称、工作性质等条件搜索猎聘上提供的招聘信息。但需要注意的是,Coze 中可能没有直接针对 boss 直聘信息的查询插件。
2025-03-18
在哪里可以了解更多有关stable diffusion ai 生图的使用方法?
以下是了解更多有关 stable diffusion ai 生图使用方法的途径: 1. 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion ,进入 ARTISAN 频道,任意选择一个频道。输入/dream 会提示没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,可免费试用三天,三天后开始收费。输入/dream 提示词,这部分和 MJ 类似。可选参数有五类,包括 prompt(提示词,正常文字输入,必填项)、negative_prompt(负面提示词,填写负面提示词,选填项)、seed(种子值,可以自己填,选填项)、aspect(长宽比,选填项)、model(模型选择,SD3,Core 两种可选,选填项)、Images(张数,14 张,选填项)。完成后选择其中一张。 2. 下次作图时,先选择模板,点击倒数第二个按钮,就能将标准提示词快速输入。描述逻辑通常包括人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。对于新手,可通过功能型辅助网站来写提示词,如:http://www.atoolbox.net/ ,它可以通过选项卡的方式快速填写关键词信息;https://ai.dawnmark.cn/ ,其每种参数都有缩略图可参考,方便更直观选择提示词。还可以去 C 站(https://civitai.com/)抄作业,每一张图都有详细参数,点击下面的复制数据按钮,然后直接粘贴到正向提示词栏里,点击生成按钮下的第一个按键,Stable Diffusion 就可以将所有参数自动匹配。但要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会不同。也可以只取其中较好的描述词使用,比如人物描写、背景描述、一些小元素或者画面质感之类的。 3. 将照片放入到后期处理中,使用 GFPGAN 算法将人脸变清晰,可参考文章—— 。将图片再发送到图生图当中,打开 stableSR 脚本,放大两倍。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以什么都不写,以免对原图产生干扰。
2025-03-18