Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

描述下人工智能简史

Answer

人工智能作为一个领域始于二十世纪中叶。最初,符号推理流行,带来了如专家系统等重要进展,但因从专家提取知识并以计算机可读形式表现的任务复杂且成本高,无法大规模拓展应用场景,导致 20 世纪 70 年代出现“人工智能寒冬”。

随着时间推移,计算资源更便宜,数据更多,神经网络方法在计算机视觉、语音理解等领域展现出卓越性能,过去十年中“人工智能”常被视为“神经网络”的同义词,多数成功案例基于神经网络。

在创建国际象棋计算机对弈程序方面,早期如 Eliza 基于简单语法规则,将输入句子重述为问题;现代助手如 Cortana、Siri 或谷歌助手是混合系统,用神经网络转换语音并识别意图,再执行操作。未来有望出现完整基于神经网络的独立处理对话模型,如最近的 GPT 和 Turing-NLG 系列神经网络已取得巨大成功。

早期国际象棋对弈程序以搜索为基础,发展出阿尔法-贝塔剪枝搜索算法,搜索策略在对局结束时效果好,开始时因搜索空间大需改进,随后采用基于案例的推理,在知识库中找相似案例决定棋步。能战胜人类棋手的现代对弈程序基于神经网络和强化学习,通过与自己对弈从错误中学习,学习速度比人类快。

Content generated by AI large model, please carefully verify (powered by aily)

References

人工智能简介和历史

人工智能作为一个领域始于二十世纪中叶。最初,符号推理非常流行,也带来了一系列重要进展,例如专家系统——能够在某些有限问题的领域充当专家的计算机程序。然而,人们很快发现这种方法无法实现应用场景的大规模拓展。从专家那里提取知识,用计算机可读的形式表现出来,并保持知识库的准确性,是一项非常复杂的任务,而且因为成本太高,在很多情况下并不适用。这使得20世纪70年代出现了“人工智能寒冬”([AI Winter](https://en.wikipedia.org/wiki/AI_winter))。随着时间的推移,计算资源变得越来越便宜,可用的数据也越来越多,神经网络方法开始在计算机视觉、语音理解等领域展现出可与人类相媲美的卓越性能。在过去十年中,“人工智能”一词大多被用作“神经网络”的同义词,因为我们听到的大多数人工智能的成功案例都是基于神经网络的方法。我们可以观察一下这些方法是如何变化的,例如,在创建国际象棋计算机对弈程序时:

人工智能简介和历史

早期的此类程序,如[Eliza](https://en.wikipedia.org/wiki/ELIZA),基于非常简单的语法规则,并将输入的句子重新表述为一个问题。Cortana、Siri或谷歌助手(Google Assistant)等现代助手都是混合系统,它们使用神经网络将语音转换成文本,并识别我们的意图,然后采用一些推理或明确的算法来执行所需的操作。未来,我们可以期待一个完整的基于神经网络的模型来独立处理对话。最近的GPT和Turing-NLG系列神经网络在这方面取得了巨大成功。

人工智能简介和历史

早期的国际象棋对弈程序是以搜索为基础的——程序尝试估计对手在给定棋步数量下可能走的棋步,并根据在几步棋内所能达到的最佳位置选择最佳棋步。这带来了[阿尔法-贝塔剪枝](https://en.wikipedia.org/wiki/Alpha%E2%80%93beta_pruning)搜索算法的发展。搜索策略在对局即将结束时效果很好,因为此时搜索空间对应的棋步可能性局限在非常小的范围内。然而在对局刚刚开始时,搜索空间非常巨大,需要考虑通过学习人类棋手之间的现有对局来改进算法。随后的实验采用了[基于案例的推理](https://en.wikipedia.org/wiki/Case-based_reasoning),即程序在知识库中寻找与当前棋局位置非常相似的案例,以此来决定自己的棋步。能够战胜人类棋手的现代对弈程序都基于神经网络和强化学习,程序通过长时间与自己的对弈,从自己的错误中学习,以此来学会下棋,这与人类学习下棋的过程非常相似。不过,计算机程序可以用更少的时间下更多的棋,因此学习速度更快。✅对人工智能玩过的其他游戏做一个小调研。同样,我们可以看到创建“会说话的程序”(可能通过图灵测试)的方法是如何变化的:

Others are asking
各个国家对生成式人工智能所持态度
以下是各个国家对生成式人工智能所持的态度: 欧洲:《欧盟人工智能法案》获得批准并正式生效,成为世界上第一个全面采用人工智能监管框架的地区。执行将分阶段进行,对“不可接受的风险”的禁令将于 2025 年 2 月生效。 美国:政府官员对生成式人工智能技术表现出兴趣,在评估其带来的机会的同时,也警示潜在风险。政府机构开始就相关问题征求公众意见,预计未来几个月内将有更多行动。例如,白宫宣布将采取更多措施加强美国的人工智能研究、开发和部署。此外,美国对中国实施了更严格的出口管制和投资限制。 中国:是第一个开始制定生成式人工智能监管框架的国家,从 2022 年开始陆续出台全面指南,如今审查机构正在介入。持续生产 SOTA 模型,由国家互联网信息办公室监督。政府希望模型避免给政治问题提供“错误”答案,发布模型前须提交测试以校准拒绝率。禁止访问 Hugging Face 等国外网站,但官方批准的“主流价值观语料库”可作为训练数据源。 在移动端应用领域,尽管硅谷被视为 AI 核心地带,但世界各地都在积极构建相关产品。在生成式 AI 网页端和移动端产品的开发方面,不同地区的分布有所不同。例如,超过 30%的生成式 AI 网页端产品起源于美国湾区,而在移动应用开发者中,仅有 12%的团队设立于此。同样,超过一半的顶级生成式 AI 网页端产品在美国开发,而不到 1/3 的移动端应用源自美国本土。在全球范围内,包括亚洲(如中国、印度、韩国等)、大洋洲(如澳大利亚)、欧洲(如英国、法国、德国等)、中东(如以色列、土耳其等)的许多国家和地区都在参与生成式 AI 的发展。
2024-12-26
各个国家对人工智能的接受态度
不同国家对人工智能的接受态度存在差异: 美国:稳居对人工智能兴趣的榜首,在 12 个月里,其人工智能行业访问量达 55 亿次,占总流量的 22.62%。美国拥有超过 1.8 万亿美元的全球领先科技市场。 印度:紧随美国之后,访问量达 21 亿人次,占总流量的 8.52%。印度是全球最大的 IT 和 BPO 服务出口国之一。 印度尼西亚、菲律宾和巴西:兴趣水平相似,去年产生了 1.3 至 14 亿人次的访问量。巴西在南美洲处于领先地位,其产生的流量几乎是排在第二位的英国、日本和德国的两倍。 中国:尽管拥有 14 亿人口,但未跻身前 20 名。 从全球视角看教育与 AI 的融合程度: 北欧国家如芬兰,全社会重视教育和技术创新,政府重点投资教育技术研发和应用,实现个性化教学,培养学生批判性思维和解决复杂问题的能力。 许多发展中国家,尤其是撒哈拉以南的非洲国家,在教育资源基础配置上严重不足,基础设施薄弱,电力和网络连接不可靠,难以实现 AI 技术的高级应用。 在 AI 地缘政治方面: 最先进的 AGI 世界模型不开源,开源模型会落后闭源一个代际,但服务更广泛的专业应用。 美国对中国的硬件 科技限制进一步升级。 AGI 对全行业科技发展起推动作用,有更好 AGI 的国家会有更快的全面技术进步。 对于 AI 的立法、监管、伦理讨论大范围落后于技术发展,全世界主要国家都急于拥有自己的 AI,目前只有欧洲有相关讨论,但也仅在纸面上,我国相关法规讨论出发点在于“对于舆论的影响”,未触及 AGI 本身的伦理问题。
2024-12-26
人工智能各个国家的态度
不同国家对人工智能的态度和相关情况如下: 欧洲:《欧盟人工智能法案》获得批准并正式生效,成为世界上第一个全面采用人工智能监管框架的地区。执行将分阶段进行,对“不可接受的风险”的禁令将于 2025 年 2 月生效。 美国:大型实验室努力应对欧洲监管。美国商务部对中国实施更严格的出口管制和投资限制,包括要求美国制造商停止向我国半导体制造商进行最先进设施的销售,阻止或限制对中国初创企业的投资。 中国:是第一个开始制定生成式人工智能监管框架的国家,审查机构已介入。持续生产 SOTA 模型,由国家互联网信息办公室监督,发布模型前须提交测试以校准拒绝率。禁止访问 Hugging Face 等国外网站,但官方批准的“主流价值观语料库”可作为训练数据源。 美国在人工智能行业的访问量方面,稳居第一。在研究的 12 个月里,访问量达到 55 亿次,占总流量的 22.62%。印度紧随其后,访问量达到 21 亿人次,占总流量的 8.52%。印度尼西亚、菲律宾和巴西的兴趣水平相似,产生了 1.3 至 14 亿人次的访问量。巴西在南美洲处于领先地位,其流量几乎是排在第二位的英国、日本和德国的两倍。有趣的是,尽管中国拥有 14 亿人口,但未跻身前 20 名。
2024-12-26
人工智能教育领域的应用
人工智能在教育领域的应用广泛且具有颠覆性,主要体现在以下几个方面: 1. 个性化学习平台:通过集成算法和大数据分析,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源。例如 Knewton 平台,通过对数百万学生行为模式分析,精准预测学习难点并提前给出解决方案,大幅提升学习效率。 2. 自动评估:利用自然语言处理技术(NLP)自动批改学生作文和开放性答案题。如 Pearson 的 Intelligent Essay Assessor,能够分析和理解写作内容,给出准确评分和反馈,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学工具:使课堂教学更丰富和互动,如 AI 教师能引导学生通过对话学习、解答疑问并提供即时反馈。Google 的 AI 教育工具 AutoML 用于创建定制学习内容,提高学习动机,加深知识掌握。 4. 虚拟现实(VR)和增强现实(AR):学生可通过 VR 头盔进入虚拟实验室,安全进行实验操作并得到 AI 系统反馈。例如 Labster 的虚拟实验室平台,提供高科技实验室场景,让学生尝试复杂实验流程,无需昂贵设备或专业环境。 同时,北京大学教育学院教授汪琼指出,教育领域的数字化转型不能只是将传统教育方式搬到线上,还需新解决方案,技术创新应用和数据整合挖掘是关键。我们正进入新时代,AI 成为教与学的伙伴,但在迎接新一代人工智能发展带来的挑战时,必须注意“信息茧房”的危害,平衡其潜力与局限,注意技术引入的全局影响。 然而,AI 技术对传统教育体系的冲击也带来诸多挑战,如教育体系内部惯性、教师技能更新、课程内容适时调整、评估和认证机制改革等。
2024-12-26
案例:借助人工智能技术的诈骗 一、案例材料 1.背景资料 (1)近期全国范围内出现了一种新型电信诈骗——AI换脸诈骗,该诈骗利用AI人工智能,通过“换脸”和“拟声”技术模仿受害人的朋友或亲戚的声音和外貌,以此骗取受害者的信任,进行网络诈骗,近日包头警方就根据一起典型案例,向大家发出了防范AI换脸诈骗的警示。 财联社5月22日讯,据平安包头微信公众号消息,包头警方发布了一起利用人工智能(AI)实施电信诈骗的典型案例,一家福州市科技公司的法人代表郭先生竟在短短10分钟内被骗走了430万元人民币。
以下是关于 AI 的相关内容: 律师如何写好提示词用好 AI: 对于不具备理工科背景的文科生,可将 AI 视为黑箱,只需知道其能模仿人类思维理解和输出自然语言。AI 就像似人而非人的存在,与传统道教的驱神役鬼拘灵遣将有相似之处。提示词应是相对完善的“谈话方案”,成果在与 AI 的对话中产生,要接受其存在的“不稳定性”,并在对话中限缩自己思维的模糊地带。 AI 的应用场景: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未具体阐述)
2024-12-25
人工智能主播的发展现状
目前,人工智能主播的发展呈现出以下现状: 1. 聊天机器人作为人工智能伴侣已存在数十年,如今在一对一对话中有了跃进式改进,并融入到人们的社交生活中。 2. 像 CarynAI 这样由网络红人创建的语音聊天机器人,用户需付费与其交流,且能带来可观收益。 3. 拥有人工智能伴侣虽看似小众,但已成为生成式人工智能的主要应用案例,成千上万甚至数百万人已建立并培养了与聊天机器人的关系,且这一趋势有望使 AI 伴侣变得普遍。 4. 许多受欢迎的应用场景与浪漫相关,精明的生成模型消费者通过一些平台打造虚拟伴侣,并寻找规避审查的工具,甚至存在拥有数万用户的地下伴侣托管服务。 5. 除了与浪漫相关的应用,还出现了更广泛的应用领域,如 Snapchat 中的聊天机器人,人们会就宠物、流行文化新闻和足球等热门话题进行交流。
2024-12-25
神经网络和深度学习简史
神经网络和深度学习有着丰富的发展历史: 1. 1958 年感知机神经网络诞生。 2. 70 年代经历了人工智能寒冬。 3. 1986 年 BP 算法让神经网络再度流行。 4. 尽管取得了一些成功,但在人工智能寒冬期间,用于神经网络研究的资金很少,人工智能一词近乎成为伪科学的代名词。 5. 1997 年,Hochreiter 和 Schmidhuber 为递归神经网络开发了长短期记忆(LSTM),但在当时被忽视。 6. 随着计算机变得更快和图形处理单元(GPU)的引入,神经网络逐渐与支持向量机相竞争。 7. 训练大型、深层网络存在梯度消失问题,解决方法包括逐层预训练,如 Schmidhuber 于 1992 年为递归神经网络开发的预训练方法,以及 Hinton 和 Salakhutdinov 于 2006 年为前馈网络开发的预训练方法。1997 年提出的长短期记忆(LSTM)也是解决递归神经网络中梯度消失问题的方案之一。
2024-10-23
请描述具身智能的技术原理
具身智能是人工智能领域的一个子领域,其原理包括以下几个方面: 1. 强调智能体通过与物理世界或虚拟环境的直接交互来发展和展现智能。智能体的“身体”或“形态”很重要,它可以是物理形态如机器人的机械结构,也可以是虚拟形态如模拟环境中的虚拟角色。这些身体为智能体提供了与环境互动的手段,并影响其学习和发展。 2. 涉及多个学科,如机器人学、认知科学、神经科学和计算机视觉等。在机器人学中关注设计能自主行动和适应环境的机器人;在认知科学和神经科学中探索大脑处理与身体相关信息的机制及应用于人造智能系统;在计算机视觉中致力于开发使智能体能够理解和解释视觉信息的算法。 3. 以“具身+智能”的范式,将机器学习算法适配至物理实体,与物理世界交互。例如将大模型嵌入到物理实体上,通过机器配备的传感器与人类交流。 4. 具身智能的三要素包括“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界),三者高度耦合是高级智能的基础。 5. 行动分为“感知决策行动反馈”四个步骤,分别由四个模块完成并形成闭环。 6. 在追求人工通用智能(AGI)的过程中,具身 Agent 强调将智能系统与物理世界紧密结合,能够主动感知和理解所在环境并互动,产生具身行动。 具身智能在机器人领域,特别是服务机器人、工业自动化和辅助技术等方面有重要应用,也在虚拟现实、增强现实和游戏设计等领域广泛应用。但仍面临诸多挑战,如设计智能体身体以最大化智能表现、让智能体在复杂环境中有效学习、处理智能体与人类社会的伦理和安全问题等。
2024-12-25
Ai动态运镜描述词
以下是为您提供的关于 AI 动态运镜描述词的相关信息: 一、PixelDance V1.4 中的动态运镜示例 1. 男人转到侧面,抬头看向天花板上的美式吊灯,镜头聚焦于吊灯上。基础参数:镜头不固定,16:9,10s。 2. 女人微笑着低下头,镜头拉远,一个白人男人注视着这个女人。基础参数:镜头不固定,16:9,10s。 3. 一个男人在冲浪,镜头跟随他的运动,聚焦于他的脸部,他对着镜头比了大拇指。基础参数:镜头不固定,16:9,10s。 二、AI 视频运动镜头词测试相关情况 1. 共同测试者:阿强、淅吾、苏小蕊、crazy、五杠、爱育、森林小羊、wangeasy、朔、Lunana🦌_Lulala🌟、萝卜味儿砒霜、jacky、林窗鲸落、Yann 等。 2. 鸣谢:感谢所罗门老师提供的 luma 会员账号。 3. Dream Machine 是一种 AI 模型,可快速将文本和图像制作成高质量、逼真的视频。它是高度可扩展且高效的转换器模型,直接在视频上训练,能生成物理上准确、一致且多变的镜头,图生视频表现惊艳,属电影级。体验地址:https://lumalabs.ai/dreammachine/creations 。 4. 测词目的: 掌握影视级运镜。 评估 Luma 对不同类型运镜的精度和稳定性。 检测运镜崩坏情况。 5. 测试说明: 取消勾选 Enhance prompt。 欢迎补充表格中未列出的运动镜头词。 在想测试的词后面,填上名字,避免重复测试。 6. 测试总结: 纯运镜关键词效果不佳。 结合具体画面描述才有较好效果。 某些情况下,luma 会根据画面合理性自行调整运镜。
2024-12-23
图片可以转文字描述吗
图片可以转文字描述。以下是一些相关的实现方式和应用场景: 在“AI 拍立得”中,用户上传图片后,大模型会根据选择的场景生成与内容相关的文字描述或解说文本。其逻辑在于大模型对图片内容的理解和对生成文本的整理润色,可应用于生成美食点评、朋友圈发布文案、闲鱼上架示例模版等场景。 在 Midjourney 中,图片描述可以理解为以图生图。把找到的设计参考图上传到 Midjourney 中,得到专属链接,再使用“参考图链接+文本描述”的方式生成图像。例如,想要得到特定风格的 UI 界面图,可通过调整文字提示来实现。还可以通过加入特定参数来控制生成图像的比例。此外,Midjourney 不仅能生成整张设计图,还能输出多种风格的设计组件。 同时,关于图片模型和语言模型的大小差异,这是因为图像生成的核心质量实际上由文本控制,去掉图片只用文字表达要求的模型复杂度会小很多。人类对图像的容错率相对较高,大脑在处理视觉信息时可以进行一定程度的“脑补”,但对于语言,补偿有限,所以文字的准确性非常重要。
2024-12-18
帮我描述一段让AI生成未来绿色城市的描述词,图片要是OC渲染、超高品质,8K渲染
以下是一段让 AI 生成未来绿色城市的描述词,图片采用 OC 渲染、超高品质、8K 渲染: 未来绿色城市,一片生机勃勃的景象。城市中摩天大楼与葱郁的森林相互交融,建筑表面覆盖着绿色的植被,仿佛是从大地中自然生长而出。街道宽敞整洁,由可再生材料铺就,太阳能路灯照亮着道路。空中花园遍布城市的各个角落,五彩斑斓的花朵争奇斗艳。清澈的河流穿城而过,河面上倒映着蓝天白云和两岸的绿树。城市的交通系统高效便捷,无人驾驶的电动汽车在智能轨道上有序行驶。公园中,人们在清新的空气中休闲娱乐,孩子们在绿色的草地上欢笑奔跑。整个城市被一层柔和的光芒笼罩,展现出和谐、美丽与可持续发展的魅力。
2024-12-12
ETNA:怎么用,需要注册登陆吗,是免费的吗,我把文字描述写入它网页的对话框里,点击了coming soon 但是没有任何反应,怎么回事
ETNA 的使用方法可能因具体版本和功能而有所不同。通常来说,使用这类工具可能需要注册登录。关于其是否免费,也取决于具体的服务策略。您在网页对话框中输入文字描述并点击“coming soon”没有反应,可能有以下原因: 1. 该功能尚未正式开放或仍在准备中。 2. 网络连接存在问题,导致请求无法正常发送和接收。 3. 可能是网页本身存在技术故障或错误。 由于目前知识库中没有关于 ETNA 更详细的信息,建议您查看其官方说明或联系相关技术支持以获取准确的使用指导。
2024-12-10
请你作为提示词专家,告诉我,如何让提示词能够具有追问的能力,当用户的诉求描述不清时,可以让大模型继续追问
以下是关于让提示词具有追问能力的方法和相关知识: 让提示词具有追问能力可以通过以下方式实现: 1. 给予模型思考时间 美国康奈尔大学的研究报告显示,在提示词中让大模型“深呼吸(take a deep breath)”,让其“慢些思考”“不着急回复”,能在一定程度上提升回复质量。 “Take a deep breath and work on this problem stepbystep”“Let’s think step by step”也是有用的提示词口令。 实施技巧包括: 指导模型在匆忙下结论之前先找出自己的解决方案。例如,在解答有关中国五千年历史的复杂问题之前,请先分阶段梳理历史线索;在对“一带一路”倡议的经济影响进行分析之前,请先详细考察相关的经济数据和政策背景。 使用内部独白或一系列查询来隐藏模型的推理过程。例如,在分析古诗词的意境和语言特色之前,请先逐句解读其含义;在预测明年的股市走势之前,请先回顾并总结过去一年的重大财经事件。 询问模型是否在之前的尝试中遗漏了什么。例如,在列出适合春节期间旅游的目的地之后,请检查是否有遗漏的重要景点或考虑因素;在分析一部电影的主题和风格之后,请回顾是否有未涉及的重要镜头或细节。 2. 了解提示词的概念和作用 提示词是给大语言模型的输入文本,用于指定模型应执行的任务和生成的输出,发挥“提示”模型应做什么的作用。 设计高质量的提示词需根据目标任务和模型能力精心设计,良好的提示词能让模型正确理解人类需求并给出符合预期的结果。 3. 结合大语言模型和知识库 大语言模型像全知全能的人,擅长公共知识、学识技能、日常聊天,但在工作场景下需提示词指定角色和专注技能。 知识库则像工作手册,为模型提供特定的工作信息。 通过以上方法,允许模型有更多时间推理和处理信息,可提高回答的准确性和可靠性,使模型应用更高效和精准。同时,要了解大模型的特性,具备清晰表述需求和任务的能力,才能用好提示词这个工具。
2024-11-29