Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI 图像识别的发展历程

Answer

AI 图像识别的发展历程如下:

  • 早期处理印刷体图片的方法是将图片变成黑白、调整为固定尺寸,与数据库对比得出结论,但这种方法存在多种字体、拍摄角度等例外情况,且本质上是通过不断添加规则来解决问题,不可行。
  • 神经网络专门处理未知规则的情况,如手写体识别。其发展得益于生物学研究的支持,并在数学上提供了方向。
  • CNN(卷积神经网络)的结构基于大脑中两类细胞的级联模型,在计算上更高效、快速,在自然语言处理和图像识别等应用中表现出色。
  • ImageNet 数据集变得越来越有名,为年度 DL 竞赛提供了基准,在短短七年内使获胜算法对图像中物体分类的准确率从 72%提高到 98%,超过人类平均能力,引领了 DL 革命,并开创了新数据集的先例。
  • 2012 年以来,在 Deep Learning 理论和数据集的支持下,深度神经网络算法大爆发,如卷积神经网络(CNN)、递归神经网络(RNN)和长短期记忆网络(LSTM)等,每种都有不同特性。例如,递归神经网络是较高层神经元直接连接到较低层神经元;福岛邦彦创建的人工神经网络模型基于人脑中视觉的运作方式,架构基于初级视觉皮层中的简单细胞和复杂细胞,简单细胞检测局部特征,复杂细胞汇总信息。
Content generated by AI large model, please carefully verify (powered by aily)

References

学习笔记:【这就是 ChatGPT】了解原理让大语言模型 AI 成为你的打工人

如果识别一个印刷体图片,我可能会怎么做神经网络解决的是未知规则的处理。先把图片都变成黑白大小变成固定尺寸和数据库的东西对比得出结论然而,这种情况过于理想化。不仅存在多种字体,即使对于印刷体,不同的拍摄角度也引入了多种例外情况。虽然存在图形算法进行矫正,但整体方法仍然是基于不断添加规则。这种方法本质上是试图通过不断增加和完善规则来解决问题,这显然是不可行的。虽然这种方法可以解决象棋的问题,但对围棋来说就非常困难了。围棋的每个节点有三种可能状态:白、黑或空,加上不同节点间状态的组合,现有的资源无法应对。神经网络专门处理未知规则的情况。将图片转换为黑白,调整图片至固定尺寸,与数据库中的内容进行对比,最终得出结论。神经网络的发展得益于生物学研究的支持,并且在数学上提供了一种方向,使其能够处理未知的情况,如手写体识别。关于这部分内容,非常建议看《这就是ChatGPT》这本书,它的作者是被称为”在世的最聪明的人”,研究神经网络几十年,创作了Mathematica、Wolfram等备受推崇的软件,这本书最特别之处还在于,导读序是美团技术学院院长刘江老师回顾了整个AI技术发展的历史,对于了解AI,大语言模型计算路线的发展,起到提纲挈领的作用,非常值得一读。本文写作过程中得到了[byzer-llm](https://github.com/allwefantasy/byzer-llm)作者祝威廉的大力支持,在此感谢。byzer-llm选择了一个非常特别的技术路线,在大模型时代显得尤为重要。

机器之心的进化 / 理解 AI 驱动的软件 2.0 智能革命

CNN的结构是基于这两类细胞的级联模型,主要用于模式识别任务。它在计算上比大多数其他架构更有效、更快速,在许多应用中,包括自然语言处理和图像识别,已经被用来击败大多数其他算法。我们每次对大脑的工作机制的认知多一点,神经网络的算法和模型也会前进一步!

机器之心的进化 / 理解 AI 驱动的软件 2.0 智能革命

该数据集对研究人员非常有用,正因为如此,它变得越来越有名,为最重要的年度DL竞赛提供了基准。仅仅七年时间,ImageNet让获胜算法对图像中的物体进行分类的准确率从72%提高到了98%,超过了人类的平均能力。ImageNet成为DL革命的首选数据集,更确切地说,是由Hinton领导的AlexNet卷积神经网络(CNN - Convolution Neural Networks)的数据集。ImageNet不仅引领了DL的革命,也为其他数据集开创了先例。自其创建以来,数十种新的数据集被引入,数据更丰富,分类更精确。神经网络大爆发在Deep Learning理论和数据集的加持下,2012年以来深度神经网络算法开始大爆发,卷积神经网络(CNN)、递归神经网络(RNN - Recurrent Neural Network)和长短期记忆网络(LSTM - Long Short-Term Memory)等等,每一种都有不同的特性。例如,递归神经网络是较高层的神经元直接连接到较低层的神经元。来自日本的计算机研究员福岛邦彦(Kunihiko Fukushima)根据人脑中视觉的运作方式,创建了一个人工神经网络模型。该架构是基于人脑中两种类型的神经元细胞,称为简单细胞和复杂细胞。它们存在于初级视觉皮层中,是大脑中处理视觉信息的部分。简单细胞负责检测局部特征,如边缘;复杂细胞汇集了简单细胞在一个区域内产生的结果。例如,一个简单细胞可能检测到一个椅子的边缘,复杂细胞汇总信息产生结果,通知下一个更高层次的简单细胞,这样逐级识别得到完整结果。配图05:深度神经网络如何识别物体(TensorFlow)

Others are asking
图像识别能力能用在哪些方面?
图像识别能力可以应用在以下方面: 1. 自动驾驶:帮助车辆识别道路、交通标志和其他物体。 2. 广告定向投放:根据图像内容精准推送相关广告。 3. 网页搜索结果优化:通过识别图像内容提高搜索结果的准确性。 4. 数字助手:如 Google Now 或 Amazon Alexa 中用于识别图像相关的指令。 5. 安防监控:识别异常行为或人物。 6. 医疗诊断:辅助医生识别医学影像中的病症。 7. 工业检测:检测产品的质量和缺陷。 8. 物流:识别货物的类别和状态。
2024-12-05
以图像识别,为小白科普相关知识和交叉领域,并为研究生提供参考选题
图像识别是指利用计算机技术对图像进行处理和分析,以识别和理解图像中的内容。 对于小白来说,图像识别是让计算机像人一样“看懂”图像。它基于深度学习、机器学习等技术,通过对大量图像数据的学习和训练,能够自动提取图像的特征,并进行分类、识别等操作。 图像识别的应用非常广泛,比如在安防领域,用于人脸识别、车牌识别等;在医疗领域,辅助疾病诊断、医学影像分析;在交通领域,实现交通标志识别、车辆检测等。 图像识别与多个领域存在交叉,如计算机视觉,它不仅关注图像的识别,还包括图像的生成、处理等;与人工智能的其他分支如自然语言处理也有结合,实现图文转换等功能;在工业领域,与自动化生产相结合,进行产品质量检测等。 对于研究生来说,以下是一些参考选题: 1. 基于小样本学习的图像识别算法研究。 2. 融合多模态信息的图像识别模型优化。 3. 针对特定场景(如复杂环境、低光照等)的图像识别改进。 4. 图像识别在医疗诊断中的精准度提升策略。 5. 结合深度学习和传统方法的图像识别性能比较。 6. 基于新型神经网络架构的图像识别应用。
2024-10-19
用ai进行图像识别
AI 在图像识别方面的应用较为广泛,以下为您介绍一些相关内容: 在自动驾驶技术中,利用 AI 进行图像识别、传感器数据分析和决策制定,使自动驾驶汽车能够自主导航和驾驶,如特斯拉(Tesla)、Waymo 和 Cruise 等公司都在开发和测试自动驾驶汽车。 BERT 理念被应用于机器视觉领域,通过将图片分割处理,ViT 模型得以实现图像识别。 在深度学习中,图像识别实际是将图片转化为大量的图像单个像素点 RGB 值作为输入,再大量标注输出,形成神经网络。
2024-10-15
ai图像识别
以下是关于 AI 图像识别的相关内容: 判断一张图片是否为 AI 生成的方法: 通过画面风格、物品 bug 等细节进行辨别。但需注意,AI 在不断修正作图 bug,相关方法可能随时失效。 利用专门的网站,如 ILLUMINARTY(https://app.illuminarty.ai/),通过对大量图片数据的抓取和分析来判断,但可能存在误判,如将结构严谨的真实摄影作品识别为 AI 作图。 关于鉴别 AIGC 的讨论: 培养鉴别 AI 生成图片的技能需要训练大脑模型。 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。 另外,人工智能在汽车行业有广泛应用: 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定。 车辆安全系统:如自动紧急制动、车道保持辅助和盲点检测等。 个性化用户体验:根据驾驶员偏好和习惯调整车辆设置。 预测性维护:分析车辆实时数据预测潜在故障和维护需求。 生产自动化:用于汽车制造的自动化生产线。 销售和市场分析:分析市场趋势、消费者行为和销售数据。 电动化和能源管理:优化电动汽车电池管理和充电策略。 共享出行服务:优化路线规划、调度车辆和定价策略。 语音助手和车载娱乐:如 Amazon Alexa Auto 和 Google Assistant 等。 车辆远程监控和诊断:远程监控车辆状态并提供实时诊断和支持。
2024-10-15
我想写一个图像识别的代码
以下是关于图像识别的一些知识: 图像识别是计算机视觉领域中的一项重要任务,旨在从图像中识别和理解对象。 对于图像识别,我们可以通过以下方式来实现: 1. 获得每个数字或对象的一堆示例图像。 2. 为了判断输入的图像是否对应特定数字或对象,可以使用已有的样本进行逐像素比较。但人类在识别图像时,即使图像是手写的、有各种修改和扭曲,仍能准确识别,这表明人类的识别方式更高级。 图像融合是将两个或多个图像合成为一个新的图像,以获得比原始图像更全面和丰富的信息。它可以通过不同的技术实现,如像素级融合、特征级融合和决策级融合。图像融合在实际应用中有多种用途,包括提高图像质量、增加图像信息量、遥感图像处理以及计算机视觉和机器人技术中的应用。相关算法有:小波变换、基于金字塔变换的多分辨率融合、基于区域的图像融合、基于特征的图像融合等。 目标检测是在图像或视频中准确地识别和定位特定对象。随着多模态数据的广泛应用,将不同模态的信息进行融合可以进一步提高目标检测的性能和鲁棒性。其大致原理是在图像中找到特定的目标并对其进行定位和识别。 希望这些信息对您编写图像识别代码有所帮助。
2024-08-28
图像识别能力强的大模型
目前,图像识别领域中一些能力较强的大模型包括: 1. 百度智能云的AI图像识别技术:这项技术利用深度学习算法模拟人脑的神经元网络,对图像进行预处理、特征提取和分类器识别,广泛应用于安全、医疗、交通等领域 。 2. 北京大学张史梁长聘副教授课题组的多模态大模型Pink和LocLLM:这些模型通过为大语言模型添加图像细粒度指代分析能力,实现了对图像中特定物体和人体的细粒度感知,并在多模态任务、指代感知任务以及人体感知任务上展现出优秀的性能和泛化能力 。 3. 百度AI的通用物体和场景识别:这项服务能够识别超过10万类常见物体和场景,支持获取识别结果对应的百科信息,并且可以使用EasyDL定制训练平台进行定制识别 。 4. Vision Transformer :由Google Brain团队推出,将传统的CNN替换为Transformer架构,实现了在图像识别任务中的显著性能提升 。 5. Meta开源的DINOv2视觉大模型:这些模型使用自监督的方式进行训练,无需微调就能用于分类、分割、图像检索、深度估计等多种视觉任务 。 这些大模型展示了AI在图像识别领域的强大能力,能够处理各种复杂的视觉任务,并在不同的应用场景中发挥作用。
2024-07-22
哪些ai软件能制作r18图片
制作 R18 图片是不符合道德和法律规范的行为,因此没有合法的 AI 软件可以用于此目的。AI 技术应当被用于有益和合法的用途。
2025-01-27
制作图片用哪些ai好
目前比较成熟的用于制作图片的 AI 产品主要有: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,能将上传的照片转换为芭比风格,效果很好。 这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可根据文本或参考图像生成有创意且质量不错的相似图像输出,但也存在一些局限,如偶尔性能不稳定、生成内容不当等问题。 另外,藏师傅教您用 AI 三步制作任意公司的周边图片,不用到处找样机文件,流程如下: 1. 获取 Logo 图片的描述。 2. 根据 Logo 图片的描述和生成意图生成图片提示词。 3. 将图片和提示词输入 Comfyui 工作生成。 关于图片模型比语言模型小的问题,这是因为图像生成(无论是 text to image 还是 text to video)的核心质量实际上由文本控制,去掉图片只用文字表达,要求的模型复杂度会小很多。人类对图像的容错率相对较高,而对于语言,语法或逻辑错误很容易察觉,大脑在处理视觉信息时可以进行一定程度的“脑补”,但对语言的补偿有限,所以文字的准确性很重要。
2025-01-27
我想知道怎么写作里面,能没有疑似ai生成内容
为避免写作中出现疑似 AI 生成的内容,您需要注意以下几点: 1. AI 容易“产生幻觉”并生成看似合理但可能错误的事实,因此您需要对其生成的内容进行全面检查。 2. 人工智能不会真正解释自己,当您要求其解释写作原因时,给出的答案可能是编造的。 3. 虽然 AI 能辅助写作,但它也可能被不道德地用于操纵或作弊,您要对其输出负责。 4. 即便有了 AI 辅助,写作仍需要我们具备分辨能力,知道好文章和好内容应具备的要素。写作不仅是文字堆砌,更是思维表达和情感流露,是人类独特智慧的体现。 5. 应利用润色工具提升写作能力,而非让其替代写作。 此外,还有一些相关的原文示例,如“Build a giant robot navy.All the villains do an army...Is it better?Not really.But it is distinctly mine.”等,强调了不能将 AI 作为默认写作方式,要保持自己的写作热情和思考能力。
2025-01-26
ai办公
以下是一些与 AI 办公相关的应用和产品介绍: 1. AI 菜谱口味调整工具:如在下厨房中,利用自然语言处理和数据分析技术,根据用户反馈调整菜谱口味,市场规模达数亿美元。 2. AI 语言学习纠错平台:像英语流利说的纠错功能,运用自然语言处理和机器学习技术,帮助语言学习者纠正错误,市场规模达数十亿美元。 3. AI 电影剧情分析系统:例如豆瓣电影的剧情分析工具,通过数据分析和自然语言处理技术,为用户提供深度解读,市场规模达数亿美元。 4. AI 办公文件分类系统:腾讯文档的分类功能,借助数据分析和机器学习技术,自动分类办公文件,方便管理,市场规模达数亿美元。 5. 豆果美食 APP:作为 AI 菜谱生成平台,使用自然语言处理和数据分析技术,根据用户口味和现有食材生成个性化菜谱,市场规模达数亿美元。 6. 沪江开心词场:作为 AI 语言学习助手,运用自然语言处理和机器学习技术,辅助用户学习语言,提供个性化学习方案,市场规模达数十亿美元。 7. 爱奇艺智能推荐:其 AI 电影推荐系统,利用数据分析和机器学习技术,根据用户喜好推荐电影,市场规模达数亿美元。 8. WPS Office:其中的 AI 办公自动化工具,借助自然语言处理和机器学习技术,提高办公效率,实现自动化办公流程,市场规模达数十亿美元。 此外,还有影刀 RPA + AI Power 产品,这是一款面向企业的无代码开发 AI 应用的产品,全面聚合 AI 能力,轻松创建 AI 应用。通过企业知识库、集成全球大模型、预置丰富 AI 组件、可视化搭建工作流、多样集成调用等功能,打造 All in One 的企业 AI 工作站,帮助企业有效整合孤立的内部、外部系统,让 AI 无缝衔接企业业务,助力企业快速提效。典型场景包括网页内容分析、3D 头像生成、简历内容分析等,还有更多场景如智能客服、亚马逊 listing 生成、AI 生成数据报表、对话机器人搭建等。
2025-01-26
请教从0开始学习AI操作
以下是从 0 开始学习 AI 操作的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,如了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库中有很多实践后的作品和文章分享,欢迎实践后进行分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,还可以通过以下方式学习: 学习创建 AI 应用,包括操作界面等流程,了解创建应用的方式,界面与智能体组件的关联,重点掌握桌面网页版用户界面布局及左侧组件类别,了解应用的前端后端知识。 学习前端、后端相关概念,前端是页面可见部分及产品设计,负责采集用户输入和展示输出;后端是服务和逻辑,接收处理用户输入并生成内容输出到前端。了解左侧组件,包括布局、展示、输入、AI 组件等,以及模板和结构的作用。 学习容器相关知识,点击容器可看到名字,操作数据会用到。容器名字对应属性和事件属性,属性包含位置、尺寸等。尺寸设百分比会受容器关系及默认值影响。创建容器时,布局时先创建覆盖页面的底层容器,设固定宽高、边界为 0,有布局文档和教程供参考。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-26
零基础学AI该从哪里学起?
对于零基础学习 AI,您可以按照以下步骤进行: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 通过与这些 AI 产品的对话,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-26
推荐可以做以时间轴的个人成长历程长页的工具
目前在 AI 领域中,暂时没有专门用于制作以时间轴呈现个人成长历程长页的特定工具。但您可以考虑使用一些通用的设计和内容创作工具来实现这一需求,例如 Adobe InDesign、Canva 等,它们具有丰富的模板和设计功能,能够帮助您创建出具有时间轴效果的个人成长历程页面。
2025-01-15
AI是怎么获得学习能力,是谁发现了这种学习模式,发展历程是什么?
AI 的学习能力主要通过以下几种方式实现: 1. 机器学习:电脑通过找规律进行学习,包括监督学习、无监督学习和强化学习。 监督学习:使用有标签的训练数据,算法旨在学习输入和输出之间的映射关系,包括分类和回归。 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务如聚类。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训练小狗。 2. 深度学习:这是一种参照人脑的方法,具有神经网络和神经元,由于有很多层所以称为深度。神经网络可用于监督学习、无监督学习和强化学习。 3. 生成式 AI:能够生成文本、图片、音频、视频等内容形式。 AI 学习模式的发现并非由单一的个人完成,而是众多研究者共同努力的成果。 AI 的发展历程中有重要的技术里程碑,如 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制来处理序列数据,而不需要依赖于循环神经网络或卷积神经网络。Transformer 比 RNN 更适合处理文本的长距离依赖性。对于大语言模型,生成只是其中一个处理任务,比如谷歌的 BERT 模型,可用于语义理解(如上下文理解、情感分析、文本分类),但不擅长文本生成。生成式 AI 生成的内容称为 AIGC。LLM 即大语言模型,对于生成式 AI,生成图像的扩散模型不属于大语言模型。
2024-12-04
AI的发展历程
AI 的发展历程可以分为以下几个阶段: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):出现专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):机器学习算法如决策树、支持向量机、贝叶斯方法等得到发展。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等技术兴起。 当前 AI 的前沿技术点包括: 1. 大模型,如 GPT、PaLM 等。 2. 多模态 AI,如视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习,如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习,包括元学习、一次学习、提示学习等。 5. 可解释 AI,涉及模型可解释性、因果推理、符号推理等。 6. 机器人学,涵盖强化学习、运动规划、人机交互等。 7. 量子 AI,包含量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 AI 的起源最早可以追溯到上世纪的 1943 年,心理学家麦卡洛克和数学家皮特斯提出了机器的神经元模型,为后续的神经网络奠定了基础。1950 年,计算机先驱图灵最早提出了图灵测试,作为判别机器是否具备智能的标准。1956 年,在美国达特茅斯学院召开的会议上,人工智能一词被正式提出,并作为一门学科被确立下来。此后近 70 年,AI 的发展起起落落。
2024-12-04
ai诈骗发展历程
AI 诈骗是随着 AI 技术的发展而出现的一种新型诈骗手段,其发展历程与 AI 技术的整体发展密切相关。 AI 技术的发展历程大致如下: 1. 早期阶段(1950s 1960s):出现专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理得到发展。 3. 统计学习时期(1990s 2000s):机器学习算法如决策树、支持向量机、贝叶斯方法等兴起。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等成为主流。 随着 AI 技术的进步,AI 幻觉等问题也逐渐显现。AI 幻觉并非新问题,从早期的“人工智障”到如今“一本正经地胡说八道”,其复杂性和隐蔽性不断提升。这一演变反映了 AI 技术从依赖人工规则到依靠数据驱动,再到深度学习的发展过程,在变得更“聪明”的同时也面临更多挑战。 在神经网络方面,如 CNN 的结构基于大脑细胞的级联模型,在计算上更高效、快速,在自然语言处理和图像识别等应用中表现出色,随着对大脑工作机制认知的加深,神经网络算法和模型不断进步。 目前,AI 技术的发展为诈骗手段的更新提供了可能,例如利用深度伪造技术制造虚假的语音、视频进行诈骗等。
2024-11-21
AI大模型历程
AI 大模型的发展历程如下: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):出现专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):机器学习算法如决策树、支持向量机、贝叶斯方法等得到发展。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等技术兴起。 自 2022 年 11 月 30 日 ChatGPT 发布以来,国内大模型大致经历了三个阶段:准备期(ChatGPT 发布后国内产学研迅速形成大模型共识)、成长期(国内大模型数量和质量开始逐渐增长)、爆发期(各行各业开源闭源大模型层出不穷,形成百模大战的竞争态势)。 当前,随着大模型技术的愈发成熟和规模增大,为 AI Agent 提供了强大能力,有望构建具备自主思考、决策和执行能力的智能体,并广泛应用于多个行业和领域。当前 AI 的前沿技术点包括:大模型(如 GPT、PaLM 等)、多模态 AI(视觉 语言模型如 CLIP、Stable Diffusion 以及多模态融合)、自监督学习(自监督预训练、对比学习、掩码语言模型等)、小样本学习(元学习、一次学习、提示学习等)、可解释 AI(模型可解释性、因果推理、符号推理等)、机器人学(强化学习、运动规划、人机交互等)、量子 AI(量子机器学习、量子神经网络等)、AI 芯片和硬件加速。
2024-11-05
AI的发展历程
AI 的发展历程如下: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):主要有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现了机器学习算法,如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前 AI 前沿技术点包括: 1. 大模型,如 GPT、PaLM 等。 2. 多模态 AI,如视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习,如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习,如元学习、一次学习、提示学习等。 5. 可解释 AI,包括模型可解释性、因果推理、符号推理等。 6. 机器人学,涵盖强化学习、运动规划、人机交互等。 7. 量子 AI,如量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 AI 的起源最早可追溯到 1943 年,心理学家麦卡洛克和数学家皮特斯提出了机器的神经元模型,为后续的神经网络奠定了基础。1950 年,图灵最早提出了图灵测试,作为判别机器是否具备智能的标准。1956 年,在美国达特茅斯学院召开的会议上,人工智能一词被正式提出,并作为一门学科被确立下来。此后近 70 年,AI 的发展起起落落。 最初,符号推理流行,带来了专家系统等重要进展,但因方法的局限性,20 世纪 70 年代出现了“人工智能寒冬”。随着计算资源变便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现出卓越性能,过去十年中,“人工智能”一词常被用作“神经网络”的同义词。
2024-10-29
openai发展史
OpenAI 的发展历程如下: 2015 年成立,一直将 AGI 作为战略目标之一。 2022 年 11 月 30 日,发布基于 GPT 3.5 的 ChatGPT,引发全球 AI 浪潮。 在其内部会议上分享了关于通用人工智能(AGI)的五个发展等级,分别为: 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者(Reasoners):具备人类推理水平,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品执行任务后仍需人类参与。 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可加速科学研究和新药发现。 组织(Organizations):最高级别,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 AI 的起源最早可追溯到上世纪: 1943 年,心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续的神经网络奠定基础。 1950 年,图灵最早提出图灵测试,作为判别机器是否具备智能的标准。 1956 年,在美国达特茅斯学院,马文·明斯基和约翰·麦凯西等人共同发起召开著名的达特茅斯会议,人工智能(Artificial Intelligence)一词被正式提出,并作为一门学科确立下来。此后接近 70 年,AI 的发展起起落落。 Sam Altman 于 2025 年 1 月 6 日发表反思,回首创业历程,包括经历解雇等事件,也提到 2025 年首批 AI Agent 将融入劳动力市场,ChatGPT 两周岁时已迈入能进行复杂推理的全新模型时代,强调随着 AGI 临近,要回顾公司发展历程,继续探索。
2025-01-26
1.Gpt在教育邻域的快速发展
GPT 在教育领域的快速发展表现为以下方面: 训练方式:包括预训练、有监督微调、奖励建模、强化学习等阶段,每个阶段都有相应的数据集、算法和模型。 在教育中的影响:以 ChatGPT 为代表的生成式人工智能技术的出现,为教育带来冲击。许多教育工作者认识到大模型技术的进步对教育的意义。但目前市场上虽看好 AI 对各行业的赋能,却尚未诞生出相关的 Super APP,存在对 AI 发展的不同看法和预期。
2025-01-22
ai快速发展在教育领域的应用
AI 在教育领域的应用十分广泛,主要包括以下几个方面: 1. 个性化学习平台:通过集成算法和大数据分析,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源。例如 Knewton 平台,通过对数百万学生行为模式分析,精准预测学习难点并提前给出解决方案,大幅提升学习效率。 2. 自动评估:利用自然语言处理技术(NLP)自动批改学生作文和开放性答案题。如 Pearson 的 Intelligent Essay Assessor,能够分析和理解写作内容,给出准确评分和反馈,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学工具:使课堂教学更丰富和互动,如 AI 教师引导学生通过对话学习、解答疑问并提供即时反馈。Google 的 AI 教育工具 AutoML 用于创建定制学习内容,提高学习动机,加深知识掌握。 4. 虚拟现实(VR)和增强现实(AR):学生可通过 VR 头盔进入虚拟实验室,安全进行实验操作并得到 AI 系统反馈。例如 Labster 的虚拟实验室平台,提供高科技实验室场景,让学生尝试复杂实验流程,无需昂贵设备或专业环境。 然而,AI 技术在教育领域的广泛应用也对传统教育体系带来冲击,教育体系内部的惯性、教师技能更新、课程内容调整、评估和认证机制改革等问题成为 AI 教育创新面临的重要挑战。
2025-01-22
大模型的发展路径是什么样的
大模型的发展大致可以分为三个阶段: 1. 准备期:自 2022 年 11 月 30 日 ChatGPT 发布后,国内产学研迅速形成大模型共识。 2. 成长期:国内大模型数量和质量开始逐渐增长。 3. 爆发期:各行各业开源闭源大模型层出不穷,形成百模大战的竞争态势。 在发展过程中,大模型主要有以下几类: 1. 原创大模型:这类模型稀少而珍贵,需要强大的技术积累、持续的高投入,风险较大,但一旦成功竞争力强。 2. 套壳开源大模型:利用现有资源快速迭代和改进,需要在借鉴中实现突破和创新。 3. 拼装大模型:将过去的小模型拼接在一起,试图通过整合已有资源来实现质的飞跃,但整体性能并非各部分简单相加。 此外,360 作为国内唯一又懂大模型又懂安全的双料厂商,提出以“模法”打败魔法的理念,打造专业的安全大模型,只依赖大模型本身的能力,在恶意流量分析和恶意邮件检测效果方面超越 GPT 4,并与 360 积累的工具结合,提升攻击事件的检测和发现能力。同时,企业在运用大模型时,要将好的知识和算法结合,从数据中提炼出真正的实战知识。
2025-01-20
我想系统了解有关agent的应用及发展情况
智能体(Agent)在现代计算机科学和人工智能领域是一个基础且重要的概念,具有广泛的应用和不断发展的技术。 应用领域: 1. 自动驾驶:汽车中的智能体感知周围环境,做出驾驶决策。 2. 家居自动化:智能家居设备根据环境和用户行为自动调节。 3. 游戏 AI:游戏中的对手角色和智能行为系统。 4. 金融交易:金融市场中的智能交易算法根据市场数据做出交易决策。 5. 客服聊天机器人:通过自然语言处理与用户互动,提供自动化的客户支持。 6. 机器人:各类机器人中集成的智能控制系统。 设计与实现: 通常涉及以下几个步骤: 1. 定义目标:明确智能体需要实现的目标或任务。 2. 感知系统:设计传感器系统,采集环境数据。 3. 决策机制:定义智能体的决策算法,根据感知数据和目标做出决策。 4. 行动系统:设计执行器或输出设备,执行智能体的决策。 5. 学习与优化:如果是学习型智能体,设计学习算法,使智能体能够从经验中改进。 发展情况: Agent 算是从年前到现在比较火的一个概念,也被很多人认为是大模型的未来的一个主要发展方向。目前行业里主要用到的是一个叫 langchain 的框架,它把大模型(LLM)和 LLM 之间,以及 LLM 和工具之间,通过代码或 prompt 的形式进行了串接。为 LLM 增加了工具、记忆、行动、规划等能力。 随着 AI 的发展,大家对 AI 的诉求变得越来越具体,简单的 ChatBot 的弊端日渐凸显,基于 LLM 对于 Agent 的结构设计,Coze、Dify 等平台在应用探索上有了很大的进展。但这些平台都有着固有局限,对于专业 IT 人士不够自由,对于普通用户完成复杂业务场景又有限制。
2025-01-19
我不会AI我可以往AI上面发展吗
如果您不会 AI ,完全可以往这方面发展。以下是一些您需要了解和学习的基础内容: 1. AI 背景知识: 基础理论:明确人工智能、机器学习、深度学习的定义及相互关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 2. 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:掌握向量、矩阵等基本概念。 概率论:了解基础的概率论知识,如条件概率、贝叶斯定理。 3. 算法和模型: 监督学习:熟悉常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:了解聚类、降维等算法。 强化学习:知晓其基本概念。 4. 评估和调优: 性能评估:学会如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:掌握使用网格搜索等技术优化模型参数。 5. 神经网络基础: 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:熟悉常用的激活函数,如 ReLU、Sigmoid、Tanh。 另外,鉴于人工智能依赖的神经网络基础,专家 AI 可能通过元学习(或学会学习)比预期更快地获得知识,并推动人类一同进步。开发具有潜在空间层次结构的堆叠 AI 模型,能帮助 AI 模型理解模式和关系。创建专门从事特定领域的 AI 可能比创建全能 AI 更容易,我们更需要特定领域的专家 AI 。同时,要让 AI 从在线基础投入到原子的世界中,让人类专家配备可穿戴设备收集互动供 AI 学习,避免复制危险的偏见。
2025-01-18