Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

ai的研究是否可以分为神经网络与知识图谱两个大的分类?

Answer

AI 的研究可以分为多个不同的分类,并非仅仅局限于神经网络与知识图谱这两个大的分类。

在常见的分类中:

  • 非监督学习:最著名的是聚类,只需提供大量数据,让 AI 自行找出有趣信息。
  • 迁移学习:在任务 A 中学习的内容可用于帮助完成任务 B,在计算机视觉领域有较多应用。
  • 强化学习:根据输出好坏给予奖励或惩罚,利用“奖励信号”让 AI 自动学习最大化奖励,但需要大量数据。
  • 生成对抗网络:由生成器和判别器构成,两者不断训练和竞争,提高生成真实数据的能力,广泛应用于多种领域。

此外,从技术和应用的角度来看:

  • 知识图谱:在搜索等场景中展示关键信息,如人物相关信息、酒店信息等。
  • 在企业中建构人工智能方面,NLG 可作为全新场景讨论,生成内容分为根据任务要求生成标准结果和根据信息进行内容创作两类,分别偏向 B 端和 C 端。NLP 能做的事情较标准化,LLM 的出现对其有提升和冲击。知识图谱领域本身有多种技术路径,与 LLM 可能是互补关系。

对于希望精进的学习者,还需要了解 AI 的背景知识,包括基础理论、历史发展、数学基础(统计学、线性代数、概率论),掌握算法和模型(监督学习、无监督学习、强化学习),学会评估和调优(性能评估、模型调优),以及神经网络基础(网络结构、激活函数)等。

Content generated by AI large model, please carefully verify (powered by aily)

References

观点:LLM落地思考

1、NLG:这里我们可以先分析NLG,因为传统方案的NLG基本是落地难落地少,而LLM最大的特点就是生成内容非常的牛,因此NLG可以当做一个全新的场景进行讨论,这也是当前很多偏ToC的业务探索方向,探索生成内容可以怎样创建新的场景。生成内容又可以分为:根据任务要求生成标准结果、根据信息进行内容创作两类,其中前者偏向B端,对指令遵循、准确性、输出可控等有较高的要求;后者偏向C端,在内容的趣味性、探索性、建议性、想象性上有一定的需求。而且,现在AI可以24小时不间断生成内容,理论上来说内容的供给变得无限大了,内容供给无限大后是否会出现质变的场景呢?2、NLP:NLP能做的事情都比较标准化了,也有相当多的落地技术案例,比如客服、评论分析、信息抽取等等,而LLM的出现,很明显可以在这些场景上有更进一步的效果和效率的提升,甚至可以算是对原有的Bert方案的降维打击。也因此这个领域很多成熟企业现在都不太好过(很多原有的Bert方案的流程全部不需要了,在这个领域长期的经验积累被清空),后面会以智能客服为例分析。3、知识图谱KG:这个领域本身其实分为了多个技术路径,有NLP作为图谱前期构建的技术,有图数据库作为承载和查询的底座,也有图计算作为图谱应用推理的技术方案。并且知识图谱更像是符号派的分支,与LLM这个连接派的终极产物其实不那么搭。目前看来LLM在知识图谱的前期构建上(比如实体识别、三元组抽取)是可以有较好的效率提升的。但进一步想,知识图谱与LLM很可能是互补关系,毕竟LLM的参数难以理解,但知识图谱这种结构化的展示确实很好理解的,因此可以想象,今后的业务中使用知识图谱织成一张网来包裹住LLM,来让其输出的更加可控是很有可能的,并且图上的关联关系可以很好的为LLM做信息补足。

学习笔记:AI for everyone吴恩达

非监督学习:非监督学习最著名的就是聚类。非监督学习并不需要准确告诉AI系统需要输出什么。只是需要给出大量数据,然后让AI从中找出有趣的信息。迁移学习:任务A中学习的内容,可以用于帮助完成任务B。许多计算机视觉实际是使用了迁移学习。强化学习:当输出好时强化。输出差时惩罚。使用“奖励信号”来告诉AI什么时候做的好或差,AI会自动学习最大化奖励。做得好时,给一个正数权重,做得差时,给一个负数权重。缺点是需要大量的数据。生成对抗网络:生成对抗网络是一种深度学习模型,由两个神经网络构成:生成器和判别器。生成器负责生成虚拟数据,判别器则负责判断这些数据是真实数据还是虚拟数据。两个网络不断反复训练和竞争,从而不断提高生成器生成真实数据的能力,直到生成的数据与真实数据无法区分。GAN可以用于图像、声音、文本等各种类型的数据生成和合成,被广泛应用于计算机视觉、自然语言处理等领域。知识图谱:在搜索时,展示知识图谱。这些信息是从知识图谱中产生的,意味着列出这些人和与其相关的关键信息,如生日,年纪等。酒店知识图谱可能包含大量信息,让人们在查地图时,可以快速找到准确信息。

写给不会代码的你:20分钟上手 Python + AI

[heading3]如果希望继续精进...对于AI,可以尝试了解以下内容,作为基础AI背景知识基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。历史发展:简要回顾AI的发展历程和重要里程碑。数学基础统计学基础:熟悉均值、中位数、方差等统计概念。线性代数:了解向量、矩阵等线性代数基本概念。概率论:基础的概率论知识,如条件概率、贝叶斯定理。算法和模型监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。无监督学习:熟悉聚类、降维等算法。强化学习:简介强化学习的基本概念。评估和调优性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。模型调优:学习如何使用网格搜索等技术优化模型参数。神经网络基础网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。激活函数:了解常用的激活函数,如ReLU、Sigmoid、Tanh。

Others are asking
AI 硬件与软件市场趋势
以下是关于 AI 硬件与软件市场趋势的相关信息: 定见咨询发布的《人工智能行业 AI 硬件全景洞察报告:下一波 AI 创新机遇在物理空间》指出,AI 硬件将经历传统硬件+AI、AI 驱动型硬件到 AI 作为基础设施的三个阶段,深圳凭借产业集群优势成为全球 AI 硬件创新的热点地区。AI 推动软硬件协同创新,硬件产品的高价值区向软件偏移,软件端价值交付从订阅模式转向服务付费。报告还分析了 AI 硬件的分类、智能化简史、市场趋势、竞争格局、细分品类市场情况,以及典型团队的创新路径与策略。 机器之心的进化/理解 AI 驱动的软件 2.0 智能革命方面,在虚拟世界中做模拟,Meta 和 Nvidia 自然不能缺席。佐治亚理工学院的计算机科学家 Dhruv Batra 及 Meta AI 团队创造了名叫 AI 栖息地(AI Habitat)虚拟世界,目标是提高模拟速度。Nvidia 的 Omniverse 平台提供支持的 NVIDIA Isaac Sim 是一款可扩展的机器人模拟器与合成数据生成工具,能提供逼真的虚拟环境和物理引擎,用于开发、测试和管理智能代理。随着参与到这个领域的公司越来越多,数据和训练的需求也会越来越大,势必会有新的适合 EAI 的基础模型诞生。ARK Invest 在他们的 Big Ideas 2022 报告中提到,到 2030 年,硬件和软件的融合可以让人工智能训练的成本以每年 60%的速度下降,AI 硬件和软件公司的市值可以以大约 50%的年化速度扩大,从 2021 年的 2.5 万亿美元剧增到 2030 年的 87 万亿美元。 在 2024 年,人工智能几乎是所有软件公司和终端客户的首要任务。AI 软件公司将有效地有三种起源和结果:运行在现有软件之上的 AI 工具;运行在现有软件之上的 AI 工具,有机会取代现有的软件;成为劳动力的 AI 工具。我们正处于软件吞噬和增强劳动力的最初阶段。
2025-03-25
最近有什么新的AI
以下是近期的一些新的 AI 相关资讯: 3 月 12 日: 【AI 3D】BlenderMCP 能与 Claude AI 沟通,在 Blender 实现快速 3D 建模;MIDI 可实现单幅图像到 3D 场景生成;Move AI 更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】MMStoryAgent 是 AI 多模态故事生成系统。 【AI 视频】VACE 是阿里推出的一体化视频创作和编辑技术;VideoPainter 是腾讯开源的视频编辑技术;Wonder Dynamics 推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】OpenAI 为开发者推出一套 AI Agent 开发套件;R1Omni 是阿里情感识别模型,通过视频识别情感;Luma AI 发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能;Manus 宣布与阿里通义千问团队达成战略合作。 3 月 21 日: 【AI 绘画】网传神秘 Halfmoon 文本转图像模型为 Reve 对比 Midjourney 效果;Topaz Labs 推出 Gigapixel v8.3.0,将任何图像放大 16 倍;FLORA 引入 gemini 2.0 自然语言编辑图像能力。 【AI 视频】pika 超创内测“操控原视频中物体运动”能力;Krea 上线视频模型训练能力,可控制视频风格/动作/物体等。 【AI 3D】SpatialLM 是用于空间理解的大型语言模型。 【AI 模型及应用】OpenAI 发布 2 个语音模型(文本转语音/语音转文本)+1 个演示网站;Claude 支持搜索功能。 10 月 19 日: Perplexity AI 新功能:内部知识搜索,结合公共网页和内部知识库,适用于各类团队;Space 空间,支持团队协作、个性化 AI 以及文件上传与存储功能。 XGO Rider 机器人:桌面双轮足式 AI 机器人,具备自平衡功能,是 STEM 学习工具,支持编程执行任务,提升动手能力。 Mistral 新 AI 模型:Les Ministraux,专为边缘设备设计,优化隐私优先任务,具备 128k 上下文窗口,性能优于 Llama 和 Gemma 模型。
2025-03-24
如何用AI 驱动的产品营销创新,从内容创作到视觉呈现的全方位变革?
以下是关于如何用 AI 驱动产品营销创新,从内容创作到视觉呈现的全方位变革的一些方法和案例: 一、内容创作方面 1. 利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况,以获取关键信息,为营销内容创作提供方向。 2. 借助 AI 文案工具撰写有说服力的产品描述和营销文案,提高转化率。 二、视觉呈现方面 1. 通过 AI 生成图像或素材,再结合平面合成及修正,确保符合品牌形象,精准表达营销活动主题,如淘宝天猫大促视觉的案例。 2. 对于需要定制化真人模特实景素材的主题活动,利用 AI 将策划、搭建、拍摄、设计融为一个闭环流程,完成页面所有素材的生产和输出,例如七夕主题活动页面。 3. 在 UI 设计场景中,采用 AI 能力快速定制多种用户需要的视觉效果,如通过 SD 中 controlnet 的有效控制生成指定范围内的 ICON、界面皮肤等内容。 三、在阿里巴巴营销中的应用 1. 关键词优化:利用 AI 分析和推荐高流量、高转化的关键词,优化产品标题和描述,提高搜索排名和可见度。 2. 产品页面设计:借助 AI 设计工具根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 3. 图像识别和优化:使用 AI 图像识别技术选择或生成高质量的产品图片,展示产品特点。 4. 价格策略:依靠 AI 分析不同价格点对销量的影响,制定有竞争力的价格策略。 5. 客户反馈分析:通过 AI 分析客户评价和反馈,优化产品和服务。 6. 个性化推荐:利用 AI 根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。 7. 聊天机器人:使用 AI 驱动的聊天机器人提供 24/7 的客户服务,解答疑问,提高客户满意度。 8. 营销活动分析:借助 AI 分析不同营销活动的效果,了解哪些活动更能吸引顾客并产生销售。 9. 库存管理:依靠 AI 帮助预测需求,优化库存管理,减少积压和缺货情况。 10. 支付和交易优化:利用 AI 分析不同的支付方式对交易成功率的影响,优化支付流程。 11. 社交媒体营销:通过 AI 在社交媒体上找到目标客户群体,进行精准营销提高品牌知名度。 12. 直播和视频营销:使用 AI 分析观众行为,优化直播和视频内容,提高观众参与度和转化率。 四、大型视觉模型 Sora 的机遇 1. 对于学术界,OpenAI 推出 Sora 标志着战略转变,鼓励更广泛的 AI 社区深入探索文本到视频模型,利用扩散和变换器技术。以原生大小训练 Sora 的创新方法为学术界提供了灵感,强调使用未修改数据集的好处,开辟了创建更高级生成模型的新路径。 2. 对于行业,Sora 目前的能力预示着视频模拟技术进步的道路,突出了在物理和数字领域内增强现实感的潜力。公司可以利用 Sora 生产适应市场变化的广告视频,并创建定制化的营销内容,降低成本,增强吸引力和效果,彻底改变品牌与受众互动的方式。
2025-03-24
AI技术趋势
AI 技术的发展历程和前沿技术点如下: 发展历程: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现机器学习算法如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前前沿技术点: 1. 大模型(Large Language Models):如 GPT、PaLM 等。 2. 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:例如元学习、一次学习、提示学习等。 5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。 6. 机器人学:涵盖强化学习、运动规划、人机交互等。 7. 量子 AI:包括量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 此外,《2024 年度 AI 十大趋势报告》指出: 1. 大模型创新:架构优化加速涌现,融合迭代大势所趋。 2. Scaling Law 泛化:推理能力成皇冠明珠,倒逼计算和数据变革。 3. AGI 探索:视频生成点燃世界模型,空间智能统⼀虚拟和现实。 4. AI 应用格局:第⼀轮洗牌结束,聚焦 20 赛道 5 大场景。 5. AI 应用竞争:多领域竞速运营大于技术,AI 助手兵家必争。 6. AI 应用增长:AI+X 赋能类产品大干快上,原生 AI 爆款难求。 7. AI 产品趋势:多模态上马,Agent 席卷⼀切,高度个性化呼之欲出。 8. AI 智变千行百业:左手变革生产力,右手重塑行业生态。 9. AI 行业渗透率:数据基础决定初速度,用户需求成为加速度。 10. AI 创投:投融资马太效应明显,国家队出手频率提升。 学习路径方面: 偏向技术研究方向: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 偏向应用方向: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-24
可以推荐这几个AI的平替吗
以下是为您推荐的一些 AI 相关的替代产品和资讯来源: AI 学习工具:Kimi 智能助手是 ChatGPT 的国产平替,实际上手体验好,适合新手入门学习和体验 AI。不用科学上网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,对长文理解做得较好。PC 端可通过下载。 资讯来源: 公众号:超时空视角、AI 替代人类。 社交媒体:小红书/抖音:EverAI 、B 站:Ever AI 酱(会有教程及 AI 工具界面操作)。 此外,还为您提供了一些 AI 领域的最新资讯: 3 月 14 日: 【AI 模型及其他】谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。OpenAI:4 项更新。Bolt:一键将 Figma 设计转换为可运行的 Web 应用。阿里:推出 AI 旗舰应用“新夸克”。360 智脑团队:开源推理模型 LightR114BDS,复现 Deepseek 的强化学习效果。 【AI 视频】Pika:更新 Pikaffects,新增多款变身特效。Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。 【AI 绘图】LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。 【AI 语音】Sesame:开源 TTS 语音模型 CSM1B。 3 月 19 日: 【AI 模型】英伟达:发布全球首个开源人形机器人基础模型 Isaac GR00T N1 及相关 GTC 信息。谷歌 Gemini:放出了两个功能 Canvas 和 Audio Overview。 【AI 视频】STAbility AI:发布 Stable Virtual Camera,2D 图像转化 3D 视频。Domo AI:推出“图片说话”功能,带口型匹配。 【AI 3D】Roblox:推出 AI 3D 技术 Cube 3D。Claude MCPUnity 版本推出。 【AI 音乐】AI 音乐工具 Udio:推出 v1.5 Allegro。LVASAgent:基于多智能体协作的长视频音频合成。
2025-03-24
我该如何从零基础,系统学习AI类工具?我的目标是熟练制作AI视频
以下是从零基础系统学习 AI 类工具并熟练制作 AI 视频的步骤: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 另外,在使用 AI 工具时,以下是一些相关的资源和建议: 想出点子:最佳免费选项为4.0,但由于与互联网连接,必应可能更好。 制作视频:最佳动画工具为用于在视频中为人脸制作动画的。 同时,要注意深度伪造是一个巨大的问题,这些系统需要合乎道德地使用。
2025-03-24
神经网络需要哪些硬件设施才能搭建起来
搭建神经网络通常需要以下硬件设施: 1. 图形处理单元(GPU):如英伟达的 GTX 580 GPU,其具有大量快速小内核,适合矩阵乘法和高内存带宽,能显著提高训练速度。 2. 专用芯片:如 ASIC 芯片、neuromorphic chips 等,更易于在芯片上实现神经网络的指令集,适用于低能耗的智能设备。 此外,搭建神经网络的硬件设施还具有以下特点和优势: 1. 同质化计算:典型的神经网络主要由矩阵乘法和线性整流函数(ReLu)两种操作组合而成,相比传统软件的指令更简单,核心代码(如矩阵乘法)的正确性和性能验证更容易。 2. 对芯片更友好:指令集小,在芯片实现上更轻松,能改变低能耗智能设备的应用场景。 3. 常量级的运行时间:每次前向迭代的计算量高度一致,不存在手写复杂 C++代码中的各种执行分支,能避免未预料的无限循环。 4. 常量级的内存消耗:几乎无需动态分配内存,减少与硬盘的 swap 和内存泄漏的可能。 5. 高度可移植:一连串的矩阵乘法操作更容易在各种计算机环境下运行。
2025-03-23
结合北京房山区文化、地标建筑、生态景观等内容,设计房山区中小学数学节 LOGO,要求巧妙融合数学元素(如几何图形、数学公式、数学符号等)与 AI 元素(如神经网络图案、代码片段、智能机器人形象等),生动诠释 “数学 + AI=?” 的主题内涵。
以下是为您整合的相关内容: 北京具有丰富多样的特色元素,包括经典地标如万里长城、天安门广场、故宫角楼、天坛等,见证了历史变迁;宜居生活方面,有独特的美食如豆汁儿、脆皮烤鸭、老北京炸酱面,以及充满京腔的日常生活;潮流文化新地标如国家博物馆、胡同里的新老交融、环球影城、798 等;未来科技方面,有西二旗的上班族日常、北大化学系科研 vlog、世界机器人大会等。 在海报设计方面,若对 AI 回答有疑问可再搜索确认,对于想用的项目要确认与北京的关系及能否使用;兔爷、戏曲金句等北京有名元素可用,金句可分化。做海报时可借鉴三思老师毛绒玩具美食系列,先找参考、做头脑风暴。比赛征集内容有四个赛道,若做系列海报,围绕金句或偏向北京非遗项目做系列较简单。用 AI 制作海报时,如制作北京地标糖葫芦风格海报,可用集梦 2.1 模型,以天坛等建筑为画面中心,注意材质、抽卡选图和细节处理。 对于设计房山区中小学数学节 LOGO,您可以考虑将房山区的特色文化、地标建筑、生态景观与数学元素(如几何图形、数学公式、数学符号等)和 AI 元素(如神经网络图案、代码片段、智能机器人形象等)相结合。例如,以房山区的著名建筑为主体,融入数学图形进行变形设计,同时添加一些代表 AI 的线条或图案,以生动诠释“数学 + AI=?”的主题内涵。
2025-03-18
卷积神经网络
卷积神经网络,也称卷积网络(术语“神经”具有误导性),使用卷积层来过滤输入以获取有用信息。卷积层具有学习的参数,能自动调整滤波器以提取对应任务的最有用信息,例如在一般目标识别中过滤对象形状信息,在鸟类识别中提取颜色信息。通常多个卷积层用于在每一层之后过滤图像以获得越来越多的抽象信息。 卷积网络通常也使用池层,以获得有限的平移和旋转不变性,还能减少内存消耗,从而允许使用更多的卷积层。 最近的卷积网络使用初始模块,它使用 1×1 卷积核来进一步减少内存消耗,同时加快计算速度。 1998 年,Yann LeCun 和他的合作者开发了 LeNet 的手写数字识别器,后来正式命名为卷积神经网络。它在前馈网中使用反向传播,被用于读取北美地区约 10%的支票。卷积神经网络可用于从手写数字到 3D 物体的与物体识别有关的所有工作。 在 ImageNet 2012 年的 ILSVRC 竞赛中,来自多个机构的先进计算机视觉小组将已有的最好计算机视觉方法应用于包含约 120 万张高分辨率训练图像的数据集。
2025-03-02
SVM与神经网络的区别是啥
SVM(支持向量机)和神经网络在以下方面存在区别: 1. 原理和模型结构: SVM 基于寻找能够最大化分类间隔的超平面来进行分类或回归任务。 神经网络则是通过构建多层神经元组成的网络结构,通过神经元之间的连接权重和激活函数来学习数据的特征和模式。 2. 数据处理能力: SVM 在处理小样本、高维度数据时表现较好。 神经网络通常更适合处理大规模数据。 3. 模型复杂度: SVM 相对较简单,参数较少。 神经网络结构复杂,参数众多。 4. 对特征工程的依赖: SVM 对特征工程的依赖程度较高。 神经网络能够自动从数据中学习特征。 5. 应用场景: 在图像识别、语音识别、机器翻译等领域,神经网络占据主导地位。 SVM 在一些特定的小数据集或特定问题上仍有应用。
2025-02-26
SVM与前馈神经网络的区别是什么
SVM(支持向量机)和前馈神经网络在以下方面存在区别: 数据处理方式:SVM 主要基于特征工程,而前馈神经网络可以自动从大量数据中学习特征。 模型结构:SVM 是一种线性分类器的扩展,具有相对简单的结构;前馈神经网络具有更复杂的多层结构。 应用场景:在图像识别、语音识别、语音合成、机器翻译等领域,早期常使用 SVM 结合特征工程,而现在神经网络逐渐占据主导地位。例如,图像识别中,早期由特征工程和少量机器学习(如 SVM)组成,后来通过使用更大数据集和在卷积神经网络结构空间中搜索,发现了更强大的视觉特征;语音识别中,以前涉及大量预处理和传统模型,现在几乎只需要神经网络;语音合成中,历史上采用各种拼接技术,现在 SOTA 类型的大型卷积网络可直接产生原始音频信号输出;机器翻译中,之前常采用基于短语的统计方法,而神经网络正迅速占领统治地位。
2025-02-26
前馈神经网络、循环网络、对称连接网络区别是什么,当前大语言模型属于前面说的哪种网络架构,为什么这种网络架构流行
前馈神经网络、循环网络和对称连接网络的区别如下: 1. 前馈神经网络:这是实际应用中最常见的神经网络类型。第一层是输入,最后一层是输出。若有多个隐藏层,则称为“深度”神经网络。各层神经元的活动是前一层活动的非线性函数,通过一系列变换改变样本相似性。 2. 循环网络:在连接图中存在定向循环,意味着可以按箭头回到起始点。它们具有复杂的动态,训练难度较大,但更具生物真实性。目前如何高效地训练循环网络正受到广泛关注,它是模拟连续数据的自然方式,相当于每个时间片段具有一个隐藏层的深度网络,且在每个时间片段使用相同权重和输入,能长时间记住隐藏状态信息,但难以训练其发挥潜能。 3. 对称连接网络:有点像循环网络,但单元之间的连接是对称的(在两个方向上权重相同)。比起循环网络,对称连接网络更易分析。没有隐藏单元的对称连接网络被称为“Hopfield 网络”,有隐藏单元的则称为玻尔兹曼机。 当前的大语言模型通常基于 Transformer 架构,它属于前馈神经网络的一种变体。这种架构流行的原因包括:能够处理长序列数据、并行计算效率高、具有强大的特征提取和表示能力等。
2025-02-25
知识图谱
知识图谱是一种揭示实体之间关系的语义网络,能够对现实世界的事物及其相互关系进行形式化描述。它于 2012 年 5 月 17 日由 Google 正式提出,初衷是提高搜索引擎能力,增强用户搜索质量和体验,实现从网页链接到概念链接的转变,支持按主题检索和语义检索。 知识图谱的关键技术包括: 1. 知识抽取: 实体抽取:通过命名实体识别从数据源中自动识别命名实体。 关系抽取:从数据源中提取实体之间的关联关系,形成网状知识结构。 属性抽取:从数据源中采集特定实体的属性信息。 2. 知识表示:包括属性图、三元组等。 3. 知识融合: 实体对齐:消除异构数据中的实体冲突、指向不明等不一致性问题。 知识加工:对知识统一管理,形成大规模知识体系。 本体构建:以形式化方式明确定义概念之间的联系。 质量评估:计算知识的置信度,提高知识质量。 知识更新:不断迭代更新,扩展现有知识,增加新知识。 4. 知识推理:在已有的知识库基础上挖掘隐含的知识。 在国家人工智能产业综合标准化体系建设指南中,知识图谱标准规范了知识图谱的描述、构建、运维、共享、管理和应用,包括知识表示与建模、知识获取与存储、知识融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、知识图谱交付与应用、知识图谱系统架构与性能要求等标准。
2025-03-21
知识图谱产品
知识图谱(Knowledge Graph,KG)是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。 知识图谱于 2012 年 5 月 17 日被 Google 正式提出,其初衷是为了提高搜索引擎的能力,增强用户的搜索质量以及搜索体验。知识图谱可以将 Web 从网页链接转向概念链接,支持用户按照主题来检索,实现语义检索。 知识图谱的关键技术包括: 1. 知识抽取:通过自动化的技术抽取出可用的知识单元,包括实体抽取(命名实体识别(Named Entity Recognition,NER)从数据源中自动识别命名实体)、关系抽取(从数据源中提取实体之间的关联关系,形成网状的知识结构)、属性抽取(从数据源中采集特定实体的属性信息)。 2. 知识表示:属性图、三元组。 3. 知识融合:在同一框架规范下进行异构数据整合、消歧、加工、推理验证、更新等,达到数据、信息、方法、经验等知识的融合,形成高质量知识库。包括实体对齐(消除异构数据中的实体冲突、指向不明等不一致性问题)、知识加工(对知识统一管理,形成大规模的知识体系)、本体构建(以形式化方式明确定义概念之间的联系)、质量评估(计算知识的置信度,提高知识的质量)、知识更新(不断迭代更新,扩展现有知识,增加新的知识)。 4. 知识推理:在已有的知识库基础上挖掘隐含的知识。
2025-03-21
知识图谱
知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。它于 2012 年 5 月 17 日由 Google 正式提出,初衷是提高搜索引擎的能力,增强用户的搜索质量和体验,实现从网页链接到概念链接的转变,支持按主题检索和语义检索。 知识图谱的关键技术包括: 1. 知识抽取: 实体抽取:通过命名实体识别从数据源中自动识别命名实体。 关系抽取:从数据源中提取实体之间的关联关系,形成网状知识结构。 属性抽取:从数据源中采集特定实体的属性信息。 2. 知识表示:包括属性图和三元组。 3. 知识融合: 实体对齐:消除异构数据中的实体冲突、指向不明等不一致性问题。 知识加工:对知识统一管理,形成大规模的知识体系。 本体构建:以形式化方式明确定义概念之间的联系。 质量评估:计算知识的置信度,提高知识质量。 知识更新:不断迭代更新,扩展现有知识,增加新知识。 4. 知识推理:在已有的知识库基础上挖掘隐含的知识。 在国家人工智能产业综合标准化体系建设指南中,知识图谱标准规范了知识图谱的描述、构建、运维、共享、管理和应用,包括知识表示与建模、知识获取与存储、知识融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、知识图谱交付与应用、知识图谱系统架构与性能要求等标准。
2025-03-21
知识图谱构建
知识图谱是一种揭示实体之间关系的语义网络,能够对现实世界的事物及其相互关系进行形式化描述。它于 2012 年 5 月 17 日由 Google 正式提出,初衷是提高搜索引擎能力,增强用户搜索质量和体验,实现从网页链接到概念链接的转变,支持按主题检索和语义检索。 知识图谱构建的关键技术包括: 1. 知识抽取:通过自动化技术抽取可用的知识单元,如实体抽取(命名实体识别)、关系抽取(提取实体间关联关系)、属性抽取(采集特定实体的属性信息)。 2. 知识表示:包括属性图、三元组等。 3. 知识融合:在同一框架规范下进行异构数据整合、消歧、加工、推理验证、更新等,包括实体对齐(消除实体冲突等不一致性问题)、知识加工(统一管理知识)、本体构建(明确定义概念联系)、质量评估(计算知识置信度)、知识更新(迭代扩展知识)。 4. 知识推理:在已有知识库基础上挖掘隐含知识。 在 LLM 落地思考方面,NLP 与知识图谱是主要的落地类型,但存在一些问题。如实现某个 NLP 任务时,需要大量人工标注和长时间训练,交付后较难新增意图和泛化任务,有时使用句式规则方式更好维护更新;构建知识图谱复杂,需与行业专家深度讨论,预见企业长远业务发展制定 schema,周期长且易与业务错位。而 LLM 出现后对 NLP、NLG、KG 有较大提升,带来更好更多的落地可能。 在以问题驱动的 AI+内容创作中,随着学习深入,可使用大模型帮助构建和扩展知识图谱。
2025-02-27
知识图谱
知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。它于 2012 年 5 月 17 日由 Google 正式提出,初衷是提高搜索引擎的能力,增强用户的搜索质量和体验,实现从网页链接到概念链接的转变,支持按主题检索和语义检索。 知识图谱的关键技术包括: 1. 知识抽取: 实体抽取:通过命名实体识别从数据源中自动识别命名实体。 关系抽取:从数据源中提取实体之间的关联关系,形成网状知识结构。 属性抽取:从数据源中采集特定实体的属性信息。 2. 知识表示:包括属性图和三元组。 3. 知识融合: 实体对齐:消除异构数据中的实体冲突、指向不明等不一致性问题。 知识加工:对知识统一管理,形成大规模的知识体系。 本体构建:以形式化方式明确定义概念之间的联系。 质量评估:计算知识的置信度,提高知识质量。 知识更新:不断迭代更新,扩展现有知识,增加新知识。 4. 知识推理:在已有的知识库基础上挖掘隐含的知识。 在国家人工智能产业综合标准化体系建设指南中,知识图谱标准规范了知识图谱的描述、构建、运维、共享、管理和应用,包括知识表示与建模、知识获取与存储、知识融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、知识图谱交付与应用、知识图谱系统架构与性能要求等标准。
2025-02-27
以知识图谱的形式生成一张涉及大模型概念的知识图谱
以下是一张涉及大模型概念的知识图谱: 大模型 Embedding 技术 句子和文档嵌入 Doc2Vec:扩展了 Word2Vec,能够为整个文档生成统一的向量表示。 Average Word Embeddings:将一段文本中所有单词的嵌入取平均作为整体的文本表示。 Transformers Sentence Embeddings:如 BERT 的标记对应的向量,或者专门针对句子级别的模型如 SentenceBERT。 实体/概念嵌入 Knowledge Graph Embeddings:如 TransE、DistMult、ComplEx 等,用于将知识图谱中的实体和关系嵌入到低维向量空间中。 其他类型 图像 Embeddings:使用卷积神经网络(CNN)进行图像特征提取,得到的特征向量即为图像嵌入。 音频 Embeddings:在语音识别和声纹识别中,将声音信号转化为有意义的向量表示。 用户/物品 Embeddings:在推荐系统中,将用户行为或物品属性映射到低维空间以进行协同过滤或基于内容的推荐。 图 Embeddings:用于学习图结构的表示学习方法,将图中的节点和边映射到低维向量空间中。通过学习图嵌入,可以将复杂的图结构转化为向量表示,以捕捉节点之间的结构和关联关系。这些方法可以通过 DeepWalk、Node2Vec、GraphSAGE 等算法来实现。图嵌入在图分析、社交网络分析、推荐系统等领域中广泛应用,用于发现社区结构、节点相似性、信息传播等图属性。 关键技术标准 机器学习标准:规范机器学习的训练数据、数据预处理、模型表达和格式、模型效果评价等,包括自监督学习、无监督学习、半监督学习、深度学习和强化学习等标准。 知识图谱标准:规范知识图谱的描述、构建、运维、共享、管理和应用,包括知识表示与建模、知识获取与存储、知识融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、知识图谱交付与应用、知识图谱系统架构与性能要求等标准。 大模型标准:规范大模型训练、推理、部署等环节的技术要求,包括大模型通用技术要求、评测指标与方法、服务能力成熟度评估、生成内容评价等标准。 自然语言处理标准:规范自然语言处理中语言信息提取、文本处理、语义处理等方面的技术要求和评测方法,包括语法分析、语义理解、语义表达、机器翻译、自动摘要、自动问答和语言大模型等标准。 智能语音标准:规范前端处理、语音处理、语音接口和数据资源等技术要求和评测方法,包括深度合成的鉴伪方法、全双工交互、通用语音大模型等标准。 计算机视觉标准:规范图像获取、图像/视频处理、图像内容分析、三维计算机视觉、计算摄影学和跨媒体融合等技术要求和评价方法,包括功能、性能和可维护性等标准。 生物特征识别标准:规范生物特征样本处理、生物特征数据协议、设备或系统等技术要求,包括生物特征数据交换格式、接口协议等标准。 国内大模型 通用模型:如文心一言、讯飞星火等,处理自然语言。 垂直模型:专注特定领域如小语种交流、临床医学、AI 蛋白质结构预测等。 大模型的体验 以‘为什么我爸妈结婚的时候没有邀请我参加婚礼’和‘今天我坐在凳子上’为例,体验了 Kimi、通义千问、豆包等大模型的回答和续写能力,发现回复有差异,且大模型基于统计模型预测生成内容。 大语言模型的工作原理 包括训练数据、算力、模型参数,在训练数据一致情况下,模型参数越大能力越强,参数用 b 链形容大小。 Transformer 架构:Transformer 是大语言模型训练架构,17 年出现用于翻译,具备自我注意力机制能理解上下文和文本关联,其工作原理是单词预测,通过嵌入、位置编码、自注意力机制生成内容,模型调教中有控制输出的 temperature。 大模型幻觉:大模型通过训练数据猜测下一个输出结果,可能因错误数据导致给出错误答案,优质数据集对其很重要。 Prompt 的分类和法则 分为 system prompt、user prompt 和 assistant prompt。 写好 prompt 的法则包括清晰说明、指定角色、使用分隔符、提供样本等,核心是与模型好好沟通。 Fine tuning 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG 概念:未对 RAG 的具体内容进行详细阐述,仅提出了这个概念。
2025-02-11
AI应用分类
AI 的应用场景非常广泛,主要包括以下几类: 1. 医疗保健: 医学影像分析:用于分析医学图像辅助诊断疾病。 药物研发:加速药物研发过程,识别潜在药物候选物和设计新治疗方法。 个性化医疗:分析患者数据提供个性化治疗方案。 机器人辅助手术:控制手术机器人提高手术精度和安全性。 2. 金融服务: 风控和反欺诈:识别和阻止欺诈行为,降低金融机构风险。 信用评估:评估借款人信用风险,帮助做出贷款决策。 投资分析:分析市场数据辅助投资决策。 客户服务:提供 24/7 服务并回答常见问题。 3. 零售和电子商务: 产品推荐:分析客户数据推荐可能感兴趣的产品。 搜索和个性化:改善搜索结果提供个性化购物体验。 动态定价:根据市场需求调整产品价格。 聊天机器人:回答客户问题并解决问题。 4. 制造业: 预测性维护:预测机器故障避免停机。 质量控制:检测产品缺陷提高质量。 供应链管理:优化供应链提高效率和降低成本。 机器人自动化:控制工业机器人提高生产效率。 5. 交通运输:(未给出具体应用场景) 此外,还有众多具体的 AI 应用产品,例如: 1. 辅助创作与学习:AI 智能写作助手、语言学习助手、诗歌创作助手、书法字体生成器、漫画生成器等。 2. 推荐与规划:AI 图像识别商品推荐、美食推荐平台、旅游行程规划器、时尚穿搭建议平台、智能投资顾问等。 3. 监控与预警:AI 宠物健康监测设备、家居安全监控系统、天气预报预警系统、医疗诊断辅助系统等。 4. 优化与管理:办公自动化工具、物流路径优化工具、家居清洁机器人调度系统、金融风险评估工具等。 5. 销售与交易:AI 艺术作品生成器、书法作品销售平台、摄影作品销售平台、汽车销售平台、房地产交易平台等。 具体如: AI 摄影参数调整助手:利用图像识别、数据分析技术,在一些摄影 APP 中根据场景自动调整摄影参数。 AI 音乐情感分析平台:通过机器学习、音频处理技术,有相关音乐情感分析软件可判断音乐的情感倾向。 AI 家居智能照明系统:结合物联网技术、机器学习,像小米智能照明系统可根据用户习惯和环境变化自动调整灯光。 AI 金融风险预警平台:运用数据分析、机器学习,金融风险预警软件能提前预警金融风险。 AI 旅游路线优化平台:借助数据分析、自然语言处理,马蜂窝可根据用户需求优化旅游路线。
2025-03-17
目前网上AI是如何分类的?
目前网上对 AI 的分类方式主要有以下几种: 1. 根据 a16z 榜单重新整理的分类: 生产力(文档、ppt、会议、脑爆、数据处理、搜索、浏览、email、文件) 社交(真实、虚拟) 教育(早教、语言学习、公司教育、父母教育、学生工具、学校工具) 创意内容(视频、音乐、声音、个人图像、图像) 2. 编程工具分类: AI IDE(AI 集成开发环境):本身是单独的软件开发工具,在原有软件开发工具基础上通过代码魔改具备 AI 功能,如 Cursor、Windsurf、Trae 等。 AI Extensions(AI 插件):必须被集成进对应的开发环境中才能使用,如阿里的“通义灵码”、百度的“文心快码”、字节跳动的“MarsCode”、科大讯飞的“iFlyCode”、GitHub 的“Copilot”等。 3. 以生成方式划分的 AIGC 分类: 音视频生成类: 视频生成:当前视频生成可分为文生视频、图生视频与视频生视频,主流生成模型为扩散模型。视频生成可用于娱乐、体育分析和自动驾驶等领域,经常与语音生成一起使用。 语音生成:用于文本到语音的转换、虚拟助手和语音克隆等,常用模型由 Transformers 提供,常用技术包括循环神经网络、长短时记忆网络、WaveNet 等。 一些具有代表性的海外项目: Sora(OpenAI):以扩散 Transformer 模型为核心,能生成长达一分钟的高保真视频,支持多种生成方式,在文本理解方面表现出色。 Genie(Google):采用 STtransformer 架构,包括潜在动作模型、视频分词器与动力学模型,拥有 110 亿参数。 WaveNet(DeepMind):一种生成模型,可生成逼真的人类语音。 MuseNet(OpenAI):一种生成音乐的 AI 模型,可在多种风格和乐器之间组合。 Multilingual v2(ElevenLabs):一种语音生成模型,支持 28 种语言的语音合成服务。
2025-03-08
所以我可以理解为CNN是一种图像分类识别的AI算法技术吗
卷积神经网络(CNN)是一种用于图像分类识别的 AI 算法技术。 ImageNet 成为深度神经网络革命的首选数据集,其中由 Hinton 领导的 AlexNet 就是基于卷积神经网络(CNN)。自 2012 年以来,在深度学习理论和数据集的支持下,深度神经网络算法大爆发,包括卷积神经网络(CNN)等。 连接主义的全面逆袭从 2012 年开始,欣顿教授和他的学生建立的 AlexNet 就是使用反向传播算法训练的卷积神经网络(CNN),其在图像识别方面击败了当时最先进的逻辑程序。 虽然 CNN 模型取得了显著成果并解决了许多问题,但也存在一些缺陷,如不能从整幅图像和部分图像识别出姿势、纹理和变化,池化操作导致模型不具备等变、丢失很多信息,需要更多训练数据来补偿损失,更适合像素扰动极大的图像分类,对某些不同视角的图像识别能力相对较差。因此,在 2011 年,Hinton 和他的同事们提出了胶囊网络(CapsNet)作为 CNN 模型的替代。
2025-03-07
我想批量给书画作品分类,区分他们的内容(国画或者书法),字体,题材(山水、人物、花鸟),技法(工笔、写意),可以使用什么ai
以下是为您提供的相关信息: 在书画作品分类方面,目前没有直接针对您需求的特定 AI 工具。但一些通用的 AI 技术和工具可能会有所帮助,例如利用图像识别技术对书画作品的内容、字体、题材和技法进行初步分析。 对于图像识别,一些常见的 AI 框架如 TensorFlow、PyTorch 等可以用于开发自定义的图像分类模型。 在 AI 绘图中,了解构图、色彩和光影等因素很重要,如构图包括景别(远景、全景、中景、近景、特写)和拍摄视角(俯视、平视、仰视,正面、侧面、背面),构图方式有点中心构图、九宫格构图、三分法构图等。 但需要注意的是,要实现您批量准确分类书画作品的需求,可能需要大量的标注数据和专业的模型训练。
2025-03-07
CRM会涉及哪些AI工具,帮我分类具体列举出来
以下是 CRM 可能涉及的 AI 工具分类列举: 销售相关工具: Salesforce 爱因斯坦:通过分析数据集识别潜在客户,生成潜在客户评分,具有自动化功能。 Clari:从事智能收入运营,能统一数据并创建准确的收入预测。 Hightime:销售团队的 AI 助手,处理重复性任务和耗时研究。 AIGC 在 CRM 中的应用: 个性化营销内容创作:根据客户数据生成个性化营销文案和视觉内容。 客户服务对话系统:开发智能客服系统,通过自然语言交互解答咨询和投诉。 产品推荐引擎:生成产品描述和展示内容,结合推荐算法推荐产品。 CRM 数据分析报告生成:自动生成数据分析报告,包括多种形式。 智能翻译和本地化:提供多语种翻译及本地化服务。 虚拟数字人和营销视频内容生成:快速生成相关形象和视频内容。 客户反馈分析:高效分析客户反馈信息。 产品经理相关 AI 工具: 用户研究、反馈分析:Kraftful(kraftful.com) 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 画原型:Uizard(uizard.io/autodesigner/) 项目管理:Taskade(taskade.com) 写邮件:Hypertype(hypertype.co) 会议信息:AskFred(fireflies.ai/apps) 团队知识库:Sense(senseapp.ai) 需求文档:WriteMyPRD(writemyprd.com) 敏捷开发助理:Standuply(standuply.com) 数据决策:Ellie AI(ellie.ai) 企业自动化:Moveworks(moveworks.com)
2025-03-07
CRM会涉及哪些AI工具,帮我分类具体列举出来
CRM 可能涉及的 AI 工具主要有以下几类: 与销售工作相关的 AI 工具: 1. Salesforce 爱因斯坦:能分析大量数据集识别潜在客户,生成预测性潜在客户评分,还能自动化执行日常或耗时任务。 2. Clari:专门从事智能收入运营,能统一数据并创建准确的收入预测。 3. Hightime:销售团队的 AI 助手,处理重复性任务和耗时研究。 AIGC 在 CRM 中的应用: 1. 个性化营销内容创作:根据客户数据生成个性化且富有创意的营销文案、视觉内容等。 2. 客户服务对话系统:开发智能客服系统,通过自然语言交互解答客户咨询、投诉等。 3. 产品推荐引擎:生成产品描述、视觉展示等内容,结合推荐算法为客户推荐产品。 4. CRM 数据分析报告生成:自动生成数据分析报告,包括文字、图表、视频演示等形式。 5. 智能翻译和本地化:提供高质量多语种翻译及本地化服务。 6. 虚拟数字人和营销视频内容生成:快速生成虚拟数字人形象、场景背景和营销视频内容。 7. 客户反馈分析:高效分析海量客户反馈文本和多媒体信息,挖掘客户需求和潜在痛点。 产品经理的 AI 工具集: 1. 用户研究、反馈分析:Kraftful(kraftful.com) 2. 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 3. 画原型:Uizard(uizard.io/autodesigner/) 4. 项目管理:Taskade(taskade.com) 5. 写邮件:Hypertype(hypertype.co) 6. 会议信息:AskFred(fireflies.ai/apps) 7. 团队知识库:Sense(senseapp.ai) 8. 需求文档:WriteMyPRD(writemyprd.com) 9. 敏捷开发助理:Standuply(standuply.com) 10. 数据决策:Ellie AI(ellie.ai) 11. 企业自动化:Moveworks(moveworks.com)
2025-03-07