直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

多模态应用

回答

多模态应用是生成式人工智能领域的重要突破点,具有以下特点和潜力:

  • 能够无缝处理和生成多种音频或视觉格式的内容,将交互扩展到超越语言的领域。如 GPT-4、Character.AI 和 Meta 的 ImageBind 等模型已能处理和生成图像、音频等模态,但能力还较基础,不过进展迅速。
  • 随着 LLMs 不断进化,能更好地理解和与多种模态交互,使用依赖 GUI 的现有应用程序,为消费者提供更引人入胜、连贯和全面的体验,改变娱乐、学习与发展以及跨各种消费者和企业用例的内容生成。
  • 与工具使用密切相关,使 LLMs 能够使用设计给人类使用但没有自定义集成的工具,如传统的企业资源计划(ERP)系统等。从长远看,多模态特别是与计算机视觉的集成,可通过机器人、自动驾驶车辆等应用程序,将 LLMs 扩展到物理现实中。
  • 关键突破点在于多模态模型能够在没有重大定制的情况下推理图像、视频甚至物理环境。
  • 基于多模态大模型的应用能够迅速解释现实世界,如将手机置于车载摄像机位置,实时分析当前地区新春的流行趋势。其架构中后端采用 llama.cpp 挂载 LLaVA 模型提供推理服务,部署 Flask 应用用于数据处理,前端页面采用 HTML5 采集画面和用户输入。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

生成式人工智能领域的 4 个突破点

尽管聊天界面对许多用户来说令人兴奋和直观,但人类听和说语言的频率可能与写或读语言的频率相当或更高。正如Amodei所指出的:“AI系统能做的事情是有限的,因为并不是所有的事情都是文本。”具备多模态功能的模型能够无缝地处理和生成多种音频或视觉格式的内容,将这种交互扩展到超越语言的领域。像GPT-4、Character.AI和Meta的ImageBind这样的模型已经能够处理和生成图像、音频和其他模态,但它们在这方面的能力还比较基础,尽管进展迅速。用Gomez的话说,我们的模型在字面上今天是盲的,这一点需要改变。我们构建了很多假设用户能够看到的图形用户界面(GUI)。随着LLMs不断进化,更好地理解和与多种模态交互,它们将能够使用依赖GUI的现有应用程序,比如浏览器。它们还可以为消费者提供更加引人入胜、连贯和全面的体验,使用户能够超越聊天界面进行互动。Shazeer指出:“多模态模型的许多出色整合可以使事物更具吸引力和与用户更紧密相连。”他还说:“我认为,目前大部分核心智能来自文本,但音频和视频可以使这些事物更有趣。”从与AI导师进行视频聊天到与AI合作迭代和编写电视剧剧本,多模态有潜力改变娱乐、学习与发展以及跨各种消费者和企业用例的内容生成。多模态与工具使用密切相关。尽管LLMs最初可能通过API与外部软件进行连接,但多模态将使LLMs能够使用设计给人类使用但没有自定义集成的工具,例如传统的企业资源计划(ERP)系统、桌面应用程序、医疗设备或制造机械。在这方面,我们已经看到了令人兴奋的进展:例如,谷歌的Med-PaLM-2模型可以合成乳腺摄影和X射线图像。而且从长远来看,多模态(特别是与计算机视觉的集成)可以通过机器人、自动驾驶车辆和其他需要与物理世界实时交互的应用程序,将LLMs扩展到我们自己的物理现实中。

生成式人工智能领域的 4 个突破点

关键突破点:多模态模型能够在没有重大定制的情况下推理图像、视频,甚至物理环境。尽管LLMs存在一些实际限制,但研究人员在短时间内对这些模型进行了惊人的改进。事实上,我们在撰写本文时已经多次更新过它,这证明了该领域技术的快速发展。Gomez也表示同意:“LLM在20次中有1次编造事实显然还是太高了。但我真的非常有信心,这是我们第一次构建这样的系统。人们的期望相当高,所以目标已经从‘计算机很笨,只会做数学’变成了‘一个人可能做得更好’。我们已经足够弥合差距,以至于批评集中在人类能做到什么程度上。”我们特别对以下4项创新感到兴奋,它们正处于改变创业者构建产品和经营公司方式的临界点。从长远来看,潜力更大。Amodei预测:“在某个时刻,我们可能会拥有一个模型,它能够阅读所有生物数据,并找出治愈癌症的方法。”现实情况是,最好的新应用可能仍然是未知的。在Character.AI,Shazeer让用户开发这些用例:“我们将看到许多新的应用程序解锁。对我来说很难说出这些应用程序是什么。将会有数百万个应用程序,用户比少数工程师更善于发现如何使用技术。”我们迫不及待地期待这些进步将如何影响我们作为创业者和公司在生活和工作中的方式,因为这些新工具和能力赋予了我们新的力量。

基于多模态大模型给现实世界加一本说明书

随着ChatGPT()的蓬勃发展,大型模型正深刻地影响着各个行业,技术的飞速发展让人感觉仿佛“度日如年”(每天涌现的新技术数量甚至超过过去一年)。在这个快速发展的潮流中,多模态技术作为行业的前沿更是突飞猛进,呈现出一统计算机视觉(CV)和自然语言处理(NLP)的势头。本文介绍了一款能够迅速解释现实世界的应用,它基于多模态大型模型,为现实世界提供了一本实时说明书。将手机置于车载摄像机位置,该应用能够实时分析当前地区今年新春的最新流行趋势。不仅展示了多模态技术的强大之处,还为我们提供了对真实世界的深入解释。这是快速在手机上利用多模态技术的方式之一,「近距离地感受一下大模型对传统APP开发的降维打击」。在这种架构中,后端采用llama.cpp挂载LLaVA模型,为应用提供推理服务。同时,部署了一个Flask应用用于数据前处理和后处理,提供Stream流服务。前端页面采用HTML5,用于采集画面和用户输入,整体设计以简单高效为主打。[heading2]建立llama.cpp服务器[heading2]LLaVA模型[content]下载模型ggml_llava-v1.5-13b,这里选择是13b 4bit的模型。BakLLaVA推理速度更快,但对中文的支持较差,7b的模型在语义理解方面普遍存在不足,特别是在需要规范数据格式进行交互的场合。对于function call和action操作,极度依赖模型的AGI能力。希望开源社区在不断努力,早日赶上GPT-4V的水平。

其他人在问
什么是多模态?什么是跨模态?
多模态指多数据类型交互,能够提供更接近人类感知的场景。大模型对应的模态包括文本、图像、音频、视频等。例如,Gemini 模型本身就是多模态的,它展示了无缝结合跨模态能力,如从表格、图表或图形中提取信息和空间布局,以及语言模型的强大推理能力,在识别输入中的细微细节、在空间和时间上聚合上下文,以及在一系列视频帧和/或音频输入上应用这些能力方面表现出强大的性能。 跨模态通常指不同模态之间的交互和融合。例如在 GPT4 的相关研究中,探索了视觉和音频等可能出乎意料的模态。智能的一个关键衡量标准是能够从不同的领域或模式中综合信息,并能够跨不同的情境或学科应用知识和技能。
2024-12-16
请推荐几个国内能用的支持多模态交流的app
以下为您推荐几个国内能用的支持多模态交流的 APP 及相关模型: 1. 百度(文心一言):https://wenxin.baidu.com 2. 抖音(云雀大模型):https://www.doubao.com 3. 智谱 AI(GLM 大模型):https://chatglm.cn 4. 中科院(紫东太初大模型):https://xihe.mindspore.cn 5. 百川智能(百川大模型):https://www.baichuanai.com/ 6. 商汤(日日新大模型):https://www.sensetime.com/ 7. MiniMax(ABAB 大模型):https://api.minimax.chat 8. 上海人工智能实验室(书生通用大模型):https://internai.org.cn 此外,智谱·AI 开源的多模态模型有: 1. CogAgent18B:基于 CogVLM17B 改进的开源视觉语言模型。拥有 110 亿视觉参数和 70 亿语言参数,支持 11201120 分辨率的图像理解,具备 GUI 图像的 Agent 能力。 代码链接: 模型下载: 2. CogVLM17B:强大的开源视觉语言模型(VLM),在多模态权威学术榜单上综合成绩优异。 代码链接:无 模型下载: 3. Visualglm6B:开源的支持图像、中文和英文的多模态对话语言模型。 代码链接: 模型下载:
2024-11-22
现在哪几家的大模型支持通过手机视频多模态实时交流?
以下几家的大模型支持通过手机视频多模态实时交流: 1. PandaGPT:能够理解不同模式的指令并根据指令采取行动,包括文本、图像/视频、音频、热、深度和惯性测量单位。 2. VideoLLaMA:引入了多分支跨模式 PT 框架,使语言模型能够在与人类对话的同时处理给定视频的视觉和音频内容。 3. 视频聊天 GPT:专门为视频对话设计,能够通过集成时空视觉表示来生成有关视频的讨论。 4. NExTGPT:端到端、通用的 anytoany 多模态语言模型,支持图像、视频、音频、文本的自由输入输出。
2024-11-22
多模态大模型
以下是关于多模态大模型的相关信息: Google 的多模态大模型叫 Gemini,是由 Google DeepMind 团队开发的。它不仅支持文本、图片等提示,还支持视频、音频和代码提示,能够理解和处理几乎任何输入,结合不同类型的信息,并生成几乎任何输出,被称为 Google 迄今为止最强大、最全面的模型,从设计之初就支持多模态,能够处理语言、视觉、听觉等不同形式的数据。 多模态大模型(MLLM)是一种在统一的框架下,集成了多种不同类型数据处理能力的深度学习模型,这些数据可以包括文本、图像、音频和视频等。通过整合这些多样化的数据,MLLM 能够更全面地理解和解释现实世界中的复杂信息,在面对复杂任务时表现出更高的准确性和鲁棒性。其典型架构包括一个编码器、一个连接器和一个 LLM,还可选择性地在 LLM 上附加一个生成器,以生成除文本之外的更多模态。连接器大致可分为基于投影的、基于查询的和基于融合的三类。 有基于多模态大模型给现实世界加一本说明书的应用,例如将手机置于车载摄像机位置,能够实时分析当前地区今年新春的最新流行趋势。在这种架构中,后端采用 llama.cpp 挂载 LLaVA 模型,为应用提供推理服务。同时,部署了一个 Flask 应用用于数据前处理和后处理,提供 Stream 流服务。前端页面采用 HTML5,用于采集画面和用户输入,整体设计以简单高效为主。下载模型 ggml_llavav1.513b,这里选择是 13b 4bit 的模型。BakLLaVA 推理速度更快,但对中文的支持较差,7b 的模型在语义理解方面普遍存在不足,特别是在需要规范数据格式进行交互的场合。对于 function call 和 action 操作,极度依赖模型的 AGI 能力。
2024-11-18
clip模型能应用与跨模态检索
CLIP 模型能应用于跨模态检索。以下是关于 CLIP 模型的一些详细信息: 对比语言图像预训练(CLIP)通过将图像和文本转换成固定大小的向量,使它们在一个共同的嵌入空间中对齐来训练模型,对于多模态信息检索和相关任务非常重要。 在 Stable Diffusion 中,CLIP 模型作为文生图模型的文本编码模块,决定了语义信息的优良程度,影响图片生成的多样性和可控性。它包含 Text Encoder 和 Image Encoder 两个模型,分别用于提取文本和图像的特征,可灵活切换,且具有强大的 zeroshot 分类能力。其庞大的图片与标签文本数据的预训练赋予了其强大的能力,把自然语言领域的抽象概念带到了计算机视觉领域。 自 2021 年以来,多模态模型成为热门议题,CLIP 作为开创性的视觉语言模型,将 Transformer 架构与视觉元素相结合,便于在大量文本和图像数据集上进行训练,可在多模态生成框架内充当图像编码器。 为解决 CLIP 模型在仅文本任务中表现不如专门用于文本的模型,导致信息检索系统处理仅文本和多模态任务时效率低下的问题,已提出新颖的多任务对比训练方法训练相关模型,使其在文本图像和文本文本检索任务中达到最先进性能。
2024-10-31
多模态AI是什么,和深度学习的关系
多模态 AI 是指能够处理和生成多种数据类型(如文本、图像、音频、视频等)交互的人工智能技术,从而能够提供更接近人类感知的场景。 多模态 AI 与深度学习有着密切的关系。在深度学习时期,深度神经网络等技术的发展为多模态 AI 提供了基础。当前,多模态 AI 是 AI 领域的前沿技术之一。 多模态 AI 具有以下特点和应用: 1. 能够无缝地处理和生成多种音频或视觉格式的内容,将交互扩展到超越语言的领域。 2. 像 GPT4、Character.AI 和 Meta 的 ImageBind 等模型已经能够处理和生成图像、音频等模态,但能力还比较基础,不过进展迅速。 3. 多模态模型可以为消费者提供更加引人入胜、连贯和全面的体验,使用户能够超越聊天界面进行互动。 4. 多模态与工具使用密切相关,能够使用设计给人类使用但没有自定义集成的工具。 5. 从长远来看,多模态(特别是与计算机视觉的集成)可以通过机器人、自动驾驶车辆等应用程序,将大语言模型扩展到物理现实中。
2024-10-28
制作PPT的AI应用有那些
以下是一些制作 PPT 的 AI 应用: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。允许用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 5. 爱设计 PPT:在国内 AI 辅助制作 PPT 的产品中表现出色,背后有实力强大的团队,能敏锐把握市场机遇,已确立市场领先地位。 目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-22
文字生成视频有哪些好的应用
以下是一些文字生成视频的好的应用: 1. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要注意的是,Runway 是收费的。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 6. Genmo:相较于 Pika 和 Runway,生成视频的清晰度大幅提高,人像的稳定性和美观度强很多,支持镜头控制且控制粒度更细,但还没开放图片生成视频,只能用文字提示词。 7. VIGGLE:能直接通过文字描述让任何静态图动起来,能做各种动作,还能直接文字生成视频,进行各种角色混合和动作替换。其核心技术基于 JST1 模型,该模型是首个具有实际物理理解能力的视频3D 基础模型,能够根据用户需求,让任何角色按照指定方式进行运动。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。内容由 AI 大模型生成,请仔细甄别。
2024-12-21
AI应用解决方案
以下是为您提供的 AI 应用解决方案: AI 应用主要涉及以下几个方面: 1. 辅助创作与学习: AI 智能写作助手,如 Grammarly、秘塔写作猫,利用自然语言处理技术辅助用户进行高质量写作,可检查语法、拼写错误并提供改进建议,进行智能润色和内容创作辅助。 语言学习助手、诗歌创作助手、书法字体生成器、漫画生成器等为用户的学习和创作提供支持。 2. 推荐与规划: AI 图像识别商品推荐,如淘宝拍照搜商品,通过图像识别和机器学习为用户推荐相似商品。 美食推荐平台,如大众点评智能推荐,基于用户口味偏好推荐美食。 旅游行程规划器、时尚穿搭建议平台、智能投资顾问等,根据用户的需求和偏好为其推荐合适的产品、服务或制定个性化的计划。 3. 监控与预警: AI 宠物健康监测设备、家居安全监控系统、天气预报预警系统、医疗诊断辅助系统等,实时监测各种情况并提供预警。 4. 优化与管理: 办公自动化工具、物流路径优化工具、家居清洁机器人调度系统、金融风险评估工具等,利用数据分析和机器学习提高工作效率和管理水平。 5. 销售与交易: AI 艺术作品生成器、书法作品销售平台、摄影作品销售平台、汽车销售平台、房地产交易平台等,为各类产品和服务提供销售渠道。 此外,还有以下具体的 AI 应用: 1 20 中的部分应用: 小爱同学、Siri 等 AI 语音助手定制开发,通过语音识别和自然语言理解技术,为不同需求定制专属语音助手,可控制智能家居、回答问题等。 Keep 智能训练计划,利用数据分析和机器学习技术,根据用户数据制定个性化健身方案。 81 100 中的部分应用: AI 菜谱口味调整工具,如下厨房口味调整功能,通过自然语言处理和数据分析,根据用户反馈调整菜谱口味。 AI 语言学习纠错平台,如英语流利说纠错功能,利用自然语言处理和机器学习技术,帮助语言学习者纠正错误。 总之,这些 AI 应用为创业者提供了丰富的选择和广阔的发展前景,创业者可以根据自己的兴趣、技能和市场需求,选择适合自己的项目进行创业。
2024-12-21
如何将AI应用于学术研究
将 AI 应用于学术研究可以参考以下步骤和建议: 1. 确定课题主题:明确研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具搜集相关研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具提取收集资料中的关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的课题大纲。 5. 撰写文献综述:借助 AI 工具撰写文献综述部分,保证内容准确完整。 6. 构建方法论:根据研究需求,采用 AI 建议的方法和技术设计研究方法。 7. 数据分析:若课题涉及数据收集和分析,使用 AI 数据分析工具处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具撰写课题各部分,并检查语法和风格。 9. 生成参考文献:使用 AI 文献管理工具生成正确的参考文献格式。 10. 审阅和修改:借助 AI 审阅工具检查课题的逻辑性和一致性,根据反馈修改。 11. 提交前的检查:使用 AI 抄袭检测工具确保课题的原创性,并做最后的格式调整。 需要注意的是,AI 工具只是辅助,不能完全替代研究者的专业判断和创造性思维,使用时应保持批判性思维,确保研究质量和学术诚信。 AI 的技术历史和发展方向以及目前最前沿的技术点: 技术研究方向: 数学基础:包括线性代数、概率论、优化理论等。 机器学习基础:如监督学习、无监督学习、强化学习等。 深度学习:涉及神经网络、卷积网络、递归网络、注意力机制等。 自然语言处理:涵盖语言模型、文本分类、机器翻译等。 计算机视觉:包含图像分类、目标检测、语义分割等。 前沿领域:有大模型、多模态 AI、自监督学习、小样本学习等。 科研实践:包括论文阅读、模型实现、实验设计等。 应用方向: 编程基础:如 Python、C++等。 机器学习基础:像监督学习、无监督学习等。 深度学习框架:例如 TensorFlow、PyTorch 等。 应用领域:包括自然语言处理、计算机视觉、推荐系统等。 数据处理:涉及数据采集、清洗、特征工程等。 模型部署:包含模型优化、模型服务等。 行业实践:有项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。
2024-12-21
🚀接着上期SOP+AI:打造职场高效能人士的秘密武器的分享,今天继续聊聊SOP+AI的应用,🎯今天的主题是“怎样利用AI节约10倍内容创作时间?”📚最近跟团队有开始运营小红书账号,就想着先给自己打造点顺手的工具,于是乎「小红书文案专家」就出生啦~🎉[heading1]一、先介绍下我们小Bot[content]🛺BOT名称:小红书文案专家功能价值:见过多个爆款文案长啥样,只需输入一个网页链接或视频链接,就能生成对应的小红书文案,可以辅助创作者生成可以一键复制发布的初稿,提供创意和内容,1
以下是关于“SOP+AI”的相关内容: 怎样利用 AI 节约 10 倍内容创作时间? 最近团队开始运营小红书账号,于是打造了“小红书文案专家”。 BOT 名称:小红书文案专家 功能价值:见过多个爆款文案,输入网页或视频链接就能生成对应的小红书文案,辅助创作者生成可一键复制发布的初稿,提供创意和内容,节约 10 倍文字内容创作时间。 应用链接:https://www.coze.cn/s/ij5C6LWd/ 设计思路: 痛点:个人时间有限,希望有人写初稿并生成配图。 实现思路:为自己和团队设计工作流,让 AI 按运营思路和流程工作。 一期产品功能: 1. 提取任何链接中的标题和内容。 2. 按小红书平台文案风格重新整理内容。 3. 加入 emoji 表情包,使文案更有活力。 4. 为文案配图片。 二期计划功能:持续优化升级,增加全网搜索热点功能,提炼热点新闻或事件关键信息,结合用户想要生成的内容方向输出文案和配图。 SOP+AI:打造职场高效能人士的秘密武器 案例分享:X 公司客服团队引入 SOP 和 AI 助手后,工作效率显著提升。引入 SOP 前,客服工作流程混乱,效率低下,客户满意度不高。引入 SOP 标准化操作后,效率提高。进一步引入 AI 助手,自动回复常见问题、处理简单请求,减少客服工作量,还能及时发现问题帮助优化。结果客服团队工作效率提升 30%以上,客户满意度显著提高。SOP 能提升效率、减少失误、促进协作,借助 AI 助手,SOP 制定和优化更高效智能。
2024-12-20
AI的工具类应用有哪些?
以下是一些常见的 AI 工具类应用: 1. AI 菜谱口味调整工具:如“下厨房”的口味调整功能,使用自然语言处理和数据分析技术,根据用户反馈调整菜谱口味,市场规模达数亿美元。 2. AI 语言学习纠错平台:像“英语流利说”的纠错功能,运用自然语言处理和机器学习技术,帮助语言学习者纠正错误,市场规模达数十亿美元。 3. AI 电影剧情分析系统:例如“豆瓣电影”的剧情分析工具,通过数据分析和自然语言处理技术,为用户提供深度解读,市场规模达数亿美元。 4. AI 办公文件分类系统:如“腾讯文档”的分类功能,借助数据分析和机器学习技术,自动分类办公文件,方便管理,市场规模达数亿美元。 5. AI 美容护肤方案定制平台:“美丽修行”的定制方案功能,利用图像识别和数据分析技术,根据用户肤质定制护肤方案,市场规模达数亿美元。 6. AI 菜谱生成平台:“豆果美食 APP”,采用自然语言处理和数据分析技术,根据用户口味和现有食材生成个性化菜谱,市场规模达数亿美元。 7. AI 语言学习助手:“沪江开心词场”,通过自然语言处理和机器学习技术,辅助用户学习语言,提供个性化学习方案,市场规模达数十亿美元。 8. AI 电影推荐系统:“爱奇艺”的智能推荐功能,运用数据分析和机器学习技术,根据用户喜好推荐电影,市场规模达数亿美元。 9. AI 办公自动化工具:“WPS Office”,借助自然语言处理和机器学习技术,提高办公效率,实现自动化办公流程,市场规模达数十亿美元。 10. AI 游戏道具推荐系统:在一些游戏中的推荐功能,使用数据分析和机器学习技术,根据玩家需求推荐游戏道具,市场规模达数亿美元。 11. AI 天气预报分时服务:“彩云天气”的分时预报,利用数据分析和机器学习技术,提供精准的分时天气预报,市场规模达数亿美元。 12. AI 医疗病历分析平台:“医渡云”的病历分析系统,通过数据分析和自然语言处理技术,分析医疗病历,辅助诊断,市场规模达数十亿美元。 13. AI 会议发言总结工具:“讯飞听见”的会议总结功能,运用自然语言处理和机器学习技术,自动总结会议发言内容,市场规模达数亿美元。 14. AI 书法作品临摹辅助工具:书法临摹软件,借助图像识别和数据分析技术,帮助书法爱好者进行临摹,市场规模达数亿美元。
2024-12-20