直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

你好,请帮我阐述一下最新的AI技术可以帮我做什么

回答

以下是最新的 AI 技术能为您做的一些事情:

  1. 大模型(如 GPT、PaLM 等):能够处理和生成自然语言文本,帮助您进行写作、回答问题、翻译等工作。
  2. 多模态 AI(如视觉-语言模型 CLIP、Stable Diffusion):实现视觉和语言的交互,例如根据语言描述生成图片,或者理解图片内容并用语言描述。
  3. 自监督学习(如自监督预训练、对比学习、掩码语言模型等):提高模型的学习效率和效果。
  4. 小样本学习(如元学习、一次学习、提示学习等):在数据有限的情况下也能进行有效的学习和预测。
  5. 可解释 AI(如模型可解释性、因果推理、符号推理等):让您更好地理解模型的决策过程和结果。
  6. 机器人学(如强化学习、运动规划、人机交互等):助力机器人更智能地完成各种任务,如工业生产、服务等。
  7. 量子 AI(如量子机器学习、量子神经网络等):为复杂问题的解决提供新的思路和方法。
  8. AI 芯片和硬件加速:提升 AI 计算的速度和效率。

在专利审查领域,AI 技术也得到了广泛应用,它可以通过自动化和智能化的手段,帮助专利审查员更高效地处理大量的专利申请、检索相关文献、评估专利性和创新性等任务。

在教育方面,例如小学课堂,AI 技术也有很多应用。如 2020 年的 GPT-3 擅长用电脑写文章和做其他很多语言相关的事情,2022 年的 DALL-E 可以根据语言描述画出想象中的图画。现在的 AI 还能够写文章、制作视频、创作音乐,还有像聊天机器人这样可以像朋友一样与您交流的 AI,以及能根据文字描述创造全新图片和视频的 AI。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

问:AI的技术历史和发展方向,目前最前沿的技术点有哪些

1.大模型(Large Language Models):GPT、PaLM等2.多模态AI:视觉-语言模型(CLIP、Stable Diffusion)、多模态融合3.自监督学习:自监督预训练、对比学习、掩码语言模型等4.小样本学习:元学习、一次学习、提示学习等5.可解释AI:模型可解释性、因果推理、符号推理等6.机器人学:强化学习、运动规划、人机交互等7.量子AI:量子机器学习、量子神经网络等8.AI芯片和硬件加速

问:有没有专利审查方面的AI ?

是的,近年来,人工智能(AI)在专利审查领域得到了广泛应用。AI技术通过自动化和智能化的手段,帮助专利审查员更高效地处理大量的专利申请、检索相关文献、评估专利性和创新性等任务。以下是一些具体的AI应用和平台,它们在专利审查过程中发挥了重要作用:

当AI走进小学课堂(全套课程设计)

2020年:有一个AI叫GPT-3,它非常擅长用电脑写文章和做其他很多用语言的事情。它可以帮助人们写故事、答复邮件,甚至写程序代码!2022年:还有一些AI,比如DALL-E,可以根据你告诉它的话,画出你想象中的图画。你说“一个穿宇航服的猫在月球上”,它就可以画出来!看到这些有趣的故事,你们是不是觉得人工智能非常神奇呢?从一个小小的想法发展到现在,人工智能已经能帮我们做很多事情了。那么,接下来,我们来探索一下人工智能现在都可以做些什么吧!你们可能会好奇,人工智能除了下棋和画画之外,还能做什么?其实,现在的人工智能已经能够写文章,制作视频,甚至创作音乐了!接下来的部分,我们会了解一些最新、最酷的AI技术。比如,有一种叫做聊天机器人的AI,它可以和我们聊天就像朋友一样。还有一些AI,它们可以根据你给的文字描述来创造出全新的图片和视频。想象一下,你只需要说出你想看的画面,AI就能立刻把它变成现实!

其他人在问
去ai味
要去除 AI 味,可以从以下几个方面入手: 1. 对于聊天 AI,使其变得不正经、放肆、幽默、通俗。注意语气的自然化,比如使用语气词嗯、吧、啊、哈哈哈等,让回答更自然、贴近日常对话风格。还要注意口语化词语(相对于书面语)的使用,不过增加网络语言语料库需谨慎,以免生搬硬套带来副作用。 2. 对于睿声生成的配音,若语速慢有 AI 味儿,可使用剪映的音频变速功能加速配音,以消除 AI 味儿并配合视频前段的快节奏。 3. 对于 GPT 的回复,避免其用 1、2、3、4 或“首先、其次、最后”这种模式,可让其扮演特定角色并给出明确输出要求。但这种方法可能换汤不换药,要想让其更有趣,可让它在回复中加点感情,比如用括号补充动作,营造特定环境等。
2024-09-19
可以建立知识库的ai有哪些
以下是一些可以建立知识库的 AI 工具和平台: 1. 飞书软件:例如“通往 AGI 之路”,您可以在飞书大群中与机器人对话获取对应的资料。 2. Coze:在“大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库”中有相关介绍。 3. Mem:如 https://get.mem.ai/ ,它可以保存组织中每次会议的记录,并在人们开始新项目时主动建议相关的决策、项目或人员,节省时间。 4. GPT:通过 OpenAI 的 embedding API 解决方案,可以搭建基于 GPT API 的定制化知识库,但需要注意其免费版 ChatGPT 一次交互的容量限制。
2024-09-19
notion ai的功能
Notion AI 具有以下功能: 直接在 Notion 中接入 AI 的能力,能让工作更迅速,写作更出色,思考更伟大。 可以在笔记和文档中应用 AI 的力量。 能够实现 AI 数据库自动填充功能。 可以改变知识管理的方式,让人们摆脱繁琐的信息组织工作,用户只需简单地将信息丢到 Notion 中,就可以通过各种方式进行检索。
2024-09-19
PopAI的功能
PopAI 是一款办公效率工具,具有以下功能: 1. 类似 ChatGPT 的聊天功能。 2. 集成了众多工作中可用的效率工具,如 PPT 和流程图生成、提示生成等。 3. 率先集成了 GPT4V 的图像 API 且调教良好,能清晰解释图像相关内容。 4. 具有创新的交互,在回答内容后可进行如翻译为中文、扩写重新排版并添加内容变为一篇文章等“Enrich”操作。 5. “Enrich”操作不仅不是干巴巴的填充,还会配合相关图片,必要时绘制流程图。
2024-09-19
popai 的功能
Poe 是一个 AI 聊天网站,支持与多个智能 AI 机器人(如 GPT4 等)进行实时在线交流。注册账号后可免费使用,部分功能需要付费订阅。不同的 AI 机器人有不同特点,可根据需求选择使用。总体而言,Poe 为用户提供了便捷的智能对话体验。其官网地址是:https://poe.com/ ,在官网帮助中心上可以找到具体教程。 此外,Poe 平台还推出了其他多种功能,比如多个机器人一起聊天、文件上传和视频输入等。Odyssey 是一个能提供好莱坞级别的 AI 视频生成和编辑工具的项目。PaintsUndo 可以输入静态图像自动生成整个绘画的全过程视频,该项目主要研究和再现数字绘画中的绘画行为,为数字艺术创作提供新的工具和方法。更多详细介绍可参考:https://xiaohu.ai/p/10996 、https://x.com/imxiaohu/status/1810574723048489063 、https://xiaohu.ai/p/11005 、https://x.com/imxiaohu/status/1810589354114626008 、https://xiaohu.ai/p/11010 、https://lllyasviel.github.io/pages/paints_undo/
2024-09-19
可用于记笔记的ai有哪些
以下是一些可用于记笔记的 AI 相关产品: 1. MeetRecord:这是一家专注于销售通话记录和辅导的软件公司。其核心功能包括 AI 驱动的笔记记录,能通过人工智能技术自动记录和分析销售通话,提供会议内容的关键词和主题分析,自动生成会议纪要和行动项;还有个性化辅导计划,能生成个性化的辅导计划,模仿表现最好的销售人员,并实施自动呼叫评分系统;此外,还具备交易智能和推荐、CRM 自动化、多语言支持以及安全性与企业化支持等功能。 2. 目前没有更多明确提及专门用于记笔记的其他 AI 产品的相关信息。但在一些关于人工智能的讨论中,提到了手写笔记对于信息留存和思维培养的重要性,例如在关于防止 AI 取代人类思考的论述中,指出手写笔记有助于将信息从短期记忆转移到长期记忆,成为更好的概念思考者。
2024-09-19
你好,介绍一下way to agi
WayToAGI 是一个由一群热爱 AI 的专家和爱好者共同建设的开源知识库和社区。它诞生于 2023 年 4 月 26 日,2024 年的 2050 年将是它的生日庆典。在没有任何推广的情况下,短短一年时间,就拥有超过 70 万用户和超千万次的访问量。它是很多 AI 爱好者知识的源头,社群的口号是让更多的人因 AI 而强大,有很多学社和共学共建的活动。 WayToAGI 不仅是一个普通的技术社区,更是一个汇聚行业顶尖创作者和 KOL 的思想交流平台。社区内有 AI 领域的最新进展、教程、工具和一线实战案例,引领并推广开放共享的知识体系,倡导共学共创等形式,还孵化了 AI 春晚、离谱村等大型共创项目。社区制作的优质作品,多次登上央视首页,广受好评。您可以打开“waytoagi.com”找到这个社群。欢迎您来参与!
2024-09-19
你好,你是一位猎头,可以依靠什么ai软件找到人选呢
在招聘领域,依靠以下 AI 软件可能有助于找到人选: 1. 简历相关: Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的每个方面,包括写作、编辑、格式化和优化。 Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 。 2. 面试官相关: 用友大易 AI 面试产品:具有强大的技术底座、高度的场景贴合度、招聘全环节集成的解决方案、先进的防作弊技术以及严密的数据安全保障。能帮助企业完成面试,借助人岗匹配模型,自主完成初筛,并对符合企业要求的候选人自动发送面试邀约。 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上。同时候选人体验也得到改善、到面率比之前提升最高达 30%。 InterviewAI:在线平台,提供与面试职位相关的问题和由 AI 生成的推荐答案。候选人可以使用设备上的麦克风回答每个问题,每个问题最多回答三次。对于每个答案,候选人将收到评估、建议和得分。 使用这些产品时,企业需要考虑到数据安全性和隐私保护的问题。
2024-08-25
你好,请问可以给我推荐一下图片编辑的ai软件么
以下为您推荐一些图片编辑的 AI 软件: 1. AVAide Watermark Remover:这是一个在线工具,使用 AI 技术从图片中去除水印。它支持多种图片格式,如 JPG、JPEG、PNG、GIF 等。操作简单,只需上传图片,选择水印区域,然后保存并下载处理后的图片即可。这个工具还提供了其他功能,如去除文本、对象、人物、日期和贴纸等。 2. Vmake:这个工具同样提供 AI 去除图片水印的功能。用户可以上传最多 10 张图片,AI 会自动检测并移除图片上的水印。处理完成后,用户可以选择保存生成的文件。这个工具适合需要快速去除水印的用户,尤其是那些需要在社交媒体上分享图片的用户。 3. AI 改图神器:这个工具提供 AI 智能图片修复去水印的功能,可以一键去除图片中的多余物体、人物或水印,不留任何痕迹。支持直接粘贴图像或上传手机图像,操作简单方便。 此外,还有 ImageEditor.AI ,其官网为:https://imageeditor.ai/ ,这是一个 AI 驱动的平台,简化了图像编辑和创作的过程。通过使用简单的指令,用户可以指导 AI 执行诸如改变颜色、生成图像等任务。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-08-23
你好:哪款AI工具出来的图像,如美女最美,帅哥最帅
目前没有哪一款 AI 工具可以绝对地生成最美的美女图像或最帅的帅哥图像。不同的 AI 绘画工具在生成人物图像方面各有特点,其效果取决于多种因素,如输入的提示词、模型训练数据、算法等。一些常见的 AI 绘画工具包括 DALL·E2、StableDiffusion 等,但它们生成的图像美观程度也会因具体的使用和设置而有所差异。
2024-08-19
你好:目前国内外哪款绘画AI工具最好?
目前国内外有很多热门的 AI 绘画工具,其中 Midjourney 是一款备受关注的工具。 Midjourney 具有以下特点: 1. 容易上手,对于完全不懂 AI 绘图的新手来说是不错的入门选择。 2. 现阶段的 AI 能辅助进行设计,视觉效果相当吸睛。 3. 模型强大,能生成高质量的图像,且支持用户充分的个性化设置。 然而,Midjourney 也存在一些不足: 1. 使用过程不够便捷,需要通过 Discord 应用加入 Midjourney 的频道,或者创建自己的频道并邀请 Midjourney 机器人,才能开始生成图片。 2. 在用户体验和易用性方面还有待改进,没有帮助用户解决“最后一公里”的问题,学习曲线较陡峭。
2024-08-19
你好,目前在国内有哪些实用的中文AI网站或软件,请推荐AI工具如何操作的资料,谢谢
以下是为您推荐的国内实用的中文 AI 网站或软件以及相关操作资料: 内容仿写 AI 工具: 秘塔写作猫:https://xiezuocat.com/ 。写作猫是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,还能实时同步翻译。支持全文改写,一键修改,实时纠错并给出修改建议,智能分析文章的各类属性,为文章的正负情感、情绪强度和易读性打分。 笔灵 AI 写作:https://ibiling.cn/ 。笔灵 AI 写作是得力的智能写作助手,能应对多种写作需求,如心得体会、公文写作、演讲稿、小说、论文等。支持一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作:https://effidit.qq.com/ 。智能创作助手 Effidit 由腾讯 AI Lab 开发,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看:https://www.waytoagi.com/sites/category/2 。 对于 Python 以及各种 AI 工具的使用,推荐: B 站 up 主「PAPAYA 电脑教室」的 Python 入门课,课程免费。 对于大模型,Andrej Karpathy 的讲解很不错,油管地址:https://www.youtube.com/watch?v=zjkBMFhNj_g ,B 站地址: 。 对于资料库,推荐 AJ 和众多小伙伴们共创的「🌈通往 AGI 之路」飞书文档:https://waytoagi.feishu.cn/wiki/QPe5w5g7UisbEkkow8XcDmOpn8e 。 PDF 翻译的 AI 产品: 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(有免费次数限制且进阶功能需要付费)。 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-08-13
请你以用户购买一只股票型基金为例,阐述从购买到TA再到APP,如何计算该基金的资产收益流程
很抱歉,目前知识库中没有关于从购买股票型基金到 TA 再到 APP 计算该基金资产收益流程的相关内容。但一般来说,计算股票型基金的资产收益流程大致如下: 首先,在购买股票型基金时,您需要支付申购费用,申购费用通常会从您的申购金额中扣除。申购成功后,您获得的基金份额 = 申购金额÷(1 + 申购费率)÷ 基金单位净值。 在持有基金期间,基金的资产价值会随着基金投资组合中股票的价格波动而变化。基金的单位净值会定期公布,您可以通过基金公司官网、TA 系统或相关 APP 查看。 当您想要赎回基金时,可能需要支付赎回费用。赎回金额 = 基金份额×基金单位净值×(1 赎回费率)。 您的资产收益 = 赎回金额 申购金额。 需要注意的是,不同的基金产品在申购、赎回费率以及计算方式上可能会有所差异,具体应以您所购买的基金产品的相关规定为准。
2024-09-01
请你结合大疆服务业务的具体场景,设计两个AI的应用落地场景,请从AI在此场景中应该发挥什么作用、怎样和业务场景做耦合、怎样评估AI的落地效果等多个方面进行阐述。
以下为结合大疆服务业务设计的两个 AI 应用落地场景: 场景一:无人机故障预测与维护 AI 发挥的作用: 通过对无人机飞行数据、传感器数据和零部件使用情况的分析,预测可能出现的故障。 与业务场景的耦合: 与大疆的售后服务系统集成,实时获取无人机的运行数据。利用机器学习算法建立故障预测模型,提前通知用户进行维护保养,减少因故障导致的飞行事故和损失。 落地效果评估: 1. 降低无人机故障率,通过对比使用 AI 预测维护前后的故障发生频率来评估。 2. 提高用户满意度,通过用户反馈和满意度调查来衡量。 3. 减少维修成本,统计维修费用和零部件更换成本的变化。 场景二:个性化飞行方案推荐 AI 发挥的作用: 根据用户的飞行历史、偏好、地理环境等因素,为用户生成个性化的飞行方案。 与业务场景的耦合: 在大疆的应用程序中,用户输入相关信息后,AI 系统自动分析并推荐合适的飞行路线、拍摄角度、飞行速度等。 落地效果评估: 1. 增加用户飞行活跃度,通过统计用户的飞行次数和时长来评估。 2. 提升用户对推荐方案的采纳率,通过用户实际采用推荐方案的比例来衡量。 3. 促进产品销售,对比使用个性化推荐功能前后的产品销售数据。
2024-08-11
请你结合大疆服务业务的具体场景,设计两个AI的应用落地场景,请从AI在此场景中应该发挥什么作用、怎样和业务场景做耦合、怎样评估AI的落地效果等多个方面进行阐述。
以下为结合大疆服务业务设计的两个 AI 应用落地场景: 场景一:无人机故障预测与维护 AI 发挥的作用: 通过对无人机运行数据的实时监测和分析,利用机器学习算法预测可能出现的故障。 与业务场景的耦合: 与大疆的无人机飞行数据采集系统相结合,获取各类传感器数据,如电机转速、电池状态、飞行姿态等。 评估落地效果: 1. 降低无人机故障率,减少因故障导致的飞行事故和设备损坏。 2. 提高维护效率,缩短维修时间,降低维修成本。 3. 提升用户对产品的满意度和信任度。 场景二:个性化飞行方案推荐 AI 发挥的作用: 根据用户的飞行历史、偏好以及地理环境等因素,为用户生成个性化的飞行方案。 与业务场景的耦合: 整合大疆的用户数据库和地理信息系统,获取用户的飞行习惯和所在地的地理特征。 评估落地效果: 1. 增加用户的飞行体验,满足不同用户的需求。 2. 促进无人机的使用频率和用户的活跃度。 3. 有助于新产品的推广和销售,根据用户需求推荐适配的新机型和配件。
2024-08-11
AI在法律领域的最新应用
以下是 AI 在法律领域的一些最新应用: 1. 专利审查方面:AI 技术通过自动化和智能化手段,帮助专利审查员更高效地处理大量专利申请、检索相关文献、评估专利性和创新性等任务。 2. 法律文书:这是目前 AI 在 2B 行业基本成熟的应用,其格式固定,核心技术是法条/判例的引用,是“搜索”能力和大模型能力的搭配。 3. 虽然目前其他 2B 应用如“AI 客服”等雷声大、雨点小,未达到大量取代人工的预期,但生成式人工智能技术已逐步涵盖艺术创作产业、医疗保健、虚拟现实、数据合成与数据增强等多个领域,为各行业带来创新、效率与价值。
2024-09-19
24小时内中国AI医美最新消息
以下是为您找到的关于中国 AI 医美的相关消息: 有一个将 AI 和中医结合的项目,其先是用摄像头观察患者的口腔和舌苔,再用指尖传感器号脉,然后根据观测的数据生成选择题让患者作答,最后 AI 会生成药方。该项目目前应用在辅助看诊,能够提高诊疗效率,创始人的愿景是在未来实现 24 小时独立问诊开药。 但目前没有关于 24 小时内中国 AI 医美最新消息的准确和详尽内容。要获取最新的信息,您可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台。
2024-09-17
24小时内中国AI前沿科技最新消息
以下是 24 小时内中国 AI 前沿科技的最新消息: 阿里 CEO 吴泳铭表示将开源国内最大 720 亿参数模型。 京东 CEO 称正在测试 AI 自动生成营销内容。 此外,还有一些国际上的 AI 相关消息: 苹果新专利:CGR 技术生成虚拟形象,展示穿戴效果。 微软 AI 专利:充当治疗师,疏导心理问题。 苹果改造 Siri:明年或用大语言模型。 谷歌 Open Se Cura:为 Pixel 带来低功耗 AI。 微软计划:AI 助手 Copilot 将进入 Windows 10。 亚马逊成立 AI 训练团队,投资数百万美金。 ChatGPT 持续宕机,CEO 道歉。 GitHub Universe 2023 新功能:新的 Copilot 聊天功能,Copilot 支持手机应用,GitHub Copilot Workspace,产问题查询 GitHub Copilot 企业版:每月 39 美元的高级服务。GitHub Copilot 合作伙伴计划,GitHub 高级安全功能。
2024-09-17
可以找最新研究论文的平台工具
以下为您推荐一个可以查找最新研究论文的平台工具:Cambrian:AI 研究的副驾驶(https://www.cambrianml.org/)。该平台能够搜索超过 24 万篇机器学习论文,获取当天的论文,生成研究见解,并自动化文献综述。用户还可以在该平台与网络中的人分享论文、书签和文件夹,或者公开个人资料展示自己的想法。
2024-09-16
可以找最新研究方向论文的智能体
以下是关于具身智能的相关信息: 具身智能是人工智能领域的一个子领域,强调智能体(如机器人、虚拟代理等)通过与物理世界或虚拟环境的直接交互来发展和展现智能。 其核心在于智能体的“身体”或“形态”,这些身体可以是物理形态,如机器人的机械结构,也可以是虚拟形态,如在模拟环境中的虚拟角色。身体不仅为智能体提供了与环境互动的手段,也影响其学习和发展。 具身智能需要具备感知、决策和执行三种核心能力,执行能力是技术难点,涉及硬件设计,从执行角度来说,具身智能体主要分为移动和操作两大能力。在移动方面,如二足机器人、四足机器狗、轮式机器人在各种地形下实现鲁棒的移动仍是前沿学术问题。 相关研究涉及多个学科,包括机器人学、认知科学、神经科学和计算机视觉等。在机器人学中,关注如何设计能自主行动和适应环境的机器人;在认知科学和神经科学中,探索大脑处理与身体相关信息的机制及应用于人造智能系统;在计算机视觉中,致力于开发算法使智能体能够理解和解释视觉信息,进行有效空间导航和物体识别。 相关论文如《Catalyzing nextgeneration Artificial Intelligence through NeuroAI》,链接为:https://www.nature.com/articles/s4146702337180x 。 具身智能的测试如 Coffee test:一台机器需要进入一个普通的美国家庭,并弄清楚如何煮咖啡:找到咖啡机,找到咖啡,加水,找到一个杯子,然后通过按下适当的按钮来煮咖啡。网址:https://analyticsindiamag.com/turingtestisunreliablethewinogradschemaisobsoletecoffeeistheanswer/ 。 此外,DeepMind 开发出可以向人类学习的人工智能,Nature 发表了相关研究成果,研究人员在 3D 模拟环境中使用神经网络和强化学习,展示了 AI 智能体如何在没有直接从人类那里获取数据的情况下,通过观察来学习和模仿人类的行为,被视为向人工通用智能(AGI)迈进的一大步。
2024-09-16
AI 数字人最新消息
以下是关于 AI 数字人的最新消息: 目前业界对于数字人的定义尚未统一,一般可根据技术栈分为真人驱动和算法驱动两类。算法驱动数字人的相关开源代码有很多,如 ASR 语音识别方面的 openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition,这是一个语音识别的接口集合,包含不同实现的语音识别接口)。AI Agent 大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可使用 LangChain 的模块进行自定义(https://www.langchain.com/)。TTS 方面,有微软的 edgetts(https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费)、VITS(https://github.com/jaywalnut310/vits)以及专注于唱歌的 sovitssvc(https://github.com/svcdevelopteam/sovitssvc,前段时间很火的 AI 孙燕姿就与其相关)。 4 月 25 日的消息: Synthesia 推出新型虚拟数字人 Expressive1,能通过脚本预测表情,数字人可自动解析和理解文本情绪,实现表情和声音同步。链接:https://x.com/imxiaohu/status/1783505405488054433 360 AI 浏览器新版增加了视频总结、提问、转录和翻译功能,支持本地和网络视频的内容分析,但无法提取无对白视频摘要。链接:http://browser.360.cn/ai https://x.com/imxiaohu/status/1783495437422649719 全球最大 AI 知识库“通往 AGI 之路”网站访问量突破 1000 万,网站内容丰富,旨在推动 AI 知识的普及。链接:http://WaytoAGI.com https://x.com/imxiaohu/status/1783475002815471669 日本横须贺市使用 AI 技术克隆市长,用于发布英语信息,技术应用广泛,包括灾难信息传播和旅游信息发布。
2024-09-12