直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

24小时内中国AI医美最新消息

回答

以下是为您找到的关于中国 AI 医美的相关消息:

有一个将 AI 和中医结合的项目,其先是用摄像头观察患者的口腔和舌苔,再用指尖传感器号脉,然后根据观测的数据生成选择题让患者作答,最后 AI 会生成药方。该项目目前应用在辅助看诊,能够提高诊疗效率,创始人的愿景是在未来实现 24 小时独立问诊开药。

但目前没有关于 24 小时内中国 AI 医美最新消息的准确和详尽内容。要获取最新的信息,您可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

问:最新的国内大模型排名

中国国内的大模型排名可能在短时间内会有变化,作为AI机器人无法提供最新的信息。要获取最新的中国国内大模型排名,你可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台,这些渠道通常会及时发布最新的排名和评价。在通往AGI之路的知识库里,在[AI研究报告版块](https://waytoagi.feishu.cn/wiki/WvhZwk16WiEnSvk8AcpcdZetnMe?table=tblzSv68AMuLhHj8&view=vewwFuhGE0)-[企业及媒体报告](https://waytoagi.feishu.cn/wiki/WvhZwk16WiEnSvk8AcpcdZetnMe?table=tblzSv68AMuLhHj8&view=vewwFuhGE0)会定期更新相关的排名报告,可以供您查阅。内容由AI大模型生成,请仔细甄别。

医学: 中医应用

[刚看了一个粉丝的项目它是把AI和中医结合在一起这个项目就是先用摄像头观察患者的口腔和舌苔](https://b.jimmylv.cn/?tab=Article&t=0.05)[再用指尖传感器耗脉然后根据观测的数据在出入名上生成选择题让患者作答](https://b.jimmylv.cn/?tab=Article&t=6.67)[最后AI会生成药方创始人说他们用了上百本中医教材一千多种常见病的临床数据](https://b.jimmylv.cn/?tab=Article&t=12.10)[和三百多个三甲医院中医的药方数据做AI训练所以这个AI中医开出的方子和三甲医院中医基本一致](https://b.jimmylv.cn/?tab=Article&t=18.86)[这个项目目前应用在辅助看诊可以有效的提高诊疗效率创始人说他的愿景是在未来实现](https://b.jimmylv.cn/?tab=Article&t=27.89)[24小时独立问诊开药](https://b.jimmylv.cn/?tab=Article&t=34.46)这里只是提供一个思路,不是推荐这个应用。不建议大家付费使用

AI 产品案例严选

|标题|简介|作者|分类|前往查看👉|封面|入库时间|<br>|-|-|-|-|-|-|-|<br>|医学:中医应用|该项目将人工智能与中医结合,通过观察口腔、舌苔和抓脉,生成选择题,让患者作答,最后AI会生成药方。目前用于辅助看诊,提高诊疗效率。愿景是未来实现24小时独立问诊开药。||工作|[医学:中医应用](https://waytoagi.feishu.cn/wiki/DvrTwqdylijhRxk3HmtcQ3qenFe?table=tblwdvsWICkId67f&view=vewm6DMY99)||2023/10/31|<br>|数据:数据分析prompt|castordoc(做数据发现、数据治理的一家公司)整理的适合数据团队日常使用的prompt案例||工作|[数据:数据分析prompt](https://waytoagi.feishu.cn/wiki/T7bVwK9ctiDK4YkEVhWcGvd6nFf?table=tblwdvsWICkId67f&view=vewm6DMY99)||2023/10/31|<br>|工作流:成为生产力工具|介绍了自己平时是怎么用ChatGPT帮助成为生产力工具的|进击的盖茨比|工作|[工作流:成为生产力工具](https://waytoagi.feishu.cn/wiki/VuhJwClKBiY3Dyk98yWcSdeNnlb?table=tblwdvsWICkId67f&view=vewm6DMY99)||2023/10/31|

其他人在问
AI知识库工具
以下是为您提供的关于 AI 知识库工具的相关信息: WayToAGI(通往 AGI 之路): 这是由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。 大家贡献并整合各种 AI 资源,让人们能轻松学习 AI 知识,应用各类 AI 工具和实战案例。 提供一系列开箱即用的工具,如文生图、文生视频、文生语音等的详尽教程。 追踪 AI 领域最新进展并时刻更新,无论您是初学者还是行业专家,都能在此发掘有价值的内容。 网址:https://waytoagi.com/ 体验链接:https://waytoagi.com/ 知识库在 AI 模型中的作用: 知识库就像 AI 的“活字典”,是一个非常贴切的比喻。 能解决 AI 知识“过期”的问题,AI 可随时从更新的知识库中检索相关信息,给出更准确的回答。 例如可建立包含最新新闻、科技发展、法律法规等内容的知识库,让 AI 回答最新事件的问题。 像热门的 AI 搜索,就是将整个互联网的实时数据作为知识库,通过搜索引擎获取最新信息。 产品经理 AI 工具集: 用户研究、反馈分析:Kraftful(kraftful.com) 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 画原型:Uizard(https://uizard.io/autodesigner/) 项目管理:Taskade(taskade.com) 写邮件:Hypertype(https://www.hypertype.co/) 会议信息:AskFred(http://fireflies.ai/apps) 团队知识库:Sense(https://www.senseapp.ai/) 需求文档:WriteMyPRD(writemyprd.com) 敏捷开发助理:Standuply(standuply.com) 数据决策:Ellie AI(https://www.ellie.ai/) 企业自动化:Moveworks(moveworks.com)
2024-11-22
我想做ui设计来模仿微信做一个app,想找各种图标素材 怎么用ai找这些素材
以下是使用 AI 找模仿微信做 App 所需图标素材的方法: 1. 对于直播礼物风格图标:可以在素材网站上找到喜欢的 icons 风格,然后喂图给 Midjourney 机器人,并加上关键词,如“喂图 + 耳机图标等。 2. 对于主题应用 icons:使用关键词“icon design,light texture,glow,Dribbble,3D,frostedglass effect,3d,ui,ux,–upbeta –q 2 –v 4”。 3. 对于 B 端图标:可以喂图加上关键词“A data icon,blue gradient frosted glass,frostedglass building,white transparent technology sensewhite city building scene,data line link,chip,OCrenderer,big data,industrial machinery,high detailight gray background with simple linear details,studio lighting,3d,c4d,pure white background,8k”。 4. 对于音乐软件 UI 设计:使用关键词“music app ui design,ux design,white,light,bright,data,modern,smooth,behance,dribbble,–upbeta –q 2 –v 4”。 需要注意的是,Midjourney 生成的图片可能在某些方面不够规范或完善,只能作为风格参考。
2024-11-22
怎么用ai写脚本
以下是关于如何用 AI 写脚本的一些指导: 首先,明确您要写的故事类型和来源。故事来源可以有两种路径: 1. 原创(直接经验):包括您或您周围人的经历、您做过的梦、您想象的故事等等。 2. 改编(间接经验):比如对经典 IP、名著、新闻进行改编或二创。 在剧本写作方面: 编剧是有一定门槛的手艺,不能单纯依赖剧作理论和模板,而应先大胆地写和实践,再结合看书学习,不断总结经验。对于短片创作,由于篇幅较小、情节和角色相对简单,可以从自己或朋友的经历改编入手,或者对触动您的短篇故事进行改编。多与他人讨论您的故事,有助于修改和进步。 如果您想用 AI 把小说做成视频,大致的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说,提取关键场景、角色和情节。 2. 生成角色与场景描述:利用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:借助 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,并添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,提升视频质量。 8. 审阅与调整:观看视频,根据需要调整某些场景或音频。 9. 输出与分享:完成编辑后,输出最终视频并在所需平台分享。 需要注意的是,具体操作步骤和所需工具可能因项目需求和个人偏好有所不同,AI 工具的可用性和功能也可能变化,建议访问相关工具网址获取最新信息和使用指南。 另外,对于担心 AI 削弱孩子思考力的问题,如果使用方法正确,AI 反而能助力拓展思维边界。比如将提问方式从封闭性改为开放性,或者让 AI 帮助提出更多拓展思考的问题。在 AI 辅助写作文时,可以让孩子提交与 AI 共同完成作文的聊天记录,重点关注孩子能否说清 AI 作文的优缺点以及如何修改。
2024-11-22
如何起步开始学习ai设计
以下是关于如何起步开始学习 AI 设计的一些建议: 1. 阅读相关文章: 如 ,了解市场动态和生成式 AI 商业模式的相关问题。 ,认识到尽早学习的重要性,避免被其他熟练掌握 AI 动力设计技巧的设计师超越。 ,了解设计的当前状态、常见问题及实用技巧。 ,学习最佳实践和利用 UX 策略使 AI/ML 系统更易于解释和透明。 2. 利用工具: 了解星流一站式 AI 设计工具,在入门模式下,熟悉右侧生成器的图片参考部分,如快速参考、风格迁移、Tile 分块、重新上色等功能。 掌握基础模型,包括星流通用大模型及基础模型 F.1、基础模型 XL、基础模型 1.5 等,了解它们在效果和生成速度上的差异。 了解增强模型,可通过收藏、查看例图和选择风格等方式进行使用。
2024-11-22
给初学者介绍AI的PPT
以下为为初学者介绍 AI 的相关 PPT 资源: 1. 《和 Cursor AI 一起学 Python 编程》 分享者:B站 PPT 链接: 在线代码:https://bohrium.dp.tech/notebooks/86124619178/update 课程大纲:和 AI 一起学 Python 编程——面向研究生初学者 总课时:10 月 16 日,4 节课,每节 45 分钟 讲课者:Xiangyu Chen(清华大学数据科学博士生)、Wenju Tang(北京大学语言学博士) 业界助教:Wenhao Guo(杭州某电商公司 NLP 工程师) 2. 《给小白的 AI 产品推荐》中的 PPT 类产品 国内:爱设计 PPT 推荐理由: 背后拥有实力强大的团队,技术过硬且对市场需求有敏锐洞察力。 成功把握住 AI 与 PPT 结合的市场机遇。 已确立市场领先地位,代表当前国内 AI 辅助 PPT 制作的最高水平。 3. 微软 AI 初学者入门课程 译者:Miranda 课程原网址:https://microsoft.github.io/AIForBeginners/ 课程内容:涵盖符号人工智能、神经网络、计算机视觉、自然语言处理等,适合初学者,覆盖 TensorFlow、PyTorch 及人工智能伦理原则。
2024-11-22
可以根据照片生成人物的AI软件
以下是一些可以根据照片生成人物的 AI 软件: PhotoMaker:可以根据文字描述生成人物照片,能混合不同人物特征创造新形象,还能改变照片中人物的性别、年龄。访问链接:https://photomaker.github.io ,https://x.com/xiaohuggg/status/1746861045027869072?s=20 HeyGen:通过上传照片或文字提示,即可生成个性化 AI 数字形象视频。支持自定义肢体动作、服装、背景、年龄、性别等特征。仅需 1 分钟即可生成包含脚本、声音和情感表达的数字人视频。访问链接:https://x.com/imxiaohu/status/1852317866038809035
2024-11-22
2024年AI公司全景图
以下是 2024 年 AI 公司的相关信息: AI 产业的产业链结构大致分为上游的基础设施层(数据与算力)、中游的技术层(模型与算法)、下游的应用层(应用与分发)。但未找到一张满意的展示上中下游重点企业(或产品)的图,若您对图中不了解的公司/平台(或产品),建议搜索了解。 2024 年美国融资金额超过 1 亿美元的 AI 公司(截止 2024.10.15): Zephyr AI:20240313 融资 1.11 亿美元,A 轮,主营 AI 药物发现和精准医疗。 Together AI:20240313 融资 1.06 亿美元,A 轮,主营 AI 基础设施和开源生成。 Glean:20240227 融资 2.03 亿美元,D 轮,主营 AI 驱动企业搜索。 Figure:20240224 融资 6.75 亿美元,B 轮,主营 AI 机器人。 Abridge:20240223 融资 1.5 亿美元,C 轮,主营 AI 医疗对话转录。 Recogni:20240220 融资 1.02 亿美元,C 轮,主营 AI 接口解决方案。 2024 年的一些 AI 发展趋势: AI 将引领“智能即服务”的新服务模式,重塑工作和生活,重新赋能芯片和云计算行业,GPU 需求预计持续增长。 企业软件、AI 驱动的金融服务以及 AI 健康技术成为吸引投资的主要领域,机器人行业投资额超过企业软件。 科技巨头通过资本控制 AI 模型公司的趋势明显。 企业竞争策略分化,大模型争霸,OpenAI、Gemini、Anthropic、LLama 以及来自法国的 Mistral 是市场上备受瞩目的公司。
2024-11-20
2024年11月,AI圈都发生了哪些大事
2024 年 11 月,AI 圈发生了以下大事: 11 月 1 日: 《》来自南乔,10 月 AI 行业大事件盘点包括多家公司的重要发布和创新,如 OpenAI 推出多项新功能,字节发布 AI 智能体耳机,以及各大模型的开源。趋势方面,强化学习被认为是推动 AGI 发展的关键技术,原生多模态模型逐渐成为研究热点。新兴应用如 AI 音乐创作、翻译和智能助手等受到关注,整体呈现出技术与应用的快速发展态势。 《》来自歸藏,10 月份美国 AI 聊天机器人市场报告显示,ChatGPT 仍是市场领导者,但份额逐渐下降。谷歌和微软在争夺第二的位置,Perplexity 和 ClaudeAI 则实现高速增长,正在从 ChatGPT 和 Gemini 手中蚕食市场份额。总体来看,专业 AI 工具的增长势头强劲,而初创公司的用户获取相对缓慢。 《》比尔・盖茨在采访中讨论了人工智能的革命性影响,认为 AI 将使每个人都能成为“超级个体”,改变人机交互方式。他强调 AI 将显著降低白领工作的成本,并逐渐影响蓝领市场。盖茨还提到他对全球健康和气候问题的关注,认为技术创新速度超出预期,未来 20 年将是充满希望的时期。他同时探讨了可再生能源的发展,尤其是核能和太阳能的潜力。 11 月 7 日: 《》Marc Andreessen 强调,真正的变革性技术必须从产品设计之初就深度融入,而不是简单地在现有产品上添加 AI。他指出,AI 作为一种新型计算机,能够以概率方式输出结果,带来无限创造力。AI 将在多个行业引发重大变革,尤其是在生物科技和金融等领域,初创公司有机会重新定义产品类别,摆脱传统束缚。 《》前 OpenAI 研究员 Alexey Guzey 在 2017 至 2024 年间对人工智能(AI)发展的看法变化。他最初认为实现通用人工智能(AGI)需要数十年,但后来逐渐意识到大型语言模型(LLM)实际上并不具备真正的思考能力。阅读几年间他的心路历程,是非常好的求索经历。 《》在 10 月的总结中,Orange AI 反思了创业的艰辛,强调创业最难的是人和信任。创业者需找到优秀团队,并相信自己和他人。此外,利益分配在企业盈利后成为关键问题,需要坦诚沟通。10 月关注了 AI 搜索、音频、视频生成和编码等主题,并参与了多个活动,收获颇丰。 此外,还有关于 AI 在未来一年的 10 个预测: 一个主权国家向美国大型人工智能实验室投资 100 亿美元以上,需要国家安全审查。 没有任何编码能力的人独自创建的应用程序或网站将会迅速走红(例如 App Store Top100)。 案件开始审理后,前沿实验室对数据收集实践实施有意义的改变。 由于立法者担心权力过度,欧盟人工智能法案的早期实施最终比预期更为缓慢。 OpenAl o1 的开源替代品在一系列推理基准测试中超越了它。 挑战者未能对 NVIDIA 的市场地位造成任何重大打击。 由于公司难以实现产品与市场的契合,对人形机器人的投资水平将会下降。 苹果设备上研究的强劲成果加速了个人设备上 AI 的发展势头。 人工智能科学家撰写的研究论文被大型机器学习会议或研讨会接受。 一款以与 GenAI 元素交互为基础的视频游戏将取得突破性进展。
2024-11-16
在comyui中,使用flux1-dev模型24g显存够吗
在 ComfyUI 中使用 Flux1dev 模型,24G 显存是可以的,但建议内存尽量高于 32G 以避免意外情况的发生。如果您的显卡是 24G 或更高,右键 24G 那个 train_flux_24GLora 的文件。修改脚本路径和参数时,要注意底模路径、VAE 路径、数据集路径,还有下面的 clip 路径和 T5xxl 路径的正确填写。ae.safetensors 和 flux1dev.safetensors 的下载地址为:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。flux 相关模型(体积较大)的夸克网盘链接:https://pan.quark.cn/s/b5e01255608b ,百度网盘链接:https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码:ub9h 。如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,下载地址:https://huggingface.co/Kijai/fluxfp8/tree/main 。最后下载 dev 的工作流: ,或者使用官方原版的图片链接 https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png ,打开 ComfyUI 把工作流或图片拖拽到其中即可。
2024-11-12
2024年11月11日世界AI新闻有哪些
以下是 2024 年 11 月 1 日至 11 月 8 日的部分世界 AI 新闻: 11 月 1 日: 《》来自南乔,10 月 AI 行业大事件盘点包括多家公司的重要发布和创新,如 OpenAI 推出多项新功能,字节发布 AI 智能体耳机,以及各大模型的开源。趋势方面,强化学习被认为是推动 AGI 发展的关键技术,原生多模态模型逐渐成为研究热点。新兴应用如 AI 音乐创作、翻译和智能助手等受到关注,整体呈现出技术与应用的快速发展态势。 《》来自歸藏,10 月份美国 AI 聊天机器人市场报告显示,ChatGPT 仍是市场领导者,但份额逐渐下降。谷歌和微软在争夺第二的位置,Perplexity 和 ClaudeAI 则实现高速增长,正在从 ChatGPT 和 Gemini 手中蚕食市场份额。总体来看,专业 AI 工具的增长势头强劲,而初创公司的用户获取相对缓慢。 《》比尔・盖茨在采访中讨论了人工智能的革命性影响,认为 AI 将使每个人都能成为“超级个体”,改变人机交互方式。他强调 AI 将显著降低白领工作的成本,并逐渐影响蓝领市场。盖茨还提到他对全球健康和气候问题的关注,认为技术创新速度超出预期,未来 20 年将是充满希望的时期。他同时探讨了可再生能源的发展,尤其是核能和太阳能的潜力。 11 月 8 日: 《》由上海外国语大学图书馆发布,探讨了 AI 素养在数智时代的重要性和演变。报告指出,AI 素养不仅涉及技术知识,还包括态度、价值观和应对复杂需求的能力。随着 AI 技术的广泛应用,社会对 AI 素养的需求日益增长。 其它一些报告发布在: AIGCxChina 研究院、无界 AI:《》 《》(英文) 《》 请注意,这只是部分新闻,可能还有其他未涵盖的内容。
2024-11-11
联想异能者配置i5-12450八核,32GB内存,1TB固态硬盘,用于本地部署开源大模型可以部署哪些开源大模型
以下是一些您的联想异能者配置(i512450 八核,32GB 内存,1TB 固态硬盘)可部署的开源大模型及相关信息: ComfyUI 相比 WebUI 配置更低,系统资源占用更少,出图速度更快。ComfyUI 最低可在小于 3G 的 GPU 上运行,甚至没有 GPU 光用 CPU 也可以运行,但速度极慢。SDXL 出来后提高了运行配置,最低需要 8GB 显存+32GB 运行内存,12GB 流畅运行,推荐 16GB 以上。玩 SDwebui 和 ComfyUI 建议使用 6GB 以上的显存的 NVIDIA 显卡(N 卡),内存在 16G 以上。硬盘会影响加载模型的速度,所以最好把软件和模型部署在 SSD(固态硬盘)上。 截止 2024 年 5 月,主流的 AI 笔记本电脑主要是一些专门为人工智能和深度学习设计的高性能移动工作站。一些知名品牌包括微软第 11 代 Surface Pro、微星 Creator/Workstation 系列、技嘉 Aero/Aorus 系列、戴尔 Precision 移动工作站、惠普 ZBook 移动工作站、联想 ThinkPad P 系列。这些笔记本通常配备强大的 GPU(如 NVIDIA RTX 系列)、大容量内存(32GB 以上)和高速固态硬盘,还通常预装了 NVIDIA CUDA、cuDNN 等深度学习框架,以及各种 AI 开发工具。但这类高端 AI 笔记本价格相对较高,通常在 2000 美元以上。用户可根据自身需求和预算选择合适型号,并关注散热、续航等实际使用体验。 请注意,配置上不封顶,您可根据自己的需求和预算来选择。
2024-11-04
State of AI 2024 报告
以下是关于《State of AI 2024》报告的相关信息: 该报告由来自剑桥大学的 AI 风险投资公司 Air Street Capital 创始人兼 CEO Nathan Benaich 和来自牛津大学的 Air Street Capital 平台负责人 Alex Chalmers 共同发表。 报告主要围绕人工智能(AI)领域的最新进展、政治动态、安全挑战及未来预测几大方面进行说明。 报告中的关键要点包括:OpenAI 的 o1 模型在数学、科学和推理方面重新定义了 AI 的极限;中国的 AI 模型在面对制裁时表现出色;生成式 AI 的初创公司获得巨大收益,但可持续性仍存在问题。 报告每年 10 月份发布,对未来 12 个月有 10 大预测,例如某主权国家将向一家美国大型 AI 实验室投资超 100 亿美元并引发国家安全审查等。报告链接为:
2024-11-04
chatpgt有什么最新消息
以下是关于 ChatGPT 的一些最新消息: Gradio 发布了 Gradio Discord Bot,允许在 Discord 服务器中使用 Spaces 中的演示进行语言翻译、文字转语音、文字生成图像等。 Hugging Face 现在可以使用 Docker Spaces。 OpenAI 预测到 2024 年收入将达到 10 亿美元。 ChatGPT 推出了更新,现在可以查看以前的历史对话。 2024 年 1 月 27 日,ChatGPT 又更新了,推出了新的 Mention 功能,可以在聊天窗口中通过@直接召唤任何 GPTS。 2024 年 4 月 26 日,ChatGPT 更新,正式推出个性化新功能,可以记住用户过去提到的内容,用户可自行决定要记住什么。
2024-09-26
24小时内中国AI前沿科技最新消息
以下是 24 小时内中国 AI 前沿科技的最新消息: 阿里 CEO 吴泳铭表示将开源国内最大 720 亿参数模型。 京东 CEO 称正在测试 AI 自动生成营销内容。 此外,还有一些国际上的 AI 相关消息: 苹果新专利:CGR 技术生成虚拟形象,展示穿戴效果。 微软 AI 专利:充当治疗师,疏导心理问题。 苹果改造 Siri:明年或用大语言模型。 谷歌 Open Se Cura:为 Pixel 带来低功耗 AI。 微软计划:AI 助手 Copilot 将进入 Windows 10。 亚马逊成立 AI 训练团队,投资数百万美金。 ChatGPT 持续宕机,CEO 道歉。 GitHub Universe 2023 新功能:新的 Copilot 聊天功能,Copilot 支持手机应用,GitHub Copilot Workspace,产问题查询 GitHub Copilot 企业版:每月 39 美元的高级服务。GitHub Copilot 合作伙伴计划,GitHub 高级安全功能。
2024-09-17
AI 数字人最新消息
以下是关于 AI 数字人的最新消息: 目前业界对于数字人的定义尚未统一,一般可根据技术栈分为真人驱动和算法驱动两类。算法驱动数字人的相关开源代码有很多,如 ASR 语音识别方面的 openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition,这是一个语音识别的接口集合,包含不同实现的语音识别接口)。AI Agent 大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可使用 LangChain 的模块进行自定义(https://www.langchain.com/)。TTS 方面,有微软的 edgetts(https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费)、VITS(https://github.com/jaywalnut310/vits)以及专注于唱歌的 sovitssvc(https://github.com/svcdevelopteam/sovitssvc,前段时间很火的 AI 孙燕姿就与其相关)。 4 月 25 日的消息: Synthesia 推出新型虚拟数字人 Expressive1,能通过脚本预测表情,数字人可自动解析和理解文本情绪,实现表情和声音同步。链接:https://x.com/imxiaohu/status/1783505405488054433 360 AI 浏览器新版增加了视频总结、提问、转录和翻译功能,支持本地和网络视频的内容分析,但无法提取无对白视频摘要。链接:http://browser.360.cn/ai https://x.com/imxiaohu/status/1783495437422649719 全球最大 AI 知识库“通往 AGI 之路”网站访问量突破 1000 万,网站内容丰富,旨在推动 AI 知识的普及。链接:http://WaytoAGI.com https://x.com/imxiaohu/status/1783475002815471669 日本横须贺市使用 AI 技术克隆市长,用于发布英语信息,技术应用广泛,包括灾难信息传播和旅游信息发布。
2024-09-12
AI数字人的最新消息
以下是关于 AI 数字人的最新消息: 4 月 25 日,Synthesia 推出新型虚拟数字人 Expressive1,能通过脚本预测表情,可自动解析和理解文本情绪,实现表情和声音同步。链接:https://x.com/imxiaohu/status/1783505405488054433 11 月 7 日,百度虚拟数字人“度晓晓”携文心一言入驻淘宝。链接:https://x.com/xiaohuggg/status/1721876724798136544?s=20
2024-09-12
ai最新消息
以下是 11 月 7 日的 AI 最新消息: 马斯克 xAI 公司宣布推出 PromptIDE 开发工具。 阿里云 A100 服务器业务暂停出租,算力价格飞涨。 微软发布 7 款针对对话优化的 AI 语音,更加逼真自然。 谷歌正测试 2 项 AI 功能,以改善 YouTube 观看体验。 微软将 AI 引入 Xbox,可生成 AI 角色、故事剧情等。 英国一学校启用人工智能担任校长,帮助教师了解学生。 百度虚拟数字人「度晓晓」携文心一言入驻淘宝。 美团推出 AI 产品 Wow 定位 AI 朋友社区。链接:https://x.com/xiaohuggg/status/1721876724798136544?s=20 当前 AI 前沿技术点包括: 1. 大模型(Large Language Models):如 GPT、PaLM 等。 2. 多模态 AI:视觉语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:元学习、一次学习、提示学习等。 5. 可解释 AI:模型可解释性、因果推理、符号推理等。 6. 机器人学:强化学习、运动规划、人机交互等。 7. 量子 AI:量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。
2024-08-07