Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

WayToAGI是什么?是哪家厂商做的?

Answer

WaytoAGI 直译就是通往 AGI 之路,它是一个自组织的AI社区,发起人是 AJ 和轻侯。AGI 指通用人工智能。

Content generated by AI large model, please carefully verify (powered by aily)

References

彭青云: 2050见闻故事连载..

waytoagi是什么?waytoagi直译就是通往AGI之路,那什么是AGI?通用人工智能,也叫强人工智能,通常这玩意出现时也就是奇点科技大爆炸的那一刻,科技推动文明呈指数级增长。也许在5年后,也许在2035年,也许在2050年。通往通用人工智能的路也许还很长,但它已如海那边吹过来的风,还没有看到大海,就已闻到潮湿腥咸的味道。未来已来,像盛夏的大雨,在我们还不及撑开伞时就扑面而来——科幻作家刘慈欣语(很多人早就失业了)。那么,投名状是什么?好汉们加入梁山前要准备一份见面礼,表其诚意。在今天,你认识一个新朋友,或融入新团体,用心的小礼物总能快速的拉近彼此的距离。4月初的某天夜里,我对象向我推荐了飞书对话《通往AGI之路》的长视频,彼时的我正处在被AI代替的焦虑中,刚做完某厂的单子。无意义反复的修改实在让人身心疲惫,精力耗尽的人不由自主地就会在短视频,信息流中越陷越深难以自拔。她很兴奋的推荐给了我,她说你不是对AIGC感兴趣吗?这个AJ他们做的AI知识库可厉害了,他们都是从兴趣出发兼职做的,AJ这个人好有趣,可有激情了。

WaytoAGI近期活动备份

8月1日更新【线下⬇️】Founder Park[AGI Playground](https://mp.weixin.qq.com/s/GxEMDxak0V7VgsAFPIY_oA)|6.22-6.23|北京朝阳,751园区2天高密度,行业顶配、大佬聚集,你不可错过的年度AGI大会李大海、Troy Cui、王长虎、汪华、王小川、杨建勃、阳萌、杨植麟、赵霏……面壁智能、亚马逊、爱诗科技、创新工场、百川智能、可以科技、安克创新、月之暗面、Google……WaytoAGI专属[购票](https://mp.weixin.qq.com/s/GxEMDxak0V7VgsAFPIY_oA)优惠:全票种八折:WH87 Workshop七折:YP9X

音乐创作指南

写给朋友的,他说他听着摇起来了|分享人:Noah参加校园原创歌手大赛都够了|分享人:陈浚嘉/Kino抽到一个奇怪的卡|<br>|分享人:绛烨风格:古风唯美、文艺范专辑:与光同尘|歌名:《WaytoAGI》制作人:银海风格:活泼、向上、充满活力与希望,燃起来了🔥自己心中的WaytoAGI,已单曲循环100遍+|分享人:京港梁半仙|<br>| https://app.somebodysuno.ai/song/b504c6cf-4a1b-4616-b749-f1b701c7a7c5分享人图图,Suno 4月1日热榜| https://app.suno.ai/song/43114f68-e415-4d4b-a8be-dc004a4e7ad4 https://app.suno.ai/song/93c7b62d-2b83-4bfc-9bf3-5ea68fc74b74写给我1周岁儿子的儿歌(AI代劳)分享人:Zora| https://suno.com/song/dfc05bcb-027d-48b8-aea6-c5c96991f1fe分享人:瑞奇唐风格:流行音乐|<br>|https://suno.com/song/05d97cdb-3f5f-4e36-85d4-e308c99503fb |电影bgm高潮(1分20秒到2分12秒最佳)链接:https://suno.com/song/c6f141db-12e1-4d0a-9f42-c63625015252分享人星启|企业宣传片bgm链接:https://suno.com/song/f9c99ddc-05b3-41fb-b720-0367e13fe1b7分享人星启|<br>|||超燃古典史诗级bgm链接:https://suno.com/song/fba0e94e-fbdf-4175-a4c1-b4a321605cae分享人星启|

Others are asking
我指的是用AI来辅助小红书内容的优化方面,我应该在WaytoAGI中学习什么内容?
在 WaytoAGI 中,您可以学习以下与用 AI 辅助小红书内容优化相关的内容: 1. 智能纪要中的数据转化与创作提示词工具:包括从数据到模型的转化过程,以及基于 AGI 特调的生成 MJ 和 SD 提示词的工具扣子,还有利用这些工具生成山海经神兽等创作提示词的方法和迭代优化方式。 2. 人文数据转化的不同层面:了解数据转化成模型的结构过程和情感层面的结构,以及人类世界人文价值对齐翻译对 AI 发展的重要性。 3. 关于神兽提示词创作及相关工具的交流:如社区建立种子群收集知识库,推荐表现力好的提示词组等。 4. 相关社区及平台的介绍:例如嘟嘟社区的现状,以及在队友平台上跑效果图等。 5. 开展的创作挑战活动:如 10 分钟神兽提示词创作挑战,包括挑战方式、成果检验和配方获取等。 6. 第 11 期 Video Battle AI 视频挑战活动:包括选题参考,如 AI 视频领域国内外近期热点话题事件、技术工作流拆解等;话题要求,如小红书内容文案需附特定字样和带特定标签;大赛主题和创意支持,以及视频工具建议等。 希望以上内容对您有所帮助。
2025-03-07
怎么可以通过好好利用“waytoagi”生成视频?从文字到图片最后到视频?具体可以用到哪些工具?
以下是关于如何通过“waytoagi”从文字生成视频以及相关工具的介绍: 在视频制作中,对于规避多人脸崩的镜头,AI生成多人脸易崩,可借助工具修复,如放大工具。终极解决办法是抽出有问题的帧进行修复,但时间成本高,也可换脸,但存在光影和边缘模糊等问题。 解决文字糊掉的问题,推荐使用将 2D 图片转成 3D 效果的工具,用可灵也能在很大程度上保持文字不变。 视频补帧一般使用 top video 黄玉,美图工具 still 可氪金提升视频帧率和画质,但对显卡要求高。 处理团队意见分歧,在传统片子和 AI 片子中,若对镜头或节点分歧较大,一般听写本子和拆分镜的人的意见。 扩图工具可用吉梦扩图,一次只需一个积分,操作方便,如上传图片后调整尺寸和扩图范围。 去水印工具如 HID 工具,还有很多其他去水印工具可选择。 利用现有工具生成艺术字和图片的流程:先点导入参考图,选择免费无版权且字体不太细的字,通过设置边缘轮廓或景深、参考程度、添加关键词等生成,还可进行细节修复和超清放大。利用参考图改变生成效果,参考程度可影响生成结果,不同风格的参考图能带来不同效果。生成视频和首尾帧,多生成几张图制作视频,通过首尾帧让图片有变化效果,但要注意写好提示词。同时,收集参考图时注意版权,可先在其他地方生成保存再当参考图。 以下是一些文字生成视频的 AI 产品: Pika:擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看: 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-06
wayToAGI 是个什么样的网站
WaytoAGI 网站是一个在 AI 领域为用户提供多种功能的网站,具有以下特点和功能: 1. 和 AI 知识库对话:用户可以在此询问任何关于 AI 的问题。 2. AI 网站:集合了精选的 AI 网站,方便用户按需求找到适合的工具。 3. AI 提示词:集合了精选的提示词,可复制到 AI 对话网站使用。 4. 知识库精选:将每天知识库的精华内容呈现给大家。 WaytoAGI 网站和 WaytoAGI 知识库相互关联又各自独立,希望成为用户学习 AI 路上的好助手。 其愿景和目标是让每个人在学习 AI 的过程中少走弯路,让更多的人因 AI 而强大。网站提供了全面系统的 AI 学习路径,帮助用户了解从 AI 常见名词到 AI 应用等各方面知识,并引发用户思考“我可以用 AI 做什么,帮助自己更强大”。 此外,WaytoAGI 还有以下相关渠道: 1. 公众号:通往 AGI 之路。 2. 内置知识库 AI 助手。 3. B 站:以视频普及 AI 知识。 4. 小红书:及时传递 AI 消息。 5. X(Twitter):同步知识库精选内容。
2025-03-06
如何用waytoAGI
以下是关于如何使用 WaytoAGI 的详细介绍: 1. 加入飞书群:您可以在 WaytoAGI 飞书知识库首页找到加入飞书群的链接(最新二维码请在获取),然后点击加入,直接@机器人即可。 2. 在网站首页提问:您可以在 WaytoAGI.com 的网站首页,直接输入您的问题,即可得到回答。 3. 点开链接查看:不用注册,不用花钱,直接点就能看。 4. 按需求选择内容:比如您想学 AI 绘画,就去看“AI 绘画”部分;想找 AI 工具,就去“工具推荐”部分。内容分得清清楚楚,想学啥都能找到。 5. 从特定板块开始:以 Agent 板块为例,您可以从下往上看,一个一个点进去查看相关视频。比如链接:。 如果您看了还有不懂的,或者想跟别人交流,可以加入社群,大家一起讨论。WaytoAGI 是一个帮助您快速入门 AI、学会用 AI 搞事情的“武器库”,无论您是小白还是想靠 AI 赚钱,都能从中受益。
2025-03-05
在 WaytoAGI 的工具网站上列出的文字转语音工具, 哪个是最适合生成中文语音的?
在 WaytoAGI 的工具网站上,以下几个文字转语音工具在生成中文语音方面各有特点: 1. Eleven Labs:https://elevenlabs.io/ 是一款功能强大且多功能的 AI 语音软件,能高保真地呈现人类语调和语调变化,并能根据上下文调整表达方式。 2. Speechify:https://speechify.com/ 是一款人工智能驱动的文本转语音工具,可作为多种平台的应用使用,能将文本转换为音频文件。 3. Azure AI Speech Studio:https://speech.microsoft.com/portal 提供了支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供了自定义的语音模型。 4. Voicemaker:https://voicemaker.in/ 可将文本转换为各种区域语言的语音,并允许创建自定义语音模型,易于使用。 此外,还有免费的 GPTSoVITS 和 BertVITS2 两个开源模型,它们也能很好地生成中文语音。这两个项目均免费且好用,直接找到需要的音色,输入文字点击“合成语音”生成后就能下载。 需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2025-03-05
waytoagi东西好多,我不知道从哪里看起
以下是关于如何使用 WayToAGI 知识库的指导: 1. 从 Agent 板块开始: 以 Agent 板块为例,链接: 。 用法:从下往上看,逐个点击,都有视频。 选择原因:共学都有视频,是从注册开始的手把手教学,多看几遍基本能保障调通一个工具、搭好一个 Agent。 注意事项:内容较多,点进去看看哪个工具您听过就从哪个工具开始,以免太累。 2. 看了一些视频之后: 链接: 。 用法:明确自己想看理论还是应用,找到导航,想看哪里点哪里。 备注:智能千帆、阿里云百炼有视频,其余部分没有。 注意事项:内容较多,要考虑聚焦,先挑一个,开始手把手一起做,只要开始用起来,就有可能达成目标。 3. 快捷方式: 点开链接就能看,不用注册,不用花钱,直接点这个链接就能看:点击 。 想看啥就看啥,比如想学 AI 绘画,就去看“AI 绘画”部分;想找 AI 工具,就去“工具推荐”部分,内容分类清晰。 有问题还能问,如果看了还有不懂的,或者想跟别人交流,可以加入社群讨论。 WayToAGI 是一个帮助您快速入门 AI、学会用 AI 搞事情的“武器库”。无论您是完全不懂 AI 的小白,还是想用 AI 赚钱的普通人,它都能提供帮助。AI 是未来的趋势,现在学习一点都不晚,如果您想了解 AI、用 AI、甚至靠 AI 搞钱,WayToAGI 就是您最该看的“AI 宝典”。
2025-03-04
sd是哪位大佬做的
SD 是 Stable Diffusion 的简称。它是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,于 2022 年发布的深度学习文本到图像生成模型,主要用于根据文本的描述产生详细图像。Stable Diffusion 是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model;LDM)。其代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行,当前版本为 2.1 稳定版(2022.12.7)。源代码库:github.com/StabilityAI/stablediffusion 。我们可以通过一系列的工具搭建准备,使用 SD 进行想要的图片 AIGC 。 此外,还有与 SD 相关的 Fooocus,它使用的是最新推出的 SDXL 1.0 模型,对 stable diffusion 和 Midjourney 做了结合升级。保留了 SD 的开源属性,可以部署到本地免费使用,在操作界面吸取了 Midjourney 简洁的特点,省去了 WebUI 中复杂的参数调节,让用户可以专注于提示和图像。配置要求为本地部署,需要不低于 8GB 的内存和 4GB 的英伟达显卡。Fooocus 介绍/安装包下载:https://github.com/lllyasviel/Fooocus 。 另外,在 Video Battle 视频挑战中,有一种方法是使用 SD 的分支版本 CONTROLNET 大佬开发的 Forge,特点是支持图生视频、图生 SD,而且对低端显卡支持良好。下载链接为:https://github.com/lllyasviel/stablediffusionwebuiforge/releases/download/latest/webui_forge_cu121_torch21.7z ,解压后,优先运行 update.bat 进行升级,然后再运行 run.bat ,接着就打开了和 SD 基本一模一样的界面。核心区别在于 FORGE 增加了 2 个王炸功能,SVD【图生视频】和 Z123【图生 3D】。
2025-03-06
怎么分辨那些事中国公司做的ai软件
要分辨哪些是中国公司做的 AI 软件,可以通过以下几个方面: 1. 查看相关的月度榜单,例如“AI 智库|月度榜单”,其中会明确列出公司所属的国家。 2. 关注公司的注册地和总部所在地信息。 3. 了解公司的创始人或 CEO 的国籍背景。 例如,在提供的榜单中,爱思软件、看见概念、尽微致广、同花顺、小冰公司、网易、恒图科技、生数科技、西湖心辰、网旭科技、秘塔网络、回响科技、稿定科技、ANSWER AI、奇点星宇等都是中国公司。
2025-03-05
waytoagi 的飞书知识库智能问答机器人是怎么做的
waytoagi 的飞书知识库智能问答机器人是基于飞书 aily 搭建的。在飞书 5000 人大群里内置了名为「waytoAGI 知识库智能问答」的智能机器人,它会根据通往 AGI 之路的文档及知识进行回答。 其具有以下功能和特点: 1. 自动问答:自动回答用户关于 AGI 知识库内涉及的问题,可以对多文档进行总结、提炼。 2. 知识搜索:在内置的「waytoAGI」知识库中搜索特定的信息和数据,快速返回相关内容。 3. 文档引用:提供与用户查询相关的文档部分或引用,帮助用户获取更深入的理解。 4. 互动教学:通过互动式的问答,帮助群成员学习和理解 AI 相关的复杂概念。 5. 最新动态更新:分享有关 AGI 领域的最新研究成果、新闻和趋势。 6. 社区互动:促进群内讨论,提问和回答,增强社区的互动性和参与度。 7. 资源共享:提供访问和下载 AI 相关研究论文、书籍、课程和其他资源的链接。 8. 多语言支持:支持多语言问答,满足不同背景用户的需求。 使用方法: 1. 在飞书群里发起话题时即可,它会根据 waytoAGI 知识库的内容进行总结和回答。 2. 可以在 WaytoAGI 飞书知识库首页找到加入飞书群的链接(二维码需在获取),然后点击加入,直接@机器人即可。 3. 也可以在 WaytoAGI.com 的网站首页,直接输入问题,即可得到回答。 搭建问答机器人的相关情况: 1. 2024 年 2 月 22 日的会议介绍了 WaytoAGI 社区的成立愿景和目标,以及其在飞书平台上的知识库和社区的情况。 2. 讨论了利用 AI 技术帮助用户更好地检索知识库中的内容,引入了 RAG 技术,通过机器人来帮助用户快速检索内容。 3. 介绍了基于飞书的知识库智能问答技术的应用场景和实现方法,可以快速地给大模型补充新鲜的知识,提供大量新的内容。 4. 讨论了如何使用飞书的智能伙伴功能来搭建 FAQ 机器人,以及智能助理的原理和使用方法。 5. 飞书智能伙伴创建平台(英文名:Aily)是飞书团队旗下的企业级 AI 应用开发平台,提供了一个简单、安全且高效的环境,帮助企业轻松构建和发布 AI 应用,推动业务创新和效率提升。为企业探索大语言模型应用新篇章、迎接企业智能化未来提供理想选择。
2025-02-20
Perplexity是谁做的
Perplexity 是由前 OpenAI 研究科学家 Aravind Srinivas 与前 Meta 研究科学家 Denis Yarats(Perplexity CTO)等合伙人共同创办的。它是一家专注于开发新一代 AI 搜索引擎的公司,创立于 2022 年 8 月。其搜索引擎采用了大型语言模型(LLM)技术,具有理解能力强、生成式回答、个性化和上下文感知等优势,但也存在训练成本高、可解释性差、潜在的偏差和不当内容等劣势。Perplexity 将 LLM 技术应用于搜索引擎领域,试图颠覆传统的基于关键词匹配的搜索范式,为用户提供更自然和智能的搜索体验,还融合了个性化和上下文感知等功能。
2025-02-20
PPT那款AI做的好
以下是一些好用的制作 PPT 的 AI 工具: 1. Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,适用于多种场合,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等,网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 此外,还有以下相关的 PPT 生成工具(网站): 1. https://zhiwen.xfyun.cn/ 讯飞智文 2. http://Mindshow.fun Markdown 导入 3. http://kimi.ai 选 PPT 助手,暂时免费效果好 4. http://Tome.app ,AI 配图效果好 5. http://Chatppt.com ,自动化程度高 6. https://wenku.baidu.com ,付费效果好 AI 辅助 PPT 的原理和作用包括: 1. 减轻排版工作的压力。 2. 生成打底的内容,减轻人写内容的工作。例如文章生成 PPT 时,让 AI 帮忙摘要内容,生成大纲列表;主题生成 PPT 时,让 AI 根据主题扩充成大纲列表,乃至具体内容。在特定场景下,如学生快速为小组展示配 PPT 时,可能不用修改直接使用。 网站把 AI 输出的文本丢给 LLM,让其根据内容在已有的 UI 组件中选择更适合的组件,按时间线为每页 PPT 的文字选出整个 PPT 中每一页的 UI 组件。有的网站,如 tome、gamma,配图也是由 GenAI 根据页面内容生成的。呈现 AI 生成的 PPT 结果后,用户不满意可以自行选择模版。 WPS AI 也能对 PPT 大纲进行优化和二次修改。
2025-02-19
当前哪些类型AI智能体做的好
当前在 AI 智能体领域,以下类型表现较好: 1. 在企业搜索、法律研究副驾驶、内容生成等类别中,Menlo Ventures 投资组合公司如是早期突破性的代表。 2. 领先的应用程序构建商如正在建立解决方案,处理之前只能由大量人力来解决的工作流程。 3. 从智能体类型来看: “决策智能体”设计使用语言模型遍历预定义的决策树。 “轨道智能体”为智能体配备更高层次的目标,限制解决空间,要求遵循标准作业程序并使用预先设定的“工具”库。 “通用人工智能体”完全依赖语言模型的推理能力进行所有的计划、反思和纠正。 此外,AGI 分为五个等级: 1. 聊天机器人:具备基本对话能力,依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者:具备人类推理水平,能解决复杂问题,如 ChatGPT。 3. 智能体:不仅具备推理能力,还能执行全自动化业务,但目前许多产品仍需人类参与。 4. 创新者:能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型。 5. 组织:最高级别,能够自动执行组织的全部业务流程。
2025-02-07
manus是哪家公司的产品
Manus 是一款由中国团队研发的全球首款通用型 AI 代理工具,于 2025 年 3 月 5 日正式发布。它区别于传统聊天机器人(如 ChatGPT),具备自主规划、执行复杂任务并直接交付完整成果的能力,被称为“首个真干活的 AI”。 Manus AI 代理工具的具体技术架构主要基于多智能体(Multiple Agent)架构,运行在独立的虚拟机中。这种架构通过规划、执行和验证三个子模块的分工协作,实现了对复杂任务的高效处理。其核心功能由多个独立模型共同完成,这些模型分别专注于不同的任务或领域,如自然语言处理、数据分析、推理等。这种多模型驱动的设计不仅提高了系统的鲁棒性和准确性,还增强了其处理复杂任务的能力。 Manus AI 的技术架构还包括以下几个关键组件: 1. 虚拟机:Manus AI 运行在云端虚拟机中,用户可以随时查看任务进度,适合处理耗时任务。 2. 计算资源:Manus AI 利用计算资源生成算法,用于筛选简历等具体任务。 3. 生成物:Manus AI 能够生成各种类型的输出,如文本、表格、报告等。 4. 内置多个 agents:Manus AI 通过内置多个智能体,实现了任务的分解和协同工作。 此外,Manus AI 还采用了“少结构,多智能体”的设计哲学,强调在数据质量高、模型强大、架构灵活的情况下,自然涌现 AI 的能力。这种设计使得 Manus AI 在处理复杂任务时更加高效和准确。其具有自主执行、类人工作模式、云端异步运行、持续学习和记忆等核心亮点。
2025-03-07
ai做ppt哪家强
以下是一些好用的 AI 做 PPT 的工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 体验者评价这几款工具中,gamma 最好用。虽然还没有特别自动化,但从审美上来看,只要提供了内容框架,gamma 生成的 PPT/网页都是审美水平最高的。
2025-02-25
你好,请问,哪家的智能体最适合处理excel表格
目前有以下几种智能体适合处理 Excel 表格: 1. Excel Labs:这是一个 Excel 插件,新增了基于 OpenAI 技术的生成式 AI 功能,可在 Excel 中直接进行数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的 AI 工具,整合了多种办公软件,能通过聊天形式让用户告知需求,自动完成如数据分析、格式创建等任务。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户可通过自然语言交互式地进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,除公式生成外,还能根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。但请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-02
AI 数字人哪家的好
以下为您介绍一些较好的 AI 数字人相关的资源和产品: 1. 数字人躯壳构建: 可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署。笔者的开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单。另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D。 2. 数字人课程: 强烈推荐卡尔的 AI 沃茨做的这门数字人课程,一共 15 节视频课,持续更新还会不定时增加最新的数字人内容,附赠课外社群辅导,专门解决数字人相关的问题。关于卡尔,从创建 AIGC 开源学习网站 learnpromptl.pro,到建立卡尔的 AI 沃茨万人社群,他一直致力于 AI 学习圈。这一次,他建立了一套完整的数字人学习体系,放在这门《克隆你自己》的课程中,带领大家全方位掌握数字人各技能。同时,他详细回顾了 2023 年数字人领域的破圈事件,如 AI 马斯克对谈 AI 乔布斯超 331.9k 播放、霉霉说中文火遍全网、AI 郭德纲讲英文相声、硅语翻译|海外明星送出中文新年祝福、通义千问|兵马俑跳科目三、小冰推出支持交互的多模态数字人、阿根廷新总统用 HeyGen 做演讲等。数字人的出现,可以极大程度上优化工作流,尤其在制作个人 ip 短视频、配音、直播甚至到智能客服、虚拟偶像等各种领域都可以完成赋能。如果您想加入这场数字人浪潮,拥有自己的数字分身,优化自己的工作流,这门具备完整数字人学习体系的课程,正是您的需求。(扫码可以查看课程详细内容和介绍) 3. 算法驱动的数字人相关开源代码: ASR 语音识别:openai 的 whisper:https://github.com/openai/whisper ;wenet:https://github.com/wenete2e/wenet ;speech_recognition:https://github.com/Uberi/speech_recognition 。 AI Agent:大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。Agent 部分可以使用 LangChain 的模块去做自定义,里面基本包含了 Agent 实现的几个组件 。 TTS:微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费;VITS:https://github.com/jaywalnut310/vits,还有很多的分支版本,可以去搜索一下,vits 系列可以自己训练出想要的人声;sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌上面,前段时间很火的 AI 孙燕姿。 当然这种简单的构建方式还存在很多的问题,例如:如何生成指定人物的声音?TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作?数字人如何使用知识库,做出某个领域的专业性回答?
2024-12-23
如果想创建一个指导高中孩子学习的老师的智能体,我有几个问题:1. 是弄一个全科的智能体还是每门科单独弄一个智能体? 2. 国产哪家的AI产品弄这种智能体比较适合?也就是说回答100%能够正确,不会瞎说; 3.你有什么建议?
对于创建指导高中孩子学习的老师的智能体,以下是一些建议: 1. 关于是创建全科智能体还是每门科单独创建智能体,这取决于您的具体需求和使用场景。如果您希望能够全面、综合地指导学生的学习,全科智能体可能更合适;但如果您想要针对每门学科进行更深入、专业的指导,那么每门科单独创建智能体可能效果更好。 2. 目前国产的 AI 产品中,很难说哪一家 100%能够保证回答正确且不会瞎说。不同的产品在不同的领域和场景中可能表现各异。您可以考虑一些在教育领域有一定口碑和应用案例的产品,并进行充分的测试和评估。 3. 以下是一些创建智能体的建议: 明确智能体的职责和功能,例如是主要进行课程规划、生成测验还是提供学习指导等。 为智能体提供详细准确的提示词,清晰地描述其任务和目标。 像导演一样,将复杂的任务拆分成科学合理的步骤,并确保每个步骤的结果能为后续步骤提供基础。 对于生成的内容,要进行检查和优化,不断调整和改进智能体的表现。 此外,您还可以参考一些相关的提示词库,例如沃顿商学院给教师和学生的提示词库,其中包含了结构化题型设计师和测验生成器等方面的内容。同时,很多 AI 网站都支持创建智能体,您可以为其配置提示词、知识库和能力等。
2024-11-21
如果想创建一个指导高中孩子学习的老师的智能体,我有几个问题:1. 是弄一个全科的智能体还是每门科单独弄一个智能体? 2. 哪家的AI产品弄这种智能体比较适合?也就是说回答100%能够正确,不会瞎说; 3.你有什么建议?
对于创建指导高中孩子学习的老师的智能体,以下是一些建议: 1. 关于是创建全科智能体还是每门科单独创建智能体,这取决于您的具体需求和使用场景。如果您希望能够全面、综合地指导学生的学习,全科智能体可能更合适;但如果您想要针对每门学科进行更深入、专业的指导,那么每门科单独创建智能体可能效果更好。 2. 目前在创建这种智能体方面,一些常见的 AI 产品如 GPT4、Gemini 等都可以考虑。然而,要确保回答 100%正确且不会瞎说是具有一定难度的,因为 AI 的回答仍然受到数据和算法的限制。 3. 以下是一些额外的建议: 参考沃顿商学院给教师和学生的提示词库,例如其中的结构化题型设计师和测验生成器的相关提示。 像导演一样,将创建智能体的任务拆解成科学合理的步骤,明确每个步骤的目标和结果。 注意提示语的逻辑,将复杂任务拆分成多个相互关联的步骤,使前一步的结果成为后一步的基础。 很多 AI 网站都支持创建智能体,您可以根据配置信息、知识库和能力配置等来自行定制。
2024-11-21
国内做视觉理解的大模型厂商有哪些
国内做视觉理解的大模型厂商有以下这些: 北京: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com 上海: 商汤(日日新大模型):https://www.sensetime.com MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 此外,在 0 基础手搓 AI 拍立得的模型供应商选择中,还有以下视觉类大模型厂商: 智谱 GLM4V:通用视觉类大模型,拍立得最早使用的模型,接口响应速度快,指令灵活性差一些,一个接口支持图片/视频/文本,视频和图片类型不能同时输入,调用成本为 0.05 元/千 tokens, 阿里云百炼 qwenvlplus:通用视觉类大模型,拍立得目前使用的模型,指令灵活性比较丰富,接口调用入门流程长一些,密钥安全性更高,调用成本为¥0.008/千 tokens,训练成本为¥0.03/千 tokens, 阶跃星辰:通用视觉类大模型,响应速度快,支持视频理解,输入成本为¥0.005~0.015/千 tokens,输出成本为¥0.02~0.07/千 tokens, 百度 PaddlePaddle:OCR,垂直小模型,文本识别能力补齐增强,私有化部署服务费,API 调用在¥0.05~0.1/次,
2024-12-19
国内大模型厂商对比
以下是国内大模型厂商的相关情况: 8 月正式上线的国内大模型: 北京的五家企业机构: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com/ 上海的三家企业机构: 商汤(日日新大模型):https://www.sensetime.com/ MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 聊天状态下能生成 Markdown 格式的:智谱清言、商量 Sensechat。 目前不能进行自然语言交流的:昇思(可以对文本进行是否由 AI 生成的检测,类似论文查重,准确度不错)。 受限制使用的:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值)。 特色功能:昇思——生图,MiniMax——语音合成。 中文大模型基准测评 2023 年度报告中的情况: 从大厂和创业公司的平均成绩来看,大厂与创业公司差值约 6.33 分,较 11 月份差距在增大,说明大厂在大模型竞争中长期资源投入方面有一定优势。 过去八个月国内模型在 SuperCLUE 基准上的前三名: 12 月:文心一言 4.0 11 月:文心一言 4.0 10 月:BlueLM 9 月:SenseChat3.0 通过 SuperCLUE 测评结果发现,国内大模型的第一梯队有了更多新的模型加入。头部模型如文心一言 4.0、通义千问 2.0 引领国内大模型的研发进度,部分高质量大模型紧追不舍,分别在闭源应用和开源生态中形成自己独特的优势。 从国内 TOP19 大模型的数量来看,创业公司和大厂的占比几乎持平。
2024-08-30
智谱跟其他厂商的差异和优势是什么
智谱与其他厂商的差异和优势主要体现在以下几个方面: 1. 模型研发:一年间推出了 4 代 GLM,一直是国内能力最好的模型之一。22 年就和清华一起自研了 GLM130B。 2. 技术来源:由清华大学计算机系技术成果转化而来,背后有清华大学研发团队的科研成果支持。 3. 产品设计:以 ChatGPT 为对标,努力打造类似的用户体验。 4. 智能体应用:是国内首批开放智能体应用的 AI 公司之一,在智能体开发和模型优化方面积累了丰富经验和技术。 5. 性能表现:在逻辑推理和处理复杂提示词方面表现出明显优势,在处理需要深度思考和分析的任务时表现出色。 6. 产品体系:合作研发了双语千亿级超大规模预训练模型 GLM130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎。基于此模型打造了 ChatGLM,还推出了认知大模型平台 Bigmodel.ai,包括 CodeGeeX 和 CogView 等产品,提供智能 API 服务。
2024-08-30
ai模型chatglm,百川大模型,通义千问,yi系列的模型厂商和团队背景,ai产品调用api的成本
以下是关于您提到的 AI 模型的厂商和团队背景以及 AI 产品调用 API 成本的相关信息: 厂商和团队背景: 通义千问:由阿里开发,接口可在 https://dashscope.console.aliyun.com/ 创建 API key。 智谱 AI(ChatGLM):由智谱 AI 开发,相关网址为 https://chatglm.cn 。 百川大模型:由百川智能开发,网址为 https://www.baichuanai.com/ 。 关于 AI 产品调用 API 的成本: 目前国内的大模型大多限制一定免费额度的 Token,各平台 API 调用计费是按计算 token 费率定价,具体收费标准不同,需自行留意对应官网。例如 GPT3.5、GPT4、文心一言、讯飞星火、通义千问、mimimax 等,收费标准不一,不做统一赘述。
2024-08-20
ai模型chatglm,百川大模型,通义千问,yi系列的模型厂商和团队背景,ai产品调用api的成本
以下是关于您提到的 AI 模型的厂商和团队背景以及 AI 产品调用 API 成本的相关信息: 厂商和团队背景: 通义千问:由阿里开发,接口可在 https://dashscope.console.aliyun.com/ 创建 API key。 智谱 AI(ChatGLM):由智谱 AI 开发,相关网址为 https://chatglm.cn 。 百川大模型:由百川智能开发,网址为 https://www.baichuanai.com/ 。 关于 AI 产品调用 API 的成本: 目前国内的大模型大多限制一定免费额度的 Token,各平台 API 调用计费是按计算 token 费率定价,具体收费标准不同,需自行留意对应官网。例如 GPT3.5、GPT4、文心一言、讯飞星火、通义千问、mimimax 等,收费标准不一,不做统一赘述。
2024-08-20
我想知道大模型厂商内置的提示词一般都有多少个字比较合理?并给出数据来源
大模型厂商内置的提示词字数并没有一个固定的标准,其合理性取决于多种因素。 一般来说,提示词的字数可能寥寥无几,但更多时候需要提供详尽的上下文和相关细节。例如,在要求 GPT 删除个人信息的官方示例中,提示词包括背景、定义术语、给出模型应如何完成任务的具体细节等多个方面。 在一些经验分享中提到,提示词中的示例 5 6 个效果最佳。同时,提示词的整体结构需要调整和优化,除了技能外还应有完整的工作流程设定,角色信息中的人设应特点鲜明,避免同质化。还需注意避免矛盾和重复的提示词内容,可通过调整提示词顺序的方法提高重要指令的权重。 数据来源包括胡凯翔基于阅读 Claude Cookbook 的思考和测试、Agent 共学“谁是人类”活动参赛心得分享等。
2024-08-20