直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

24年9月,当下主流好用ai的大模型有哪些

回答

当下主流好用的 AI 大模型主要包括:

  1. OpenAI 系统:包括 3.5 和 4.0 版本。3.5 模型于 11 月启动了当前的 AI 热潮,4.0 模型在春季首次发布,功能更强大。此外,还有新的变种使用插件连接到互联网和其他应用程序,如 Code Interpreter 是一个非常强大的 ChatGPT 版本,可以运行 Python 程序。如果未为 OpenAI 付费,只能使用 3.5 版本。
  2. 微软的 Bing:使用 4 和 3.5 的混合,通常是 GPT-4 家族中首个推出新功能的模型。例如,它既可以创建也可以查看图像,而且可以在网页浏览器中阅读文档,并连接到互联网。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

4.6 历史更新

《[The AI Revolution /人工智能革命](https://waytoagi.feishu.cn/record/ZCCzrdyhLeYDGpc8wobcvW7PnOB)》(中英双语PPT,机翻)是Coatue投资机构对AI的全景式回顾和展望,非常值得一读。在分享的内容中,它列举了一系列的数据,比如:Hugging Face上已分享了超过300K个模型,超过50%的热门GitHub存储库与AI相关,并且已经创建了超过8,000个AI应用程序。如果说2022年是人工智能爆发的一年,那么2023年则是人工智能浪潮开始形成并获得动力的一年,它将影响风险生态系统、我们的现代技术堆栈以及更广泛的经济。([知识星球可下载](https://t.zsxq.com/16H27hmMj))

如何使用 AI 来做事:一份带有观点的指南

前四个(包括Bing)都是OpenAI系统。今天有两大主要的OpenAI AI:3.5和4。3.5模型在11月启动了当前的AI热潮,4.0模型在春季首次发布,功能更强大。一个新的变种使用插件连接到互联网和其他应用程序。有很多插件,其中大部分不是很有用,但你应该随需要自由探索它们。Code Interpreter是一个非常强大的ChatGPT版本,可以运行Python程序。如果您从未为OpenAI付费,那么您只能使用3.5。除了插件变种和一个暂时停用的带有浏览功能的GPT-4版本之外,这些模型都没有连接到互联网。微软的Bing使用4和3.5的混合,通常是GPT-4家族中首个推出新功能的模型。例如,它既可以创建也可以查看图像,而且它可以在网页浏览器中阅读文档。它连接到互联网。[Bing使用有点奇怪,但功能强大。](https://oneusefulthing.substack.com/p/power-and-weirdness-how-to-use-bing)

4.6 历史更新

《[大模型还是小学生,别着急让它去打工|对谈真格基金戴雨森:当下AI发展到了哪个阶段?](https://www.xiaoyuzhoufm.com/episode/665f398494977a26ef37deea)》如果今天的大模型像一位展露出天才的小学生,作为家长,你选择立即让它出门打工,还是选择继续投资、栽培、鼓励它念完PhD再工作?为什么要给与大模型更多的宽容和等待,以及如何学习保持耐心和乐观。今日芒种,24节气中第9个。欢迎来一起尝试生图,三思会在评论区给大家批改作业:[教程:09_芒种](https://waytoagi.feishu.cn/wiki/BL3KwP0VLixOy2khESOcWw80n4R)

其他人在问
在comyui中,使用flux1-dev模型24g显存够吗
在 ComfyUI 中使用 Flux1dev 模型,24G 显存是可以的,但建议内存尽量高于 32G 以避免意外情况的发生。如果您的显卡是 24G 或更高,右键 24G 那个 train_flux_24GLora 的文件。修改脚本路径和参数时,要注意底模路径、VAE 路径、数据集路径,还有下面的 clip 路径和 T5xxl 路径的正确填写。ae.safetensors 和 flux1dev.safetensors 的下载地址为:https://huggingface.co/blackforestlabs/FLUX.1dev/tree/main 。flux 相关模型(体积较大)的夸克网盘链接:https://pan.quark.cn/s/b5e01255608b ,百度网盘链接:https://pan.baidu.com/s/1mCucHrsfRo5SttW03ei0g?pwd=ub9h 提取码:ub9h 。如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,下载地址:https://huggingface.co/Kijai/fluxfp8/tree/main 。最后下载 dev 的工作流: ,或者使用官方原版的图片链接 https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png ,打开 ComfyUI 把工作流或图片拖拽到其中即可。
2024-11-12
2024年11月11日世界AI新闻有哪些
以下是 2024 年 11 月 1 日至 11 月 8 日的部分世界 AI 新闻: 11 月 1 日: 《》来自南乔,10 月 AI 行业大事件盘点包括多家公司的重要发布和创新,如 OpenAI 推出多项新功能,字节发布 AI 智能体耳机,以及各大模型的开源。趋势方面,强化学习被认为是推动 AGI 发展的关键技术,原生多模态模型逐渐成为研究热点。新兴应用如 AI 音乐创作、翻译和智能助手等受到关注,整体呈现出技术与应用的快速发展态势。 《》来自歸藏,10 月份美国 AI 聊天机器人市场报告显示,ChatGPT 仍是市场领导者,但份额逐渐下降。谷歌和微软在争夺第二的位置,Perplexity 和 ClaudeAI 则实现高速增长,正在从 ChatGPT 和 Gemini 手中蚕食市场份额。总体来看,专业 AI 工具的增长势头强劲,而初创公司的用户获取相对缓慢。 《》比尔・盖茨在采访中讨论了人工智能的革命性影响,认为 AI 将使每个人都能成为“超级个体”,改变人机交互方式。他强调 AI 将显著降低白领工作的成本,并逐渐影响蓝领市场。盖茨还提到他对全球健康和气候问题的关注,认为技术创新速度超出预期,未来 20 年将是充满希望的时期。他同时探讨了可再生能源的发展,尤其是核能和太阳能的潜力。 11 月 8 日: 《》由上海外国语大学图书馆发布,探讨了 AI 素养在数智时代的重要性和演变。报告指出,AI 素养不仅涉及技术知识,还包括态度、价值观和应对复杂需求的能力。随着 AI 技术的广泛应用,社会对 AI 素养的需求日益增长。 其它一些报告发布在: AIGCxChina 研究院、无界 AI:《》 《》(英文) 《》 请注意,这只是部分新闻,可能还有其他未涵盖的内容。
2024-11-11
联想异能者配置i5-12450八核,32GB内存,1TB固态硬盘,用于本地部署开源大模型可以部署哪些开源大模型
以下是一些您的联想异能者配置(i512450 八核,32GB 内存,1TB 固态硬盘)可部署的开源大模型及相关信息: ComfyUI 相比 WebUI 配置更低,系统资源占用更少,出图速度更快。ComfyUI 最低可在小于 3G 的 GPU 上运行,甚至没有 GPU 光用 CPU 也可以运行,但速度极慢。SDXL 出来后提高了运行配置,最低需要 8GB 显存+32GB 运行内存,12GB 流畅运行,推荐 16GB 以上。玩 SDwebui 和 ComfyUI 建议使用 6GB 以上的显存的 NVIDIA 显卡(N 卡),内存在 16G 以上。硬盘会影响加载模型的速度,所以最好把软件和模型部署在 SSD(固态硬盘)上。 截止 2024 年 5 月,主流的 AI 笔记本电脑主要是一些专门为人工智能和深度学习设计的高性能移动工作站。一些知名品牌包括微软第 11 代 Surface Pro、微星 Creator/Workstation 系列、技嘉 Aero/Aorus 系列、戴尔 Precision 移动工作站、惠普 ZBook 移动工作站、联想 ThinkPad P 系列。这些笔记本通常配备强大的 GPU(如 NVIDIA RTX 系列)、大容量内存(32GB 以上)和高速固态硬盘,还通常预装了 NVIDIA CUDA、cuDNN 等深度学习框架,以及各种 AI 开发工具。但这类高端 AI 笔记本价格相对较高,通常在 2000 美元以上。用户可根据自身需求和预算选择合适型号,并关注散热、续航等实际使用体验。 请注意,配置上不封顶,您可根据自己的需求和预算来选择。
2024-11-04
State of AI 2024 报告
以下是关于《State of AI 2024》报告的相关信息: 该报告由来自剑桥大学的 AI 风险投资公司 Air Street Capital 创始人兼 CEO Nathan Benaich 和来自牛津大学的 Air Street Capital 平台负责人 Alex Chalmers 共同发表。 报告主要围绕人工智能(AI)领域的最新进展、政治动态、安全挑战及未来预测几大方面进行说明。 报告中的关键要点包括:OpenAI 的 o1 模型在数学、科学和推理方面重新定义了 AI 的极限;中国的 AI 模型在面对制裁时表现出色;生成式 AI 的初创公司获得巨大收益,但可持续性仍存在问题。 报告每年 10 月份发布,对未来 12 个月有 10 大预测,例如某主权国家将向一家美国大型 AI 实验室投资超 100 亿美元并引发国家安全审查等。报告链接为:
2024-11-04
你能帮我找到这篇报告吗?他的名字是《InfoQ:中国AI Agent应用研究报告2024》
以下是为您找到的《InfoQ:中国 AI Agent 应用研究报告 2024》的链接:https://waytoagi.feishu.cn/record/Y45LrXJiwe4SgYc5tMZcVVtqn6b
2024-10-31
《2024大模型人才报告》
以下是与您查询的相关报告: 2024 年 9 月 10 日: 《》由蚂蚁集团和中国信通院联合发布,探讨了大模型在金融、医疗、政务等行业的应用挑战和解决方案。报告提出了一个系统化的可信应用框架,强调了专业性、可控性、真实性和安全性四个核心要素,并从数据质量、模型能力、推理过程、系统安全等方面提供了具体的技术实现建议。 《》 《》 《》 《》 2024 年 7 月 10 日: 极客邦科技通过《》报告深入探讨 AIGC 技术在企业中的应用,提供实战经验和趋势洞察。这份报告集合了多篇文章和案例,覆盖互联网产品、企业生产、医疗、教育等行业,展现大模型应用潜力。 《》 《》 《》 《》 2024 年 9 月 18 日: 《》探讨了 AI 技术,尤其是大模型技术对劳动力市场的影响。 《》探讨了 AI 技术在营销领域的应用现状和发展趋势。 《》 《》 您可以通过相应的链接获取更详细的内容。
2024-10-29
有没有可以直接讲word文件生产PPT,并使用AI讲课的流程
以下是使用 AI 将 word 文件生成 PPT 并进行讲课的流程: 首先,让 GPT4 生成 PPT 大纲。但生成符合要求的大纲可能比较耗时,比如可能会花费 2 小时左右。 然后,将大纲导入到 WPS 当中,启用 WPS AI 一键生成 PPT。 为了让 PPT 更具灵动性和观感,可让 chatPPT 为其添加一些动画。 最后,手动修改一些细节,比如字体、事实性错误等,整份 PPT 就基本完成了。 需要注意的是,在生成大纲的环节中,可能会因为题目理解困难而花费较多时间。例如,对于一些抽象的题目,可能需要借助 OCR 识别后抛给 GPT4 来帮助理解题意。对于不熟悉的电商企业属性等问题,GPT4 也能提供耐心的解答。
2024-11-13
怎么用AI讲PPT
以下是关于如何用 AI 讲 PPT 的相关内容: 目前有多种 AI 工具可辅助制作 PPT,例如: 1. GPT4:可提供内容创作方面的帮助。 2. WPS AI:有助于完成大纲内容、排版等工作。 3. chatPPT:在制作 PPT 中发挥作用。 市场上好用的 AI PPT 工具还有: 1. Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。 2. 美图 AI PPT:通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。 3. Mindshow:提供自动布局、图像选择和文本优化等智能设计功能。 4. 讯飞智文:利用科大讯飞技术优势,提供智能文本生成、语音输入、文档格式化等功能。 此外,还有以下相关网站和应用可用于高效制作 PPT: 1. SlidesAI 2. Decktopus AI 3. Tome 4. MagicSlides 5. Presentations.AI 6. Canva 7. Simplified 8. GlimmerAI 9. Sendsteps 10. Plus AI 11. Microsoft 365 Copilot 12. Gamma 13. Canva Magic Design 14. ChatGPT 15. Beautiful.AI 您可以根据实际需求选择合适的工具和应用来制作和讲述 PPT。
2024-11-13
完全不会编程的人能使用AI完成网站和app的开发吗
完全不会编程的人在一定程度上可以借助 AI 来开发网站和 app,但存在一定的限制。 从去年三月 GPT4 发布会的手绘草图直接生成网站的 demo 开始,人们对非编程人员开发应用充满期待。然而,现实情况是,真正的应用往往有复杂的特殊需求,代码量也可能超出 AI 单次处理能力,AI 无法直接完成。比如,纯小白使用 cursor 创建起始文件后,可能会不知从何下手。 但也有一些积极的情况,没有任何编码能力的人独自创建的应用程序或网站有迅速走红的可能。对于纯小白,如果需求复杂无法一次性直出,需要在 AI 的帮助下一步一步来,并在这个过程中学习一些编程知识。 在深入学习 AI 时,即使不会编程,也可以通过一些教程,如 20 分钟上手 Python + AI,来逐渐掌握相关技能。Python 拥有丰富的标准库,还可以通过工具和平台获取更多资源。OpenAI 提供了 ChatGPT 这种开箱即用的服务,也有通过代码调用的 OpenAI API 来完成更多自动化任务。
2024-11-13
名片生成的ai应用
以下为一些关于名片生成的 AI 应用介绍: 一泽 Eze 推出的应用,通过 1 句提示词和 1 个品牌 Logo 即可生成超级符合品牌调性的创意名片。整个流程简单,只需输入 Prompt 和 Logo,AI 会分析并输出结果。提示词已开源,可直接获取。注意事项包括:提示词主要目的是设计符合品牌调性的创意名片;支持在 Artifacts 中正确回显上传的 Logo,建议使用清晰、底图透明的 PNG 格式;若生成结果不符合预期,可尝试让模型重新生成或与 AI 对话提出修改意见。 一泽 Eze 的 Prompt 热度引发了丰富的二创玩法与衍生思考,如个人简历生成、文章内容的可视化总结、万物名片生成、视频内容总结、AI 图表生成等。大模型的文本生成与可视化输出提升了信息呈现效果,基于 Claude Artifacts 的能力推动了设计、研发的民主化,有望迎来一波新解法。 AI“词生卡”技术在高效组织和理解复杂信息方面展现优势,能将文字转化为直观的逻辑图表和流程图。在商业领域,可用于生成流程图、自定义活动海报、商务名片、简历等,实现自然语言的文图双输出,提高信息传导效率和创新思维。例如一泽 Eze 的“词生卡”商务名片。
2024-11-13
PPT翻译的AI软件
以下是一些可用于 PPT 翻译的 AI 软件和工具: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PPT 文件即可。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择相关翻译选项。 3. 百度翻译(网页):,点击导航栏「文件翻译」,上传 PPT 等格式的文件,支持选择领域和导出格式,但进阶功能基本需要付费。 4. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PPT 等格式的文档,不过有免费次数限制且进阶功能需要付费。 5. 微信读书(App):下载 App 后将 PPT 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 此外,还有一个自动 PPT 翻译脚本的开发案例。该脚本在 Python 环境下运行,前期准备需要根据自己的 API 资源提前设置,推荐讯飞大模型,新账户免费送 200 万 tokens,有效期 3 个月。具体操作包括:在首页选择 API 接入,然后点服务管理进入控制台,创建一个新项目,比如“PPT 翻译”,找到左边机器翻译的模型,按提示领取 200 万 tokens 的礼包,然后在主控台看到对应的 id、apikey、api secret 和接入路径。导入依赖时,大部分都是常用的,只有一个 ppt 可能需要装,运行 CMD 输入 pip install pythonpptx,如果还缺的可以按提示安装。接着先设置对应的 api 信息,其他模型可以对应做替换。 另外,歌者 PPT 也是一款相关工具,它是一款永久免费的智能 PPT 生成工具,具有话题生成、资料转换、多语言支持、模板和案例丰富、在线编辑和分享、增值服务等功能。其优势包括免费使用、智能易用、海量案例、资料转 PPT 专业、AI 翻译等,特别适合不太擅长制作 PPT 或者时间紧张的人群。
2024-11-13
名片生成的ai
以下是关于名片生成的 AI 相关内容: 一泽 Eze:释放 AI 设计潜力|一句提示词,即是你的专属名片设计师! 1. 一句提示词加上一个品牌 Logo 就能生成超级符合品牌调性的创意名片。 2. 整个流程非常简单: 输入 Prompt。 输入要用的 Logo。 AI 会根据 Logo 对应的品牌特征,分析名片设计方案,输出最终结果。 3. 获取提示词,激发 AI 设计潜力: 提示词已开源,可直接获取。 4. 注意事项: 提示词的主要目的是“设计符合品牌调性的创意名片”。 “创意名片生成”已支持在 Artifacts 中正确回显上传的 Logo,为了更好的直出效果,Logo 建议使用清晰、底图透明的 PNG 格式。 如果生成结果不符合预期,可以尝试让模型重新生成,也可以和 AI 对话,提出修改意见。 一泽 Eze:我的 Prompt 爆火全网|AI 一键生成高颜值社交名片全解析 1. 这波 AI 可视化输出的 Prompt 热度产生了更多丰富的二创玩法。 2. 列举了一些 Promptbased Case,如个人简历生成、文章内容的可视化总结、万物名片生成、视频内容总结、AI 图表生成等。 3. 大模型的文本生成加可视化输出大大提升了复杂、大段信息的呈现效果。 4. 基于 Claude Artifacts 不错的网页布局设计和样式实现能力,正在进一步推动设计、研发的民主化。 如何判断一张图片是否 AI 生成的 1. 引入:名画造假大师。 2. 依赖艺术知识储备:单纯聚焦于鉴别名画作者时,有的人根据对名画风格的了解和对画质与笔触表现力的判断做出选择,尤其对涉猎过艺术史与设计史论的人来说,这是调用基础知识储备的操作。 3. 细节决定成败:单纯判断作品是出自人类还是 AI 算法时,变成对画面内容的单纯判断,往往细节决定成败,如人物肢体异常、背景花纹和底纹文字信息等。
2024-11-13
请推荐一下文生PPT好用的免费软件
以下为您推荐几款文生 PPT 好用的免费软件: 1. 歌者 PPT(gezhe.com): 功能:话题生成(一键生成 PPT 内容)、资料转换(支持多种文件格式转 PPT)、多语言支持(生成多语言 PPT)、模板和案例(海量模板和案例库)、在线编辑和分享(生成结果可自由编辑并在线分享)、增值服务(自定义模板、字体、动效等)。 产品优势:免费使用(所有功能永久免费)、智能易用(通过 AI 技术简化 PPT 制作流程,易于上手)、海量案例(大量精美模板和优秀案例可供选择和下载)、资料转 PPT 很专业(支持多种文件格式,转换过程中尊重原文内容)、AI 翻译(保持 PPT 原始排版不变,多语言在线即时翻译)。 推荐理由:完全免费,智能化程度高,模板和案例库丰富,对多语言支持好,适合不太擅长制作 PPT 或者时间紧张的人群。 2. Gamma: 作为在各种交流群中频繁推荐的产品,以其卓越的性能和用户体验赢得广泛认可。免费版本也能生成质量非常高的 PPT,随着不断优化和改进,能满足大多数用户的需求。个人使用体验良好,生成效果令人满意,在内容组织、设计美观度和整体专业感方面表现出色。 目前市面上大多数 AI 生成 PPT 按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-13
我想请教一些问题 1:目前有哪些AI教育类产品 2:目前有哪些AI辅助学习类产品 3:有哪些AI辅助学习的好用的方法
以下是关于您所提出问题的回答: 目前的 AI 教育类产品和 AI 辅助学习类产品有: 语言学习方面:Speak、Quazel、Lingostar 等是由 AI 驱动的语言老师,能够实时交流并给予发音或措辞反馈;Grammarly 可进行英语写作和语法纠错。 数学学习方面:Photomath、Mathly 可指导学生解决数学问题;Khan Academy 有自适应学习系统。 综合学习方面:Duolingo 是自适应学习平台,能为用户提供个性化学习内容和练习。 AI 辅助学习的好用方法包括: 英语学习:利用智能辅助工具如 Grammarly 改进写作和语法;通过语音识别应用如 Call Annie 练习口语和纠正发音;使用自适应学习平台如 Duolingo 获得个性化学习计划;借助智能对话机器人如 ChatGPT 进行会话练习。 数学学习:运用自适应学习系统如 Khan Academy 获取精准推荐;使用智能题库和作业辅助工具如 Photomath 获得问题解答和解题步骤;借助虚拟教学助手如 Socratic 解答问题、观看教学视频和获得答疑服务;参与交互式学习平台如 Wolfram Alpha 进行数学建模和问题求解。
2024-11-12
好用的图片无损高清放大
以下是关于图片无损高清放大的相关内容: 图像修复放大的流程分为三部分: 1. 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,因其处理时间长。 2. 图像高清修复:使用 Iceclear/StableSR 等模型进行高清修复并 2 倍放大,提示词应包含想要达到的目的内容,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。全程采取两次高清修复,第一次修复原始图像分辨率并放大。 3. 图像高清放大:针对第一次放大修复后的图像进行二次修复,用 realisticVision 底膜,使用提示词反推 node 对图像进行画面提示词提取,搭配 tile ControlNet 提升画面细节感,用合适的高清放大模型进行二次放大。 【SD】超清无损放大器 StableSR: 作者为白马少年,发布于 2023 年 6 月 10 日 20:01,原文网址:https://mp.weixin.qq.com/s/J0HIF2U1siAen6FWNA67A 。 之前讲过在 Stable Diffusion 中绘制高清大图的方式,主要用到“脚本”和“后期处理”,其中脚本以“Ultimate SD upscale”为主,会改变原图细节;“后期处理”是 Stable Diffusion 自带的扩图功能,适用于所有图片,可按原图内容扩图,但无法还原原图不清晰的地方。 今天讲的 StableSR 可算作“后期处理”的上位替代品,能在尽可能保留原图的情况下更精致地还原原图。安装方式:在扩展面板中搜索 StableSR 直接安装,或将下载好的插件放在“……\\sdwebuiakiv4\\extensions”文件夹下,安装完成后重启 webUI 即可在脚本中找到。 修复需使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹;StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹;VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。 测试:用一张网上找的分辨率为 512x768 的神仙姐姐照片,“Ultimate SD upscale”脚本放大哪怕重绘幅度只开到 0.1,人物细节有变化但磨皮严重,重绘幅度开到 0.4 则变化很大;“后期处理”放大 3 倍,眼神变锐利但头发仍模糊;StableSR 放大时,先调整大模型和 VAE,打开脚本下拉选择“StableSR”,模型选择对应模型,放大倍数为 3,勾选“pure noise”。
2024-11-12
AI数字人工具,哪个好用?
以下是一些好用的 AI 数字人工具: 1. HeyGen:AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人能自动转换成语音并合成逼真的会开口说话的视频。 此外,还有以下相关工具: 1. MakeACharacter:一键生成 3D 数字人,可自定义面部特征,生成逼真 3D 角色,基于真实人类扫描数据,使用 Unreal Engine 渲染,支持中英文提示,兼容多个行业应用。 2. Rodin Gen1:拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术。 在算法方面,开源代码仓库有: 1. ASR 语音识别:openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition)。 2. AI Agent:大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。Agent 部分可使用 LangChain 的模块自定义(https://www.langchain.com/)。 3. TTS:微软的 edgetts(https://github.com/rany2/edgetts),只能使用预设人物声音,目前接口免费;VITS(https://github.com/jaywalnut310/vits)及其分支版本;sovitssvc(https://github.com/svcdevelopteam/sovitssvc),专注于唱歌。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42
2024-11-11
有没有国内网络能打开的免费好用的美术类AI工具?
以下为您推荐国内网络能打开的免费好用的美术类 AI 工具: 1. 扣子 + ByteArtist 网址:https://www.coze.cn/home 优点:不需要翻墙,无收费,可以直接生成 注册:手机号、抖音号或飞书号 操作步骤:需要在 coze 的 bot 里面添加绘图插件 时间:5min 2. 无界 AI 网址:https://www.wujieai.cc/ 优点:国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用 希望这些工具能满足您的需求。
2024-11-11
国内免费的好用的AI有哪些
以下是一些国内免费且好用的 AI 产品: 1. Kimi 智能助手:是一个有着超大“内存”的智能助手,可以一口气读完二十万字的小说,还会上网冲浪,由 Moonshot AI 出品。不用科学上网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,也是目前对长文理解做得最好的 AI 产品。能一次搜索几十个数据来源,无广告,能定向指定搜索源(如小红书、学术搜索)。PC 端:https://kimi.moonshot.cn/?utm_campaign=TR_LgLmkEor&utm_content=&utm_medium=%E7%BD%91%E7%AB%99&utm_source=CH_tpOYmtV1&utm_term= ;移动端 Android/ios:https://kimi.volctrack.com/a/E3w3Q1xa 。 2. 文心一言:百度出品的 AI 对话产品,定位是智能伙伴,能写文案、想点子,又能陪你聊天、答疑解惑。 3. 通义千问:由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。 4. 可灵:由快手团队开发的 AI 应用,主要用于生成高质量的图像和视频,生成的图像质量非常高。最初采用内测邀请制,现在已向所有用户开放使用。但价格相对较高,对于重度用户,最高档的年费可能达到几千元人民币,若临时或轻度使用,有每日免费点数和 60 多元单月的最便宜包月选项。 5. 通义万相:作为国产 AI 工具,在中文理解和处理方面表现出色,用户可从多种艺术风格和图像风格中选择,生成的图像质量较高、细节丰富,操作界面简洁直观、用户友好度高,且能与阿里其他产品和服务无缝整合。重点是现在免费,每天签到获取灵感值即可。但为符合国内监管要求,某些类型的图像可能无法生成,在处理非中文语言或国际化内容方面可能不如一些国际 AI 图像生成工具出色,处理多元文化内容时可能存在偏差。 内容由 AI 大模型生成,请仔细甄别。
2024-11-10
主流大厂目前的agi 进展
目前主流大厂在 AGI 方面的进展情况如下: 2023 年之前,国内 AI 行业自认为与美国差距不大,但 ChatGPT 和 GPT4 的出现打破了这种认知,OpenAI 直接拉开了 2 年的技术差距。 2023 年上半年,国内大厂纷纷囤卡招人,研究类 GPT 架构,或成立创业公司,试图创造国产 AGI。但下半年发现不容易后,纷纷转向“垂直应用”“商业化”,不再提 AGI。 国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距。 百度和阿里在大厂中比较高调,百度的“文心 4.0”是当前国内能力较好的模型之一,即将发布的阿里的“通义千问”也备受关注。 大厂们在人才、GPU、数据和资金储备方面具备冲击 AGI 的条件,但实际效果尚无明确亮点,且受内部短期考核压力影响,多数力量用于卷新产品和向上汇报工作,同时还背负其他业务和政治考量。
2024-11-12
现在业内比较主流的 RAG 方案 开源/商业的都有哪些啊
目前业内比较主流的 RAG 方案包括开源和商业的,以下为您介绍: 1. Dify:这是一个开源的大模型应用开发平台。它结合后端即服务和 LLMOps 的理念,为用户提供直观界面来快速构建和部署生产级别的生成式 AI 应用。具备强大工作流构建工具、广泛的模型集成、功能丰富的提示词 IDE 以及全面的 RAG Pipeline 用于文档处理和检索。还允许定义 Agent 智能体,并通过 LLMOps 功能对应用程序性能进行持续监控和优化。提供云服务和本地部署选项,满足不同用户需求。其设计理念注重简单性、克制和快速迭代,适合个人研究和企业级落地项目。 官方手册:https://docs.dify.ai/v/zhhans 一般来说,如果是个人研究,推荐单独使用;如果是企业级落地项目,推荐多种框架结合使用。 2. LangChain:这是一个为简化大模型应用开发而设计的开源框架。通过提供模块化的工具和库,允许开发者轻松集成和操作多种大模型,将更多精力投入到创造应用的核心价值上。设计注重简化开发流程,支持广泛模型,具备良好可扩展性,适应不断变化的业务需求。作为社区广泛支持的开源项目,拥有活跃贡献者和持续更新,提供全面文档和示例代码,充分考虑应用安全性和用户数据隐私保护,是多语言支持的灵活框架,适用于各种规模项目和不同背景开发者。 官方手册:https://python.langchain.com/docs/get_started/introduction/
2024-09-24
对于辅助代码编写的AI工具有什么推荐,哪些是主流使用人数较多的工具
以下是一些主流的辅助代码编写的 AI 工具: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,帮助更快、更少地编写代码。 2. 通义灵码:阿里巴巴团队推出,基于通义大模型,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,可为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,可快速生成代码,提升开发效率。 5. Cody:代码搜索平台 Sourcegraph 推出,借助 Sourcegraph 强大的代码语义索引和分析能力,了解开发者的整个代码库,不止是代码片段。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供智能研发服务的免费 AI 代码助手,基于蚂蚁集团自研的基础大模型进行微调的代码大模型。 7. Codeium:一个由 AI 驱动的编程助手工具,通过提供代码建议、重构提示和代码解释来帮助软件开发人员,提高编程效率和准确性。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。 每个工具的功能和适用场景可能会有所不同,您可以根据自己的需求来选择最适合您的工具。
2024-09-09
目前有什么主流AI台式电脑推荐?
截止 2024 年 5 月,主流的 AI 台式电脑主要是一些专门为人工智能和深度学习设计的高性能设备。这类电脑通常配备了强大的 GPU(如 NVIDIA RTX 系列)、大容量内存和高速固态硬盘,以满足 AI 模型训练和推理的计算需求。一些知名品牌的 AI 台式电脑包括: 1. 戴尔(Dell)Precision 系列。 2. 惠普(HP)Z 系列。 3. 联想(Lenovo)ThinkStation 系列。 这些台式电脑一般采用英特尔酷睿或 AMD Ryzen 的高端 CPU,配备 NVIDIA RTX 30/40 系列或 AMD Radeon Pro 专业级 GPU。同时也提供了大容量内存(32GB 以上)和高速 NVMe SSD 存储选配。除了硬件配置,这些 AI 台式电脑还通常预装了 NVIDIA CUDA、cuDNN 等深度学习框架,以及各种 AI 开发工具,为用户提供了开箱即用的 AI 开发环境。 当然,这类高端 AI 台式电脑价格也相对较高。用户可以根据自身的 AI 应用需求和预算情况,选择合适的型号。同时也要关注电脑的散热、稳定性等实际使用体验。需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-02
国内各大主流AI的特点及优势对比分析,请用表格形式展示
|AI名称|特点|优势| |||| |XiaoHu.AI|提供实时互动学习体验|测试版模型在高中和初中数学问题上的准确率比 GPT4 高 20%,数学推理方面比 GPT4o 高 15%,已被全球 200 多个国家的 40 万名学生使用,创始人是 14 岁考入大学的女学霸| |阿里 CosyVoice 语音合成模型|精细控制、自然模拟、情感和风格|生成符合性别、年龄和个性特征的声音,模拟笑声、咳嗽和呼吸等人类语音自然特征,为声音添加情感和风格,更具表现力| |百度“文心 4.0”|/|是当前国内能力最好的模型之一| |阿里“通义千问” QwenVLMAX 和 Qwen2.0|/|有比较好的指标,与钉钉的结合可圈可点| |字节“云雀”|/|/| |腾讯“混元”|/|/|
2024-08-10
能介绍下AI绘画、AI音乐、AI视频制作方面的主流软件、相关公司和发布年份吗
以下是AI绘画、AI音乐、AI视频制作方面的主流软件、相关公司和发布年份的介绍: AI绘画 1. DeepArt 公司:DeepArt 发布年份:2016年 特点:基于神经网络的艺术风格转移应用,可以将照片转换为特定艺术风格的图像。 相关信息:DeepArt使用深度学习技术来模仿著名艺术家的绘画风格,将普通照片变成艺术品。 2. DeepDream 公司:Google 发布年份:2015年 特点:利用卷积神经网络来创建抽象艺术作品,通过“梦境”算法产生奇特的视觉效果。 相关信息:DeepDream最初是Google研究项目,展示了神经网络的内部工作方式,通过图像处理产生梦幻般的效果。 3. DALLE 公司:OpenAI 发布年份:2021年 特点:生成从文本描述创建的高质量图像,可以根据用户输入的文本生成各种创意图像。 相关信息:DALLE基于GPT3模型,通过理解和处理自然语言文本生成图像。 AI音乐 1. Amper Music 公司:Amper Music 发布年份:2017年 特点:使用AI生成音乐片段,可以根据用户的需求和参数创建定制化的音乐。 相关信息:Amper Music提供简单易用的界面,用户无需具备音乐制作经验即可生成背景音乐和配乐。 2. AIVA 公司:AIVA Technologies 发布年份:2016年 特点:使用深度学习算法创作音乐,特别是在古典音乐领域表现出色。 相关信息:AIVA可以作曲、编曲,甚至被认定为拥有音乐版权的虚拟作曲家。 3. Jukedeck 公司:Jukedeck 发布年份:2015年 特点:AI音乐生成工具,能够根据用户的输入生成个性化音乐作品。 相关信息:Jukedeck被Bytedance收购,技术被整合进其他音乐生成产品中。 AI视频制作 1. Runway ML 公司:Runway 发布年份:2018年 特点:提供多个AI工具,包括视频编辑、图像生成和风格转移等,支持实时处理和编辑。 相关信息:Runway ML整合了多种AI模型,用户可以在平台上进行视频编辑和特效制作。 2. Synthesia 公司:Synthesia 发布年份:2019年 特点:AI视频生成工具,专注于合成虚拟主持人和讲解视频,支持多语言和个性化定制。 相关信息:Synthesia广泛应用于教育和营销领域,提供逼真的虚拟人视频。 3. Lumen5 公司:Lumen5 发布年份:2017年 特点:AI驱动的视频制作平台,将博客文章或新闻内容自动转换为视频。 相关信息:Lumen5使用自然语言处理和机器学习技术,自动生成带有图片、视频片段和文本的视频。 这些AI工具和平台展示了人工智能在创意领域的巨大潜力,帮助用户在绘画、音乐和视频制作等方面实现自动化和创新。
2024-05-30