Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI数据来源

Answer

以下是关于生成式 AI 不同领域 2024 年 1 - 3 月的季度数据报告:

文字 - 社交

  • 数据来源:Similarweb,Visit,单位为万,变化公式为 3 月/2 月 - 1 * 100%。
  • 3 月个人视频访问量为 71 万。
  • 赛道方面:天花板潜力为 14 亿美金,对标公司无,总体趋势下滑严重,月平均增速为 - 5.7 万 PV/月,原生产品占比低,多为原有换脸产品升级。
  • 竞争方面:Top1 占比 76%,Top3 占比 92%,马太效应较强,网络效应弱,大厂未入局,大厂占比低,技术门槛中。
  • Top1 公司(非大厂)为 Deepfakes Web,其最新月 PV 为 54 万。

音频大类

  • 网址:aiwatch.ai
  • 数据来源:Similarweb,Visit,单位为万,变化公式为 3 月/2 月 - 1 * 100%。
  • 赛道方面:天花板潜力为 200 亿美金,对标公司为 Spotify,总体趋势高速增长,月平均增速为 522 万 PV/月,原生产品占比高。
  • 竞争方面:Top1 占比 33%,Top3 占比 53%,马太效应中,网络效应较高,大厂已入局,大厂占比低,技术门槛高。
  • Top1 公司(非大厂)为 sunoAI,其 3 月 PV 为 2192 万,单用户 PV 价值为 0.27 美元。

文字 - 教育

  • 网址:aiwatch.ai
  • 数据来源:Similarweb,Visit,单位为万,变化公式为 3 月/2 月 - 1 * 100%。
  • 赛道方面:天花板潜力约 30 亿,对标公司为 Chegg,总体趋势快速增长,月平均增速为 1793 万 PV/月,原生产品占比低。
  • 竞争方面:Top1 占比 45%,Top3 占比 76%,马太效应弱,网络效应弱,大厂未入局,大厂占比低,技术门槛中。
  • Top1 公司(非大厂)为 Quizlet,其估值为 10 亿美元(2020.5),3 月 PV 为 1.3 亿,收入约 7500 万美元(2023),PS 为 13.3x,单用户 PV 价值为 7.5 美元。
Content generated by AI large model, please carefully verify (powered by aily)

References

生成式AI季度数据报告_2024Q1.pdf

数据来源:Similarweb,Visit,单位:万变化公式:3月/2月-1 *100%aiwatch.ai数据来源:Similarweb,Visit,单位:万变化公式:3月/2月-1 *100%3.6个人视频71万赛道•天花板潜力:14亿美金;对标公司:无•总体趋势:下滑严重,-19%•月平均增速:-5.7万PV/月•原生产品占比:低(多为原有换脸产品升级)竞争• Top1:76%• Top3:92%•马太效应:较强•网络效应:弱•大厂是否入局:否•大厂占比:低•技术门槛:中Top1公司(非大厂)• Top1产品及所在公司:Deepfakes Web•估值:未披露•最新月PV:54万访问网址,或扫码可访问本页表格23年12月至24年3月月访问量排行榜及变化情况赛道月访问总量及构成• 2023年4月:月访问量约103.5万,Deepfakes Web以64万的访问量位居第一,占比62%• 2024年3月:月访问量降至73.6万,Deepfakes Web访问量降至54.3万,占比提升至74%月访问量变化情况

生成式AI季度数据报告_2024Q1.pdf

网址:aiwatch.ai本产品保密并受到版权法保护Confidential and Protected by Copyright Laws推特:@financeYF5a16z GenAI音乐工具aiwatch.aiSource:https://a16z.com/the-future-of-music-how-generative-ai-is-transforming-the-music-industry/ 120aiwatch.ai数据来源:Similarweb,Visit,单位:万变化公式:3月/2月-1 *100%5.1音乐4458万赛道•天花板潜力:200亿美金;对标公司:Spotify•总体趋势:高速增长,+54.23%,24年亮点行业•月平均增速:522万PV/月•原生产品占比:高竞争• Top1:33%• Top3:53%•马太效应:中•网络效应:较高•大厂是否入局:是•大厂占比:低•技术门槛:高Top1公司(非大厂)• sunoAI•估值:600万$• 3月PV:2192万•单用户PV价值:0.27$访问网址,或扫码可访问本页表格23年12月至24年3月月访问量排行榜及变化情况

生成式AI季度数据报告_2024Q1.pdf

网址:aiwatch.ai本产品保密并受到版权法保护Confidential and Protected by Copyright Laws推特:@financeYF5a16z AI+教育图谱aiwatch.aiSource:https://twitter.com/zachcohen25/status/1757497529523110191 62教育工具图谱aiwatch.aiaiwatch.ai数据来源:Similarweb,Visit,单位:万变化公式:3月/2月-1 *100%1.20教育工具2.97亿赛道•天花板潜力TAM:~30亿•对标公司:Chegg•总体趋势:快速增长,22%•月平均增速:1793万PV/月•原生产品占比:低竞争• Top1 45%• Top3 76%•马太效应:弱•网络效应:弱•大厂是否入局:无•大厂占比:低•技术门槛:中• Top1公司(非大厂)• Quizlet估值:10亿$(2020.5)• 3月PV:1.3亿•收入:~7500万$(2023)• PS:13.3x•单用户PV价值:7.5$•团队特点:传统教育应用转型访问网址,或扫码可访问本页表格23年12月至24年3月月访问量排行榜及变化情况1.5教育辅助榜单

Others are asking
我应该怎样开始学习AI
以下是新手开始学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 对于中学生来说: 从编程语言入手学习,如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等,探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 学习 AI 基础知识,包括基本概念、发展历程、主要技术及在各领域的应用案例。 参与 AI 相关的实践项目,如参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题。 关注 AI 发展的前沿动态,关注权威媒体和学者,思考 AI 技术对未来社会的影响。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-30
国内AI工具及相关网站有哪些?
以下是国内部分 AI 工具及相关网站: |排行|产品名|分类| |||| |15|墨刀 AI|设计工具| |16|无限画|图像生成| |17|autoDL 云服务租用|Agent| |18|百度 Chat|AI ChatBots| |19|360AI 搜索(没接 GA)|搜索| |20|AIbot ai 工具集|导航网站| |21|创客贴 AI|设计工具| |22|MasterGo|设计工具| |23|美图设计室|图像编辑| |24|魔搭社区阿里达摩院|AI 训练模型| |25|即时 AI 设计|设计工具| |26|Boardmix 博思 AI 白板|PPT| |27|百度飞桨 AI Studio|AI 学习| |28|字节扣子|| |29|提示工程指南|Prompts| |30|toolsdar|导航网站| |31|autoDL 云服务租用|| |32|AIbot ai 工具集|导航网站| |33|同花顺问财|金融| |34|魔搭社区阿里达摩院|AI 训练模型| |35|MasterGo|设计工具| |36|即时 AI 设计|设计工具| |37|百度 Chat|AI ChatBots| |38|创客贴 AI|设计工具| |39|即梦 AI(剪映)|其他视频生成| |40|可灵 AI|其他视频生成| |41|360 快剪辑|视频编辑| |42|Dify.ai|Agent| |43|Vast(算力)|| |44|提示工程指南|Prompts| |45|站酷海洛|资源| |46|toolsdar|导航网站| |47|百度飞桨 AI Studio|AI 学习| |48|Boardmix 博思 AI 白板|PPT| |49|讯飞听见|转录| |50|帆软战略|电商| |51|帆软数据|数据分析| |52|360 苏打办公|生产力| |53|标小智 LOGO 生成|图像生成| |54|edrawsoft|思维导图| |55|彩云|通用写作| |56|虎课网免费在线视频教程|AI 学习| |57|xmind|思维导图| |58|秘塔写作猫|通用写作| |59|Pixso AI|设计工具| |60|火山翻译|翻译| |61|aippt|PPT|
2025-01-30
可以做一个小红书私信自动回复的ai程序或者智能体吗
在理论上是可以创建一个小红书私信自动回复的 AI 程序或智能体的。但这需要一定的技术知识和开发能力。 首先,您需要确定回复的规则和逻辑,例如根据关键词、常见问题类型等来设定回复内容。 其次,选择适合的技术框架和工具,比如使用自然语言处理(NLP)技术和相关的库。 然后,进行数据收集和预处理,以训练模型能够准确理解和回复私信。 不过,需要注意的是,小红书的使用规则可能对自动回复有一定的限制和要求,您需要确保您的程序或智能体的使用符合其规定。
2025-01-30
有什么绘图AI工具
以下是一些常见的绘图 AI 工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,有拖放界面方便创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能。 3. ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板用于创建多种视图。 6. draw.io(现在称为 diagrams.net):免费在线图表软件,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 转换工具,可通过描述文本自动生成相关视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图。 对于绘制 CAD 图,有以下 AI 工具和插件: 1. CADtools 12:Adobe Illustrator 插件,添加绘图和编辑工具。 2. Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 3. nTopology:基于 AI 的设计软件,帮助创建复杂 CAD 模型。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,可根据输入自动生成 3D 模型。 5. 一些主流 CAD 软件如 Autodesk 系列、SolidWorks 等提供的基于 AI 的生成设计工具。 绘制示意图的工具还有: 1. Creately:在线绘图和协作平台,利用 AI 简化图表创建,适合绘制流程图等。 2. Whimsical:专注于用户体验和快速绘图,适合创建线框图等。 3. Miro:在线白板平台,结合 AI 功能,适用于团队协作和各种示意图绘制。 使用 AI 绘制示意图的步骤: 1. 选择工具:根据具体需求选择合适的 AI 绘图工具。 2. 创建账户:注册并登录平台。 3. 选择模板:利用模板库选择适合需求的模板。 4. 添加内容:添加并编辑图形和文字,利用 AI 自动布局功能优化图表布局。 5. 协作和分享:需要团队协作可邀请成员一起编辑,完成后导出并分享图表。
2025-01-30
我是行政专员,零基础入门AI,如果帮忙自己提供工作效率和质量
对于行政专员零基础入门 AI 以提升工作效率和质量,以下是一些建议: 1. 了解 AI 的应用场景:AI 在很多领域都有显著的成果,如交通监控、银行账户欺诈检测、核融合控制、新药发现以及应对气候变化的技术等。它有潜力在您的工作中发挥作用,例如自动化一些重复性的任务。 2. 建立 AI 工作流:目前大多数人零碎地使用 AI 工具,未将其系统应用到工作场景中,导致整体效率提升不明显甚至下降。要避免像小明那样在挑选和切换工具上浪费时间,应建立一套完整、适合自己的 AI 工作方法论和流程。 3. 系统学习和实践:深入学习如何将 AI 工具与行政工作相结合,通过不断实践找到最适合自己工作的方法和工具。
2025-01-30
零基础怎么入门AI工具,行政专员一个
对于零基础的行政专员入门 AI 工具,以下是一些建议: 1. 明确学习目标:确定您希望通过 AI 工具解决哪些行政工作中的问题或提高哪些方面的效率。 2. 学习基础知识:了解 AI 的基本概念,例如机器学习、深度学习、自然语言处理等。可以通过在线课程、科普文章和视频来学习。 3. 选择适合的工具:根据行政工作的需求,选择一些易于上手的 AI 工具,如自动化文档处理工具、智能客服工具等。 4. 参加培训课程:报名参加专门针对零基础的 AI 入门培训课程,这些课程通常会有系统的教学和实践指导。 5. 实践操作:在实际工作中尝试使用所选的 AI 工具,积累经验。 6. 加入学习社区:参与 AI 学习的社区或论坛,与其他学习者交流经验,获取更多的学习资源和建议。 7. 持续学习和更新知识:AI 领域发展迅速,要保持学习的热情,不断跟进新的技术和工具。
2025-01-30
优秀的来源大模型有哪些
以下是一些优秀的大模型: Google 的 T5:属于 encoderdecoder 类型的模型,适用于翻译和摘要等任务。 OpenAI 的 GPT3:预训练数据量大,参数众多,能根据用户输入的任务描述或示例完成任务。 ChatGPT:用户通过像和人类对话的方式即可完成任务。 国内的优秀大模型有: 智谱清言(清华&智谱 AI):基础模型为 ChatGLM 大模型。在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三,更擅长专业能力,但代码能力有优化空间,知识百科稍显不足。可应用于 AI 智能体、较复杂推理、广告文案、文学写作等场景。 通义千问 2.0(阿里云):在语言理解与抽取、角色扮演能力上排名国内前一,在代码、生成与创作、上下文对话能力上排名国内前三,各项能力较为均衡。聚焦在移动设备端的应用,涵盖知识、记忆、工具、创作等方向,支持多种工具和文生文、文生图等场景。 Baichuan213BChat(百川智能):百川智能自主训练的开源大语言模型,是中文开源模型的主导力量。
2024-12-28
国内外最好的来源大模型有哪些 对比介绍一下
以下是国内外一些较好的大模型及其对比介绍: 国外大模型: GPT4 Turbo 总分 90.63 分遥遥领先,在各项能力上表现出色。 国内大模型: 文心一言 4.0(API)总分 79.02 分,过去 1 年有长足进步。 通义千问 2.0(阿里云):在代码、上下文对话基础能力上排名国内第一,各项能力较为均衡,位于国内大模型第一梯队,适合应用于金融、医疗、汽车等垂直专业场景及代码生成与纠错等场景。 AndesGPT(OPPO):在语言理解与抽取、角色扮演能力上排名国内前一,在代码、生成与创作、上下文对话能力上排名国内前三,各项能力较为均衡,聚焦在移动设备端的应用。 百川智能的 Baichuan213BChat:是中文开源模型的主导力量,在中文上表现优于国外开源模型。 在 SuperCLUE 测评中,国外模型的平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右,但国内外的平均水平差距在缩小。另外,国内开源模型在中文上表现要好于国外开源模型。
2024-12-28
自己的ai来源模型是什么
智谱·AI 的开源模型包括以下部分: 其他模型: WebGLM10B:利用百亿参数通用语言模型(GLM)提供高效、经济的网络增强型问题解答系统,旨在通过将网络搜索和检索功能集成到预训练的语言模型中,改进现实世界的应用部署。 WebGLM2B MathGLM2B:在训练数据充足的情况下,20 亿参数的 MathGLM 模型能够准确地执行多位算术运算,准确率几乎可以达到 100%,其结果显著超越最强大语言模型 GPT4 在相同测试数据上 18.84%的准确率。 MathGLM500M MathGLM100M MathGLM10M MathGLMLarge:采用 GLM 的不同变体作为骨干来训练 MathGLM,包括具有 335M 参数的 GLMlarge 和 GLM10B。此外,还使用 ChatGLM6B 和 ChatGLM26B 作为基座模型来训练 MathGLM。这些骨干模型赋予 MathGLM 基本的语言理解能力,使其能够有效理解数学应用题中包含的语言信息。 多模态模型: CogAgent18B:基于 CogVLM17B 改进的开源视觉语言模型。CogAgent18B 拥有 110 亿视觉参数和 70 亿语言参数,支持 11201120 分辨率的图像理解,在 CogVLM 功能的基础上,具备 GUI 图像的 Agent 能力。 CogVLM17B:强大的开源视觉语言模型(VLM)。基于对视觉和语言信息之间融合的理解,CogVLM 可以在不牺牲任何 NLP 任务性能的情况下,实现视觉语言特征的深度融合。 Visualglm6B:一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数;图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。 部署和训练自己的 AI 开源模型的主要步骤如下: 1. 选择合适的部署方式,包括本地环境部署、云计算平台部署、分布式部署、模型压缩和量化、公共云服务商部署等,根据自身的资源、安全和性能需求选择合适的部署方式。 2. 准备训练所需的数据和计算资源,确保有足够的训练数据覆盖目标应用场景,并准备足够的计算资源,如 GPU 服务器或云计算资源。 3. 选择合适的预训练模型作为基础,可以使用开源的预训练模型如 BERT、GPT 等作为基础,也可以自行训练一个基础模型。 4. 针对目标任务进行模型微调训练,根据具体应用场景对预训练模型进行微调训练,优化模型结构和训练过程以提高性能。 5. 部署和调试模型,将训练好的模型部署到生产环境,对部署的模型进行在线调试和性能优化。 6. 注意安全性和隐私保护,大模型涉及大量数据和隐私信息,需要重视安全性和合规性。 总的来说,部署和训练自己的大模型需要综合考虑多方面因素,包括部署方式、数据准备、模型训练、部署调试以及安全性等。需要根据具体需求选择合适的方法,并注意优化各个环节以提高模型性能和应用效果。
2024-12-27
撰写内容概要:以ai换脸诈骗和声音合成诈骗为蓝本查阅网站、文献期刊等专家在相关方面的研究进展及其成果,并进行汇总评述。(1)表述收集资料的来源情况、收集资料的数量情况;(2)将所收集的资料进行分类,按照几个分类方面逐一进行表述,表述涵盖专家的观点、结论、思路、方案等;(3)小组综合性的对所收集到的资料进行评述,描述当前的进展情况、优劣点、未来发展等。)
以下是根据您提供的资料进行的汇总评述: 一、收集资料的情况 1. 来源情况:资料来源于陶力文律师的相关论述、关于 AI 音乐的论文、质朴发言的研究报告等。 2. 数量情况:共收集到 3 份相关资料。 二、资料分类及专家观点 1. 关于律师如何写好提示词用好 AI 观点:强调结构化内容组织、规定概述内容解读结语结构、案例和挑战结合、结合法规和实际操作、使用商业术语等。 结论:通过多种方式提升文章的专业性和针对性。 思路:从标题、文章结构等方面进行规划。 方案:按照特定的结构和要求进行写作。 2. 基于频谱图的音乐录音中自动调谐人声检测 观点:聚焦音乐中人声音高的自动调音检测,提出数据驱动的检测方法。 结论:所提方法在检测上表现出较高的精确度和准确率。 思路:包括音频预处理、特征提取和分类等步骤。 方案:创建新数据集,进行全面评估。 3. 文生图/文生视频技术发展路径与应用场景 观点:从横向和纵向梳理文生图技术发展脉络,分析主流路径和模型核心原理。 结论:揭示技术的优势、局限性和未来发展方向。 思路:探讨技术在实际应用中的潜力和挑战。 方案:预测未来发展趋势,提供全面深入的视角。 三、综合性评述 当前在这些领域的研究取得了一定的进展,如在音乐自动调音检测方面提出了新的方法和数据集,在文生图/文生视频技术方面梳理了发展路径和应用场景。 优点在于研究具有创新性和实用性,为相关领域的发展提供了有价值的参考。但也存在一些不足,如音乐检测研究中缺乏专业自动调音样本,部分技术在实际应用中可能面临一些挑战。 未来发展方面,有望在数据样本的丰富性、技术的优化和多模态整合等方面取得进一步突破,拓展更多的应用场景。
2024-11-15
你的知识库来源于哪里
我的知识库来源较为广泛,包括以下方面: 符号人工智能的早期成就之一——专家系统,其基于从人类专家提取的知识库,并包含推理引擎进行推理。专家系统包含问题记忆、知识库、推理引擎等部分。 “通往 AGI 之路「WaytoAGI」,这是一个由开发者、学者和有志人士等参与的学习社区和开源的 AI 知识库。 扣子的知识库,功能强大,可上传和存储外部知识内容,并提供多种查找知识的方法,能解决大模型的某些问题,使其回复更准确。
2024-11-13
字节跳动旗下的即梦AI的模型来源是什么?以及它的数据训练库
目前没有关于字节跳动旗下即梦 AI 的模型来源以及数据训练库的准确和详细信息。但一般来说,AI 模型的训练数据可能来自多种来源,如维基百科、书籍、期刊、网络采集的图片/标题等。同时,在训练过程中可能会使用开源架构,并进行原创性的优化和突破。但对于即梦 AI 具体的情况,还需要更多确切的官方公布内容。
2024-08-25
我是一个AI小白,我使用AI的主要目的是使用这些工具,简化我工作中费时费力的事情,比如:表格的制作,筛选数据;图片的抠图,渲染,产品的口播介绍;日常工厂管理文件的编写及执行步骤;工作手册及岗位绩效的编写;作业指导书的编写
以下是为您整合的相关内容: 对于 AI 小白来说,使用 AI 工具简化工作中的费时费力之事是可行的。 在接触 AI 工具时,对于超出自己理解范围的事情,最简单有效的方法就是尝试。学习新事物,实践比听闻更重要。 比如在 AI 视频制作方面,人物设定与剧本是关键部分,包括主体、动作、场景等要素;分镜处理也较为重要,要考虑用几个镜头表述内容;生成环节如同抽卡,可多尝试,最后进行粗检和后期处理,如 AI 配音剪辑、加过渡滤镜等。小白制作 AI 视频要做好脚本即提示词,有耐心抽卡,并不断提升撰写提示词的能力。撰写提示词时要了解主体、动作、场景,避免使用专有名词和网络名词,给 AI 清晰描述。工具选用方面,没有绝对好的工具,只有适合的,如小白可使用剪映,主力机是 MacBook Pro 可使用 final cut。还可向 ChatGPT 询问获取灵感。 另外,在“AI 布道”活动中发现,AI 工具虽强大能做很多事,但也在其与普通人之间形成了一道墙。AI 是未来必然的方向,其科普还有很长的路要走,但尽可能简单地试用它,能让普通人更快受益。无论是什么身份、什么年龄段的人,都可以尝试使用 AI 工具。 如果您想要跟相关作者交朋友、一起在 AI 路上探寻,欢迎戳这里:
2025-01-30
我想通过dify调整一个客服系统,但是总是不能很好的把知识库里的数据回复完整?
使用 Dify 构建知识库的具体步骤如下: 1. 准备数据: 收集需要纳入知识库的文本数据,包括文档、表格等格式。 对数据进行清洗、分段等预处理,确保数据质量。 2. 创建数据集: 在 Dify 中创建一个新的数据集,并将准备好的文档上传至该数据集。 为数据集编写良好的描述,描述清楚数据集包含的内容和特点。 3. 配置索引方式: Dify 提供了三种索引方式供选择:高质量模式、经济模式和 Q&A 分段模式。 根据实际需求选择合适的索引方式,如需要更高准确度可选高质量模式。 4. 集成至应用: 将创建好的数据集集成到 Dify 的对话型应用中,作为应用的上下文知识库使用。 在应用设置中,可以配置数据集的使用方式,如是否允许跨数据集搜索等。 5. 持续优化: 收集用户反馈,对知识库内容和索引方式进行持续优化和迭代。 定期更新知识库,增加新的内容以保持知识库的时效性。 总的来说,Dify 提供了一个可视化的知识库管理工具,使得构建和维护知识库变得相对简单。关键步骤包括数据准备、数据集创建、索引配置,以及将知识库集成到应用中并持续优化。需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2025-01-29
用 ai 来分析数据,附件大小有限制吗
使用 AI 来分析数据时,附件大小通常是有限制的。 对于代码解释器(一种 GPT4 模式),您可以将文件上传到 AI,它可用于执行程序、运行数据分析等,但使用时需要充分了解统计数据和数据以检查其工作。 在 ChatGPT 助力的数据分析中,文中所提到的个性化分析示例使用的均是假数据。在实际业务中处理大量数据时,除了长类型字段有限制外,还需指定允许查询或解析的字段告诉 ChatGPT,结果数据要进一步校验是否符合要求,超长数据可以截取关键字段的内容丢给 GPT 总结分析。 需要注意的是,不同的 AI 工具和应用场景可能会有不同的附件大小限制和数据处理要求。
2025-01-28
Coze + 飞书 + 飞书多维表格:通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出。由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,无需开发任何插件、APP,能实现跨平台的稍后读收集与智能阅读计划的推荐。其设计思路包括简化“收集”,实现跨平台收集和通过输入 URL 完成收集;自动化“整理入库”,自动整理关键信息并支持跨平台查看;智能“选择”推荐,根据收藏记录和用户兴趣生成阅读计划——这个方法具体如何操作?
以下是关于通过飞书机器人与 Coze 搭建的智能体进行对话,并利用飞书多维表格存储和管理稍后读数据,实现跨平台的稍后读收集与智能阅读计划推荐的具体操作方法: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口完成收集输入。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用飞书·稍后读助手: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。但目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 至此,专属 AI 稍后读智能体大功告成,您可以尽情享受相关服务。
2025-01-27
AI数据透视工具推荐
以下为您推荐一些可用于数据透视的 AI 工具: 1. Lucidchart:流行的在线绘图工具,支持多种视图创建,包括逻辑视图、功能视图和部署视图,用户可通过拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,如逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源建模语言,专门用于企业架构,支持逻辑视图创建,可与 Archi 工具配合使用,该工具提供图形化界面创建模型。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现称为 diagrams.net):免费的在线图表软件,允许创建各种类型图表,包括软件架构图,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 以下是一些设计工具的排行及相关数据: |排行|产品名|分类|6 月访问量(万 Visit)|相对 5 月变化| |||||| |1|Canva Al|设计工具|55900|0.123| |2|Adobe Firefly|设计工具|928|0.047| |3|CF Spark|设计工具|885|0.023| |4|Microsoft Designer|设计工具|885|0.321| |5|What font is|设计工具|362|0.045| |6|稿定设计|设计工具|247|0.068| |7|墨刀 AI|设计工具|202|0.148| |8|Hotpot.ai|设计工具|198|0.244| |9|vectorizer.ai|设计工具|183|0.042| |10|Wepik by freepik|设计工具|164|0.304| |排行|产品名|分类|4 月访问量(万 Visit)|相对 3 月变化| |||||| |1|Canva Al|设计工具|58640|0.033| |2|CF Spark|设计工具|940|0.118| |3|Adobe Firefly|设计工具|835|0.051| |4|Microsoft Designer|设计工具|612|0.179| |5|What font is|设计工具|348|0.006| |6|Wepik by freepik|设计工具|284|0.295| |7|Hotpot.ai|设计工具|283|0.024| |8|稿定设计|设计工具|264|0.078| |9|Designs AI|设计工具|185|0.167| |10|墨刀 AI|设计工具|179|0.016|
2025-01-26
如何用最简单的方法,训练一个自有数据的大模型
训练自有数据的大模型可以通过以下步骤实现: 1. 了解大模型的概念:大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。可以用上学参加工作来类比大模型的训练、使用过程,包括找学校(需要大量 GPU 等计算资源)、确定教材(需要大量数据)、找老师(选择合适算法)、就业指导(进行微调)、搬砖(推导)。在 LLM 中,Token 被视为模型处理和生成的文本单位,会对输入进行分词并形成词汇表。 2. 基础训练步骤: 进入厚德云模型训练数据集,如 https://portal.houdeyun.cn/sd/dataset 。 创建数据集:在数据集一栏中,点击右上角创建数据集,输入数据集名称。可以上传包含图片+标签的 zip 文件,也可单独上传照片,但建议提前打包。Zip 文件里图片名称与标签文件应当匹配,上传后等待一段时间确认创建,返回上一个页面等待上传成功并可点击详情检查,能预览数据集的图片及对应的标签。 Lora 训练:点击 Flux,基础模型会默认是 FLUX 1.0D 版本。选择数据集,触发词可有可无,模型效果预览提示词随机抽取数据集里的标签填入。训练参数可调节重复次数与训练轮数,厚德云会自动计算训练步数,可默认 20 重复次数和 10 轮训练轮数,按需求选择是否加速,点击开始训练,会显示所需消耗的算力,等待训练完成,会显示每一轮的预览图,鼠标悬浮到想要的轮次模型,中间会有生图,点击可自动跳转到使用此 lora 生图的界面,点击下方下载按钮可自动下载到本地。 3. 部署和训练自己的 AI 开源模型的主要步骤: 选择合适的部署方式,如本地环境部署、云计算平台部署、分布式部署、模型压缩和量化、公共云服务商部署,根据自身资源、安全和性能需求选择。 准备训练所需的数据和计算资源,确保有足够的训练数据覆盖目标应用场景,并准备足够的计算资源,如 GPU 服务器或云计算资源。 选择合适的预训练模型作为基础,如开源的预训练模型 BERT、GPT 等,也可自行训练基础模型。 针对目标任务进行模型微调训练,根据具体应用场景对预训练模型进行微调训练,优化模型结构和训练过程以提高性能。 部署和调试模型,将训练好的模型部署到生产环境,对部署的模型进行在线调试和性能优化。 注意安全性和隐私保护,大模型涉及大量数据和隐私信息,需要重视安全性和合规性。 总的来说,训练自有数据的大模型需要综合考虑多方面因素,包括部署方式、数据准备、模型训练、部署调试以及安全性等。需要根据具体需求选择合适的方法,并注意优化各个环节以提高模型性能和应用效果。
2025-01-24