直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

优秀的数据集网站

回答

以下为一些优秀的数据集网站及相关数据集介绍:

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

中文数据集

|ID|标题|更新日期|数据集提供者|许可|说明|关键字|类别|论文地址|备注||-|-|-|-|-|-|-|-|-|-||11|[中科大新闻分类语料库](http://www.nlpir.org/?action-viewnews-itemid-145)|43040|刘禹中国科学院自动化研究所综合信息中心||暂时不能下载,已经联系作者,等待反馈|新闻|||||12|[ChnSentiCorp_htl_all](https://github.com/SophonPlus/ChineseNlpCorpus/tree/master/datasets)|43160|[https://github.com/SophonPlus/ChineseNlpCorpus](https://github.com/SophonPlus/ChineseNlpCorpus)||7000多条酒店评论数据,5000多条正向评论,2000多条负向评论||||||13|[waimai_10k](https://github.com/SophonPlus/ChineseNlpCorpus/tree/master/datasets)|43160|[https://github.com/SophonPlus/ChineseNlpCorpus](https://github.com/SophonPlus/ChineseNlpCorpus)||某外卖平台收集的用户评价,正向4000条,负向约8000条||||||14|[online_shopping_10_cats](https://github.com/SophonPlus/ChineseNlpCorpus/tree/master/datasets)|43160|[https://github.com/SophonPlus/ChineseNlpCorpus](https://github.com/SophonPlus/ChineseNlpCorpus)||10个类别,共6万多条评论数据,正、负向评论各约3万条,包括书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店||||||15|[weibo_senti_100k](https://github.com/SophonPlus/ChineseNlpCorpus/tree/master/datasets)|43160|[https://github.com/SophonPlus/ChineseNlpCorpus](https://github.com/SophonPlus/ChineseNlpCorpus)||10万多条,带情感标注新浪微博,正负向评论约各5万条|||||

中文数据集

|ID|标题|更新日期|数据集提供者|许可|说明|关键字|类别|论文地址|备注||-|-|-|-|-|-|-|-|-|-||1|[NewsQA](https://github.com/Maluuba/newsqa)|43721|微软研究院||Maluuba NewsQA数据集的目的是帮助研究社区构建能够回答需要人类水平的理解和推理技能的问题的算法。包含超过12000篇新闻文章和120,000答案,每篇文章平均616个单词,每个问题有2~3个答案。|英文|QA|[论文](https://arxiv.org/abs/1611.09830)|||2|[SQuAD](https://rajpurkar.github.io/SQuAD-explorer/)||斯坦福||斯坦福问答数据集(SQuAD)是一个阅读理解数据集,由维基百科的一组文章上提出的问题组成,其中每个问题的答案都是一段文本,可能来自相应的阅读段落,或者问题可能是未解答的。|英文|QA|[论文](https://arxiv.org/abs/1606.05250)|||3|[SimpleQuestions](https://www.dropbox.com/s/tohrsllcfy7rch4/SimpleQuestions_v2.tgz)||Facebook||基于存储网络的大规模简单问答系统,数据集提供了一个多任务问答数据集,数据集有100K简单问题的回答。|英文|QA|[论文](https://arxiv.org/pdf/1506.02075v1.pdf)||

中文数据集

|ID|标题|更新日期|数据集提供者|许可|说明|关键字|类别|论文地址|备注||-|-|-|-|-|-|-|-|-|-||12|[cMedQA2](https://github.com/zhangsheng93/cMedQA2)|43412|寻药寻医网和国防科技大学信息系统及管理学院||该数据集来源为寻医寻药网站中的提问和回答,数据集做过匿名处理,提供的是包含训练集中有100,000个问题,188,490个答案,平均每个问题、答案字符数分别为为48、101个;验证集有4,000个问题,有7527个答案,问题和答案的平均字符数分别为49和101个;测试集有4,000个问题,有7552个答案,问题和答案的平均字符数分别为49和100个;数据集总量有108,000个问题,203,569个答案,平均每个问题和答案的字符数分别为49、101个;|医疗问答匹配|问答匹配|[论文](https://www.mdpi.com/2076-3417/7/8/767)|||13|[ChineseSTS](https://github.com/IAdmireu/ChineseSTS)|42999|唐善成,白云悦,马付玉.西安科技大学||该数据集提供了12747对中文相似数据集,在数据集后作者给出了他们相似度的打分,语料由短句构成。|短句相似度匹配|相似度匹配|||

其他人在问
在生成刺绣图片上表现优秀的AI工具
以下是在生成刺绣图片方面可能表现优秀的 AI 工具,以及一些相关的图生图 AI 工具供您参考: 图生图 AI 工具: Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 不过目前尚未有专门针对生成刺绣图片的特定 AI 工具。这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出,但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。
2024-11-15
优秀的AI图像生成产品
以下是一些优秀的 AI 图像生成产品: 1. Artguru AI Art Generator:这是一个在线平台,能够生成逼真图像,为设计师提供灵感,丰富创作过程。其在不同月份的访问量排名较为靠前,且有一定的变化。 2. Retrato:AI 工具,可将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 需要注意的是,这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出,但仍存在一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。
2024-10-30
有哪些优秀的智能体案例
以下是一些优秀的智能体案例: 在企业自动化方面,新兴的智能体公司有(用于财务后勤),以及横跨销售、安全运营和供应链等领域的许多其他智能体。 在 C 端,社交方向有用户注册后先捏一个自己的智能体,然后让其与他人的智能体聊天,两个智能体聊到一起后再真人介入的有趣场景,还有借 Onlyfans 入局打造个性化聊天的创业公司。 在 B 端,如果字节扣子和腾讯元器是面向普通人的低代码平台,类似 APP 时代的个人开发者,那还有帮助 B 端商家搭建智能体的机会。常见的智能体开发平台有字节的“扣子”(Coze)、Dify.AI 等。
2024-10-07
帮忙推荐AI优秀的书籍,让我们快速入门
以下是为您推荐的能够帮助您快速入门 AI 的优秀书籍: 《陈财猫:推荐书单了解各个领域的知识,并在恰当的时候调用它们》:这是一个涵盖多个学科的书单,包括心理学、人工智能、经济学、社会学、生态学、哲学、设计学等 13 个学科。其特点包括权威准确,多为大学教材或导论书籍,不乏经典大师之作;有框架成体系,能通过阅读构建起完整知识框架;好读,适合初学者,即使对该领域没有了解也能看懂并入门。 《写给不会代码的你:20 分钟上手 Python + AI》: Python 方面:推荐《Python 学习手册》,名声在外;《Python 编程》,对新手友好。 AI 方面:推荐《人类简史》,其中“认知革命”的相关章节令人获益匪浅;《深度学习实战》,按脉络梳理了 ChatGPT 爆发前的 AI 信息与实践。
2024-09-17
科普性质的介绍下目前大模型的优秀应用案例和实施经验
以下为目前大模型的一些优秀应用案例和实施经验: 在问答行业: Baichuan 借鉴了 Meta 的 CoVe 技术,将复杂 Prompt 拆分为多个独立且可并行检索的搜索友好型查询,使大模型能够对每个子查询进行定向知识库搜索。 利用自研的 TSF(ThinkStep Further)技术来推断和挖掘用户输入背后更深层的问题,以更精准、全面地理解用户意图。 自研 BaichuanTextEmbedding 向量模型,对超过 1.5T tokens 的高质量中文数据进行预训练,并通过自研损失函数解决了对比学习方式依赖 batchsize 的问题。同时引入稀疏检索和 rerank 模型,形成向量检索与稀疏检索并行的混合检索方式,大幅提升了目标文档的召回率,达到 95%。 在医疗行业: 涵盖疾病的诊断与预测、药物研发以及个性化医疗等方向。 例如,麻省理工学院利用 AI 发现了新型广谱抗生素 Halicin。研究者先构建由两千个性能已知的分子组成的训练集,用它们训练 AI 学习分子特点,总结规律,再对美国 FDA 已通过的六万多个分子进行分析,最终成功识别出有效分子,且实验证明效果良好。 在模型架构方面: 包括 encoderonly、encoderdecoder 和 decoderonly 等类型。 如 BERT 是 encoderonly 模型的代表,google 的 T5 是 encoderdecoder 模型的代表,众多熟知的 AI 助手包括 ChatGPT 基本属于 decoderonly 架构。 大模型的特点在于预训练数据量大,往往来自互联网上的多种来源,且参数众多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。
2024-09-13
通往AGI之路整理了哪些优秀的AI网站列表
以下是通往 AGI 之路整理的一些优秀的 AI 网站:
2024-09-12
撰写内容概要:以ai换脸诈骗和声音合成诈骗为蓝本查阅网站、文献期刊等专家在相关方面的研究进展及其成果,并进行汇总评述。(1)表述收集资料的来源情况、收集资料的数量情况;(2)将所收集的资料进行分类,按照几个分类方面逐一进行表述,表述涵盖专家的观点、结论、思路、方案等;(3)小组综合性的对所收集到的资料进行评述,描述当前的进展情况、优劣点、未来发展等。)
以下是根据您提供的资料进行的汇总评述: 一、收集资料的情况 1. 来源情况:资料来源于陶力文律师的相关论述、关于 AI 音乐的论文、质朴发言的研究报告等。 2. 数量情况:共收集到 3 份相关资料。 二、资料分类及专家观点 1. 关于律师如何写好提示词用好 AI 观点:强调结构化内容组织、规定概述内容解读结语结构、案例和挑战结合、结合法规和实际操作、使用商业术语等。 结论:通过多种方式提升文章的专业性和针对性。 思路:从标题、文章结构等方面进行规划。 方案:按照特定的结构和要求进行写作。 2. 基于频谱图的音乐录音中自动调谐人声检测 观点:聚焦音乐中人声音高的自动调音检测,提出数据驱动的检测方法。 结论:所提方法在检测上表现出较高的精确度和准确率。 思路:包括音频预处理、特征提取和分类等步骤。 方案:创建新数据集,进行全面评估。 3. 文生图/文生视频技术发展路径与应用场景 观点:从横向和纵向梳理文生图技术发展脉络,分析主流路径和模型核心原理。 结论:揭示技术的优势、局限性和未来发展方向。 思路:探讨技术在实际应用中的潜力和挑战。 方案:预测未来发展趋势,提供全面深入的视角。 三、综合性评述 当前在这些领域的研究取得了一定的进展,如在音乐自动调音检测方面提出了新的方法和数据集,在文生图/文生视频技术方面梳理了发展路径和应用场景。 优点在于研究具有创新性和实用性,为相关领域的发展提供了有价值的参考。但也存在一些不足,如音乐检测研究中缺乏专业自动调音样本,部分技术在实际应用中可能面临一些挑战。 未来发展方面,有望在数据样本的丰富性、技术的优化和多模态整合等方面取得进一步突破,拓展更多的应用场景。
2024-11-15
AI 网站哪一个写文章好
以下是一些在写文章方面表现较好的 AI 网站和工具: 1. 对于文章排版: Grammarly:不仅是语法和拼写检查工具,还提供排版功能,可改进文档风格和流畅性。 QuillBot:AI 驱动的写作和排版工具,能改进文本清晰度和流畅性。 Latex:常用于学术论文排版,使用标记语言描述格式,有许多 AI 辅助的编辑器和插件。 PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 Wordtune:AI 写作助手,可重新表述和改进文本。 Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的工具取决于具体需求,如文档类型、出版标准和个人偏好。学术论文常选 Latex 和 Overleaf,一般文章和商业文档可选 Grammarly 和 PandaDoc 等。 2. 辅助写邮件的 AI 工具: Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能,易于使用,支持多平台和多种语言。 Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句,界面简洁。 ProWritingAid:全面的语法和风格检查,提供详细写作报告和建议,功能强大,支持多平台和集成。 Writesonic:基于 AI 生成各种类型文本,包括电子邮件,生成速度快。 Lavender:专注邮件写作优化,提供个性化建议和模板,帮助提高邮件打开率和回复率。 3. 利用 AI 打造爆款公众号文章: 关键在于提供清晰且具有指导性的提示词(prompt)。好的提示词能让 AI 更准确理解需求并生成符合预期的内容。如“请根据我们收集的关于 OpenAI 回应马斯克言论的资讯,创作一篇既深入又易于理解的科技资讯文章。文章应该有一个吸引人的标题,开头部分要概述事件的背景和重要性,主体部分详细分析 OpenAI 的回应内容及其可能产生的影响,结尾处提出一些引人深思的问题或观点。”这样的提示词能为 AI 提供明确指导和设定文章基本结构、内容要求。最终产出的内容可能需要微调以符合预期和公众号风格。
2024-11-14
有和mj差不多的网站吗
以下是一些和 Midjourney 类似的网站: 1. Stable Diffusion:是一种可根据文本生成图像的人工智能程序。 2. DALL·E2:能够根据输入的描述生成逼真的图像。 Midjourney 是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于 2022 年 7 月 12 日进入公开测试阶段,用户可透过 Discord 的机器人指令进行操作创作图像作品。通过 Discord 的社区属性,它具有更轻量的产品形态、更简单的生图方式,且图片质量很高。MJ 具备更简单的交互,更直观的生成、放大、保留、分享功能,如果愿意购买更高级的服务,甚至可以享受更快速、更强大的增值服务。 Midjourney 官网现已向生成 100 张以上图片的用户开放了使用权限,登录 MJ 官网,左侧为各种页面入口,顶部是生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,可随时使用 prompt 框和搜索框,方便查找参考和进行创作,无需频繁切换页面。还可以通过点击 prompt 框最右侧的图标来设置常用参数的默认值,包括画面比例和个性化模型开关。在官网上使用图片参考也变得简单直观,只需要点击 prompt 框最左侧的图片按钮,或直接拖入图片即可,并且官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,点击相应的图标即可,如需多种参考逻辑可按住 shift 键点选多个图标。创作页面最大亮点是 prompt 的复用,可以直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片则会进入单图调整模式,在 discord 中常用的操作指令都被集中在了右下角的按键中,并且上线了全新的 Editor 编辑器功能。 另外,MJ 官网更新了,刷图超过 1000 张的就可以用 alpha 版本了。可以不用在 discord 服务器生图了,官网操作更方便,很多参数直接可以控制。前几天还是需要 10000 张才可以,门槛降低了,过两天估计可以全量开放了。在官网上可以看各种排行榜和厉害的作品,右键也新增了很多功能,不错的作品也容易被发现,还有提示词可以直接复制。
2024-11-14
完全不会编程的人能使用AI完成网站和app的开发吗
完全不会编程的人在一定程度上可以借助 AI 来开发网站和 app,但存在一定的限制。 从去年三月 GPT4 发布会的手绘草图直接生成网站的 demo 开始,人们对非编程人员开发应用充满期待。然而,现实情况是,真正的应用往往有复杂的特殊需求,代码量也可能超出 AI 单次处理能力,AI 无法直接完成。比如,纯小白使用 cursor 创建起始文件后,可能会不知从何下手。 但也有一些积极的情况,没有任何编码能力的人独自创建的应用程序或网站有迅速走红的可能。对于纯小白,如果需求复杂无法一次性直出,需要在 AI 的帮助下一步一步来,并在这个过程中学习一些编程知识。 在深入学习 AI 时,即使不会编程,也可以通过一些教程,如 20 分钟上手 Python + AI,来逐渐掌握相关技能。Python 拥有丰富的标准库,还可以通过工具和平台获取更多资源。OpenAI 提供了 ChatGPT 这种开箱即用的服务,也有通过代码调用的 OpenAI API 来完成更多自动化任务。
2024-11-13
零基础学习AI,需要报名学习,还是先免费网站开始
对于零基础学习 AI,您可以先从以下几个方面入手: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能是什么,其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,您可以按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 建议您一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 至于是否需要报名学习还是先从免费网站开始,这取决于您的个人情况和学习习惯。如果您希望有系统的指导和监督,并且经济条件允许,报名学习可能更适合您。但如果您想先初步了解和尝试,从免费网站开始也是一个不错的选择。
2024-11-13
有没有推荐的AI制作PPT的网站
以下是一些推荐的 AI 制作 PPT 的网站: Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 《》 《》 另外,还有以下相关工具: 免费工具:讯飞智文 网址:http://zhiwen.xfyun.cn 付费工具:百度文库 网址:https://wenku.baidu.com
2024-11-13
我想知道如果我上传给Coze数据库,我的数据安全有保障吗
关于您上传数据到 Coze 数据库的数据安全保障问题,以下是相关信息: 合规说明方面: 不存在产出违法违规内容,包括色情暴力、政治敏感和违法犯罪等。 不存在爬取行为,遵循 robot.txt 爬虫协议,未使用匿名代理。 不存在版权争议问题,未爬取强版权资源、付费内容等。 不存在跨境数据传输,未使用海外 API 和海外模型。 有安全合规声明,作者声明作品没有侵权,作品安全可用且公开可接受。 Coze 数据库的功能特点: 知识库功能不仅支持上传和存储外部知识内容,还提供多样化的检索能力,能解决大模型可能出现的幻觉问题和专业领域知识的不足,显著提升回复准确性。支持从多种数据源上传文本和表格数据,自动将知识内容切分成多个片段进行存储,并允许用户自定义内容分片规则,提供多种检索方式,适应各种使用场景。 数据库具备记忆能力,可以存储和检索用户的交互历史,以提供更加个性化的服务。支持实时更新,确保信息最新。能存储用户的交互历史,包括提问、回答和反馈,用于理解用户需求和优化对话流程,可进行个性化服务和错误纠正与学习。 综上所述,从目前的信息来看,您上传给 Coze 数据库的数据在一定程度上是有安全保障的。但具体情况还需参考 Coze 数据库的最新政策和规定。
2024-11-14
用于分析excel表数据的AI工具
以下是一些可用于分析 Excel 表数据的 AI 工具: 1. Excel Labs:这是一个 Excel 插件,基于 OpenAI 技术,新增了生成式 AI 功能,允许用户在 Excel 中直接利用 AI 进行数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的 AI 工具,整合了多种办公软件,用户能以聊天形式告知需求,Copilot 会自动完成如数据分析、格式创建等任务。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户可通过自然语言交互进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,除公式生成外,还能根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 此外,Omni 的计算 AI 功能能利用 LLM 直接输出适当的 Excel 函数到电子表格中,然后执行计算并自动生成复杂查询供用户使用。 随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-14
大小模型协同有哪些数据
大小模型协同的数据来源广泛且多样,主要包括以下方面: 大模型方面: 预训练数据非常大,往往来自于互联网,涵盖论文、代码以及可爬取的公开网页等,通常采用 TB 级别的数据进行预训练。 像 GPT3 这样的大模型参数众多。 例如 Gemini 模型,其预训练数据集使用来自网络文档、书籍、代码的数据,并包括图像、音频和视频数据。 小模型方面: 针对特定任务进行训练,数据主要由与任务相关的内容组成,如专门识别猫或狗的模型,其训练数据主要是猫猫狗狗的照片。 大模型具有更广泛的应用范围和更多的通识知识,能处理多种不同任务;小模型在特定任务上表现出色。但大模型的知识来源于有限的训练数据,并非无限,且知识库不会自动更新,在某些特定或专业领域的知识可能不够全面。
2024-11-13
现有能分析EXCEL数据的AI
目前能够分析 Excel 数据的 AI 工具和插件主要有以下几种: 1. Excel Labs:这是一个 Excel 插件,新增了基于 OpenAI 技术的生成式 AI 功能,可在 Excel 中直接利用 AI 进行数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的 AI 工具,整合了多种办公软件,用户通过聊天形式告知需求,Copilot 会自动完成如数据分析、格式创建等任务。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户可通过自然语言交互进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,除公式生成外,还能根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 随着技术的不断发展,未来可能会有更多 AI 功能被集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。 此外,ChatGPT 也可以助力数据分析,其流程为:SQL 分析时,用户描述想分析的内容,后台连接数据库,附带表结构信息让 AI 输出 SQL 语句,校验为 SELECT 类型后执行并将结果数据传给 GPT 进行学习和分析,最后输出分析结论和建议,与结果数据一起返回前端页面渲染图表、展示分析结论;个性化分析时,用户上传文件并描述辅助信息,前端解析后传给 GPT 分析数据,后续步骤与 SQL 分析一致。
2024-11-11
在语音数据的标注中你有什么针对你行业(车载语音助手)的特殊标注规则
在车载语音助手这一行业的语音数据标注中,特殊标注规则如下: 1. 音素覆盖:在录音开始前构建基础的文本前端,具备简单的文本转音素(G2P)系统。录音文本要保持多样性,音素或音素组合尽可能覆盖全,统计音素序列中的 NGram,避免某些音素或组合出现频次过高或过少。 2. 场景定制:收集车载播报的常用话术、专业术语(如油量、胎压等)、音乐名或歌手名、地名和新闻播报。对业务有一定理解,并在一开始就和需求方紧密沟通。 3. 文本正确性:确保录音文本拼写无误,内容正确,删除脏话、不符合宗教信仰或政治不正确的语句。
2024-11-11
分析90万行数据,用什么AI
以下是一些可用于分析 90 万行数据的 AI 工具和方法: 1. Excel 相关的 AI 工具和插件: Excel Labs:是一个 Excel 插件,新增了基于 OpenAI 技术的生成式 AI 功能,可用于数据分析和决策支持。 Microsoft 365 Copilot:整合了多种办公软件,能通过聊天形式完成用户提出的数据分析等任务。 Formula Bot:提供数据分析聊天机器人和公式生成器功能,支持自然语言交互进行数据分析和生成 Excel 公式。 Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,能进行公式生成、文本生成、情感分析、语言翻译等任务。 2. ChatGPT 也可助力数据分析,例如通过 SQL 分析平台自身使用情况,或进行个性化分析,分析完成后可展示结果数据的图表和分析结论,图表支持折线图和柱状图切换。 需要注意的是,随着技术发展,未来可能会有更多更适合的 AI 功能和工具出现。同时,在使用这些工具时,要确保数据的安全性和合规性。
2024-11-10