直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

对AI功能的新型用户体验测评

回答

以下是关于 AI 功能新型用户体验测评的相关内容:

生成式 AI 的第二阶段:

  • 新的开发者工具和应用框架为公司创建更先进的 AI 应用提供可重用构建块,并帮助评估、改进和监控生产中的 AI 模型性能,如 Langsmith 和 Weights & Biases 等 LLMOps 工具。
  • AI-first 基础设施公司如 Coreweave、Lambda Labs、Foundry、Replicate 和 Modal 正在解除公共云的捆绑,提供大量 GPU 及良好的 PaaS 开发者体验。
  • 生成式 AI 优先的用户体验在进化,包括新兴产品蓝图,如从基于文本的对话用户体验到新的形态如 Perplexity 的生成用户界面、Inflection AI 的语音发声等新模态,以及新的编辑体验如 Copilot 到导演模式,还有像 Midjourney 的新平移命令和 Runway 的导演模式创造的新相机般编辑体验,Eleven Labs 使通过提示操作声音成为可能。

Top100 AI 消费者应用(第三版):

  • 字节跳动于 2023 年底成立专注于生成式 AI 应用的研发部门 Flow,并从 2024 年初开始以其他公司名义在美国及海外推出新的 AI 应用。
  • 在网页和移动端,新类别为审美和约会,包括三家新进入者 LooksMax AI、Umax 和 RIZZ。LooksMax 和 Umax 采集用户照片进行评分并给出“建议”,Umax 生成用户 10 分满分照片,LooksMax 分析用户声音确定吸引力。LooksMax 声称拥有超 200 万用户,Umax 声称拥有 100 万用户。

生成式 AI:下一个消费者平台:

  • AI 能使产品个性化用户体验,早期应用已出现在教育科技和搜索中,预计这种定制将是许多 AI 启用产品的核心价值主张。后续文章将更深入研究相关领域,并分享评估消费者 AI 公司时提出的问题。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

红杉:生成式AI的第二阶段

新的开发者工具和应用框架为公司提供了可重用的构建块,以创建更先进的AI应用,并帮助开发者评估、改进和监控生产中的AI模型的性能,包括像Langsmith和Weights & Biases这样的LLMOps工具。像Coreweave、Lambda Labs、Foundry、Replicate和Modal这样的AI-first基础设施公司正在解除公共云的捆绑,并提供AI公司最需要的东西:大量的GPU以合理的成本、按需可用和高度可扩展,以及一个不错的PaaS开发者体验。这些技术应该能够在基础模型同时改进的情况下,缩小期望与现实之间的差距。但使模型变得出色只是成功了一半,生成式AI优先的用户体验也在进化:新兴产品蓝图生成式界面:基于文本的对话用户体验是LLM的默认界面。渐渐地,新的形态进入了武器库,从Perplexity的生成用户界面到Inflection AI的语音发声等新的模态。新的编辑体验:从Copilot到导演模式(Director‘s Mode)。随着我们从Zero-shot到ask-and-adjust(感谢Zach Lloyd),生成式AI公司正在发明一套新的旋钮和开关,它们看起来与传统的编辑工作流程非常不同。Midjourney的新的平移命令和Runway的导演模式创造了新的相机般的编辑体验。Eleven Labs使得通过提示(Prompt)操作声音成为可能。

Top100 AI 消费者应用(第三版)

为何会有如此多的新进入者?字节跳动于2023年底[成立了专注于生成式AI应用的研发部门Flow,并从](https://www.yicaiglobal.com/news/chinas-bytedance-sets-up-new-division-focusing-on-ai-applications)[2024年初](https://www.forbes.com/sites/emilybaker-white/2024/01/16/tiktok-bytedance-ai-chatbots-openai/)开始以其他公司名义在美国(及海外)推出新的AI应用。在网页和移动端,只有一个新类别:审美和约会。这包括三家新进入者:[LooksMax AI](https://apps.apple.com/us/app/looksmax-ai/id6474518292)(#43)、[Umax](https://apps.apple.com/us/app/umax-become-hot/id6471026798)(#44)和[RIZZ](https://apps.apple.com/us/app/rizz/id1663430725)(#49),均在移动端榜单上榜。LooksMax和Umax会采集用户的照片,对其进行评分,并给出“建议”,让用户变得更有魅力。Umax还会生成用户10分满分的照片,而LooksMax会分析用户的声音,以确定其吸引力。在其应用入门屏幕上,LooksMax声称拥有超过200万用户,而Umax声称拥有100万用户。

生成式 AI:下一个消费者平台

关于AI的最强大之处之一是它能使产品个性化用户体验。这方面的早期应用已经出现在[教育科技](https://a16z.com/2023/02/08/the-future-of-learning-education-knowledge-in-the-age-of-ai/)和搜索中——如果你在解释为什么会下雨,那么对八岁儿童和高中生使用的语言将会不同。我们预计这种定制将是许多AI启用产品的核心价值主张。在这里,我们探讨了我们看到机会的主要消费者类别。在[后续的文章](https://a16z.com/2023/02/08/the-future-of-learning-education-knowledge-in-the-age-of-ai/)中,我们将更深入地研究这些领域,并分享我们在评估消费者AI公司时所提出的问题。

其他人在问
去ai味
要去除 AI 味,可以从以下几个方面入手: 1. 对于聊天 AI,使其变得不正经、放肆、幽默、通俗。注意语气的自然化,比如使用语气词嗯、吧、啊、哈哈哈等,让回答更自然、贴近日常对话风格。还要注意口语化词语(相对于书面语)的使用,不过增加网络语言语料库需谨慎,以免生搬硬套带来副作用。 2. 对于睿声生成的配音,若语速慢有 AI 味儿,可使用剪映的音频变速功能加速配音,以消除 AI 味儿并配合视频前段的快节奏。 3. 对于 GPT 的回复,避免其用 1、2、3、4 或“首先、其次、最后”这种模式,可让其扮演特定角色并给出明确输出要求。但这种方法可能换汤不换药,要想让其更有趣,可让它在回复中加点感情,比如用括号补充动作,营造特定环境等。
2024-09-19
可以建立知识库的ai有哪些
以下是一些可以建立知识库的 AI 工具和平台: 1. 飞书软件:例如“通往 AGI 之路”,您可以在飞书大群中与机器人对话获取对应的资料。 2. Coze:在“大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库”中有相关介绍。 3. Mem:如 https://get.mem.ai/ ,它可以保存组织中每次会议的记录,并在人们开始新项目时主动建议相关的决策、项目或人员,节省时间。 4. GPT:通过 OpenAI 的 embedding API 解决方案,可以搭建基于 GPT API 的定制化知识库,但需要注意其免费版 ChatGPT 一次交互的容量限制。
2024-09-19
notion ai的功能
Notion AI 具有以下功能: 直接在 Notion 中接入 AI 的能力,能让工作更迅速,写作更出色,思考更伟大。 可以在笔记和文档中应用 AI 的力量。 能够实现 AI 数据库自动填充功能。 可以改变知识管理的方式,让人们摆脱繁琐的信息组织工作,用户只需简单地将信息丢到 Notion 中,就可以通过各种方式进行检索。
2024-09-19
PopAI的功能
PopAI 是一款办公效率工具,具有以下功能: 1. 类似 ChatGPT 的聊天功能。 2. 集成了众多工作中可用的效率工具,如 PPT 和流程图生成、提示生成等。 3. 率先集成了 GPT4V 的图像 API 且调教良好,能清晰解释图像相关内容。 4. 具有创新的交互,在回答内容后可进行如翻译为中文、扩写重新排版并添加内容变为一篇文章等“Enrich”操作。 5. “Enrich”操作不仅不是干巴巴的填充,还会配合相关图片,必要时绘制流程图。
2024-09-19
popai 的功能
Poe 是一个 AI 聊天网站,支持与多个智能 AI 机器人(如 GPT4 等)进行实时在线交流。注册账号后可免费使用,部分功能需要付费订阅。不同的 AI 机器人有不同特点,可根据需求选择使用。总体而言,Poe 为用户提供了便捷的智能对话体验。其官网地址是:https://poe.com/ ,在官网帮助中心上可以找到具体教程。 此外,Poe 平台还推出了其他多种功能,比如多个机器人一起聊天、文件上传和视频输入等。Odyssey 是一个能提供好莱坞级别的 AI 视频生成和编辑工具的项目。PaintsUndo 可以输入静态图像自动生成整个绘画的全过程视频,该项目主要研究和再现数字绘画中的绘画行为,为数字艺术创作提供新的工具和方法。更多详细介绍可参考:https://xiaohu.ai/p/10996 、https://x.com/imxiaohu/status/1810574723048489063 、https://xiaohu.ai/p/11005 、https://x.com/imxiaohu/status/1810589354114626008 、https://xiaohu.ai/p/11010 、https://lllyasviel.github.io/pages/paints_undo/
2024-09-19
可用于记笔记的ai有哪些
以下是一些可用于记笔记的 AI 相关产品: 1. MeetRecord:这是一家专注于销售通话记录和辅导的软件公司。其核心功能包括 AI 驱动的笔记记录,能通过人工智能技术自动记录和分析销售通话,提供会议内容的关键词和主题分析,自动生成会议纪要和行动项;还有个性化辅导计划,能生成个性化的辅导计划,模仿表现最好的销售人员,并实施自动呼叫评分系统;此外,还具备交易智能和推荐、CRM 自动化、多语言支持以及安全性与企业化支持等功能。 2. 目前没有更多明确提及专门用于记笔记的其他 AI 产品的相关信息。但在一些关于人工智能的讨论中,提到了手写笔记对于信息留存和思维培养的重要性,例如在关于防止 AI 取代人类思考的论述中,指出手写笔记有助于将信息从短期记忆转移到长期记忆,成为更好的概念思考者。
2024-09-19
国内外大模型测评
以下是关于国内外大模型测评的相关内容: 在 2023 年度的中文大模型基准测评中: 国内外大模型总体表现方面,90.63 分遥遥领先,高于其他国内大模型及国外大模型。国内最好模型文心一言 4.0(API)总分 79.02 分,距离 GPT4Turbo 有 11.61 分,距离 GPT4(网页)有 4.9 分的差距。过去 1 年国内大模型有长足进步,综合能力超过 GPT 3.5 和 GeminiPro 的模型有 11 个,如百度的文心一言 4.0、阿里云的通义千问 2.0 和 Qwen 72BChat、OPPO 的 AndesGPT、清华&智谱 AI 的智谱清言、字节跳动的云雀大模型等。在 SuperCLUE 测评中,国外模型平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右,且国内外平均水平差距在缩小,11 月差距在 10 分左右。阿里云的 Qwen72B、Yi 34BChat 均优于 Llama213BChat。 国内大模型竞争格局方面,从大厂和创业公司的平均成绩来看,大厂与创业公司差值约 6.33 分,较 11 月份差距在增大,说明大厂在大模型竞争中长期资源投入方面有一定优势。过去八个月国内模型在 SuperCLUE 基准上的前三名情况如下:12 月和 11 月的第一名是文心一言 4.0,10 月第一名是 BlueLM,9 月第一名是 SenseChat3.0,8 月第一名是 Baichuan213BChat,7 月第一名是文心一言(网页 v2.2.0),6 月第一名是 360 智脑,5 月第一名是 360 智脑。第二名在不同月份分别是通义千问 2.0、Moonshot 等。 主观和客观对比方面,通过对比模型在主观简答题 OPEN 和客观选择题 OPT 上的不同表现,国内大模型多数擅长做选择题,普遍选择题分数高于简答题分数。文心一言 4.0 和智谱清言表现相对稳定,分别为(13.38)和(14.01),GPT4 Turbo 的表现最为稳定,差值仅有 0.86。SuperCLUE 认为,客观题相对主观题更容易通过题库形式进行训练和提升,同时由于客观题中包含中文特性问题,中文模型有一定优势,应综合来看模型的评测效果。国外的代表性大模型如 GPT4 的不同版本、Claude2、Llama2 都有很好的稳定性表现,值得国内大模型进一步分析研究。
2024-08-15
有什么测评大模型可用性的自动化方案吗
评估大型模型的可用性是一个复杂的过程,涉及到多个方面的考量,包括准确性、效率、稳健性、可解释性和伦理等。虽然目前没有一个统一的自动化方案能够全面评估所有方面,但是有一些工具和方法可以用于自动化评估模型的某些特性。以下是一些常用的自动化方案和工具: 1. 单元测试和集成测试:对于模型的不同组件,可以使用单元测试来验证其是否按预期工作。集成测试则可以确保不同组件在一起时也能正常工作。 2. 基准测试和数据集:使用标准的数据集和基准测试来评估模型的性能。例如,对于自然语言处理模型,可以使用GLUE、SuperGLUE或SQuAD等数据集。 3. 模型卡片(Model Cards):模型卡片是一种文档,用于记录模型的性能、训练数据和预期的使用场景。这可以帮助用户了解模型的适用性和限制。 4. 连续集成/连续部署(CI/CD):使用CI/CD工具来自动化模型的测试和部署过程。例如,使用Jenkins、GitHub Actions或GitLab CI/CD来自动化测试和部署流程。 5. 自动化性能监控:使用工具如Prometheus和Grafana来监控模型的性能指标,如延迟、吞吐量和准确性。 6. 自动化回归测试:使用工具来定期运行回归测试,以确保模型的更新不会引入新的错误。 7. 可解释性和可视化工具:使用工具如LIME、SHAP或Captum来解释模型的决策,并使用TensorBoard等工具来可视化模型的训练过程。 8. 伦理和偏见检测:使用工具来检测模型输出中的偏见和伦理问题。例如,可以使用IBM的AI Fairness 360工具来检测和减轻机器学习模型中的偏见。 9. 模拟和沙盒环境:在模拟环境中测试模型的性能,以避免在实际部署中出现问题。 10. 云服务和平台:使用云服务提供商(如AWS、Google Cloud Platform、Azure)提供的自动化工具来部署和管理模型。 虽然这些工具和方法可以自动化评估模型的某些方面,但通常还需要人工参与来综合评估模型的可用性,特别是在涉及模型的可解释性和伦理问题时。因此,自动化方案应该与人工审核相结合,以确保模型的全面评估。
2024-04-17
AI写小说语言不生动,像一个梗概,而不是引人入胜的小说阅读体验
以下是关于解决 AI 写小说语言不生动问题的一些建议: 1. 明确主题:参考《安·兰德的小说写作课》,认识到小说主题的重要性。可通过让 AI 进行头脑风暴,列出多个主题,然后由人类挑选。例如,在十个主题中,选择了既富有诗意又与每个人相关的第 7 个主题。 2. 任务拆解:将小说创作任务拆解为确定主题、构思情节、丰富细化、串联成文再修改等步骤。 3. 知识运用:运用如“小说的主题很重要,判断一部小说的美学价值,只需要了解作者的主题是什么、主题展开得如何”“要能够具体地表达抽象概念,不是用漂浮不定的空泛的词,而是具体的例子、描述、行动”等知识。 4. 优化修改:让 AI 修改自己写的内容时,起初效果不佳,可尝试更换框架(如 Arthur 的框架)、添加详细的 skill set,能得到不同侧重点的结果。此外,使用表格能打破 AI 的叙事习惯,使生成的文字不那么“AI 腔”,有利于精准控制。
2024-08-09
多模态用户体验。
多模态用户体验是指在人工智能领域中,模型能够理解和处理多种不同的模态信息,例如文本、图像、音频和视频等。这种多模态的能力可以为用户提供更加丰富、全面和自然的交互体验。 多模态用户体验的实现需要依赖于自然语言处理(NLP)、计算机视觉(CV)、语音识别(ASR)等技术的不断发展和整合。通过将这些技术结合在一起,模型可以更好地理解和处理用户的输入,并根据用户的需求和上下文生成更加个性化和自然的响应。 多模态用户体验的应用场景非常广泛,包括娱乐、教育、医疗、金融等领域。例如,在娱乐领域,多模态用户体验可以为用户提供更加丰富和互动的体验,例如通过语音识别和图像识别技术实现的智能电视和游戏;在教育领域,多模态用户体验可以为学生提供更加生动和有趣的学习体验,例如通过虚拟实验室和交互式模拟器实现的科学实验和工程设计;在医疗领域,多模态用户体验可以为医生和患者提供更加高效和准确的医疗服务,例如通过图像识别和语音识别技术实现的医学影像诊断和语音病历记录。 虽然多模态用户体验具有广阔的应用前景和巨大的商业价值,但是在实现过程中也面临着许多挑战和困难。例如,如何将不同的模态信息整合在一起,如何提高模型的泛化能力和鲁棒性,如何设计更加友好和自然的用户界面等。这些问题需要不断地探索和研究,以实现更加优秀和个性化的多模态用户体验。
2024-06-06