Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

Ai指导长期项目

Answer

以下是关于 AI 指导长期项目的相关内容:

负责任的 AI 原则: 2018 年 6 月宣布了七项 AI 原则来指导工作,包括:

  1. 人工智能应对社会有益,考虑社会和经济因素,只有在总体收益可能大大超过风险和不利因素时才进行项目。
  2. 避免产生或加强不公平的偏见,尤其在种族、民族、性别、国籍、收入、性取向、能力、政治和宗教信仰等敏感特征方面。
  3. 构建和测试应确保安全,制定和应用强有力的安全措施以避免意外伤害风险。
  4. 对人负责,设计系统为反馈、解释和申诉提供机会。
  5. 纳入隐私设计原则,提供通知和同意机会,鼓励隐私保护措施和透明度,控制数据使用。
  6. 坚持科学卓越的高标准,与利益相关者合作,分享 AI 知识。
  7. 用于符合原则的用途,不追求造成整体危害、用于武器或违反国际规范和人权原则的技术。

AGI 的短期与长期: 短期:AGI 未催生大量“明星 APP”和“变现机器”,只有少数 App 实现用户突破,上层应用 APP 昙花一现,投资人谨慎,公众对 AI 麻木。 长期:技术稳定且加速迭代,如视频生成、音频生成、代理 Agent、记忆能力、模型小型化等虽距离商用有问题,但突破只是时间问题。

AIGC 相关: 对于某些项目,在 AI 技术进一步改进前等待可能更有利,特别是耗时长且 AI 已有合理表现的任务。在构建和维护生产级大型语言模型应用程序中,评估指标很重要,可分为端到端和步骤/组件式评估。语言模型可能出现“幻觉”,可采用高级提示、少样本提示、思维链式提示、数据增强(如检索增强生成、工具集成)等策略缓解。

Content generated by AI large model, please carefully verify (powered by aily)

References

3. 负责任的AI简介

2018年6月,我们宣布了七项AI原则来指导我们的工作。这些是积极管理我们的研究和产品开发并影响我们的业务决策的具体标准。以下是对每一个的概述:1.人工智能应该对社会有益。任何项目都应考虑广泛的社会和经济因素,并且只有在我们认为总体可能收益大大超过可预见的情况下才会进行风险和不利因素。2.人工智能应避免产生或加强不公平的偏见。我们力求避免对人造成不公正的影响,尤其是那些与种族、民族、性别、国籍、收入、性取向、能力和政治等敏感特征相关的影响或宗教信仰。3.人工智能应该被构建和测试以确保安全。我们将继续制定和应用强有力的安全措施,以避免产生伤害风险的意外结果。4.人工智能应该对人负责。我们将设计AI系统,为反馈、相关解释和申诉提供适当的机会。5.人工智能应纳入隐私设计原则。我们将提供通知和同意的机会,鼓励具有隐私保护措施的架构,并提供适当的透明度和对数据使用的控制。6.人工智能应该坚持科学卓越的高标准。我们将与一系列利益相关者合作,促进这一领域深思熟虑的领导,借鉴科学严谨和多学科的方法。我们将通过发布教育材料、最佳实践和研究来负责任地分享AI知识,使更多人能够开发有用的AI应用程序。7.人工智能应该用于符合这些原则的用途。许多技术有多种用途,因此我们将努力限制可能有害或滥用的应用程序。除了这七个原则之外,还有一些人工智能应用我们是不会追求的。我们不会在这四个应用领域设计或部署人工智能:造成或可能造成整体危害的技术。其主要目的或实施是造成或直接造成的武器或其他技术便于对人造成伤害。收集或使用违反国际公认规范的信息进行监视的技术。以及其目的违反广泛接受的国际法和人权原则的技术。确立原则是一个起点,而不是终点。仍然真实的是,我们的AI原则很少直接回答我们关于如何构建产品的问题。他们不会——也不应该——允许我们回避艰难的对话。它们是确立我们的立场、我们构建的内容以及构建它的原因的基础,它们是我们企业AI产品成功的核心。

AGI万字长文(上)| 2023回顾与反思

短期:AGI并没有马上催生出大量“明星APP”和“变现机器”。只有ChatGPT,Charactor.ai等少数App实现了用户突破。大量上层应用APP就像韭菜一样:不仅昙花一现,迅速被OpenAI官方所取代,而且还无法做到成本打平。于是,投资人极端谨慎,公众也渐渐对于AI麻木。长期:技术的稳定的、加速度的迭代。23年3月预测的众多技术到现在都有了长足进步:视频生成、音频生成、代理Agent、记忆能力、模型小型化……它们距离商用可能还有各种各样的问题,但捅破这层窗户纸只是时间问题。人间一日,AI十年。这篇万字长文算为婴儿期的AGI做一个快照;算是在激流的2023找个锚点,更是为了2024更好地出发。上篇:回顾AI在2023年发生的大事,为大家梳理出2023年AI圈的主线下篇:不自量力地做些2024年的推断,为大家提供一些启发和点子这里,我不会过多讨论技术细节,更多是从商业视角、个体视角来审视着这场技术海啸。文中有很多自不量力的估计,也有很多不准确、不完整的地方;欢迎大家找我聊天,告诉我你们的想法。另外,这是我的新公众号,有关AI的文章都会集中放在这里。恳请大家收藏、加星、点赞、转发。Image:"Explosion of AGI-with some order",with Dall-E

AIGC Weekly #56

鉴于AI正在快速发展并能够执行广泛的任务,作者认为对于某些项目,在AI技术进一步改进之前等待可能更加有利。这一点在那些耗时长且AI已有合理表现的任务中尤为显著,如写作小说或软件开发。该文章讨论了在构建和维护生产级大型语言模型(LLM)应用程序(如GitHub Copilot)中,评估指标的重要性。这些指标对于质量控制和防止重复故障案例至关重要。LLM应用程序的评估可以分为端到端和步骤/组件式评估。前者提供了整体质量感知,而后者有助于识别和减轻可能影响LLM应用程序整体质量的故障模式。该文章概述了适用于端到端和组件式评估的不同场景的评估指标。这些见解来自研究文献以及与其他LLM应用程序构建者进行的讨论。文章还提供了Python代码示例。语言模型(LLMs)如GPT-4是无监督任务的强大工具,但可能会出现“幻觉”,即生成似是而非的信息。为了缓解这一问题,可以采用以下几种策略:高级提示:这涉及在系统提示中提供清晰的指示,以避免传播错误或不可验证的信息。例如,使用一个提示来指导模型不要传播不正确的数据。少样本提示:向LLM提供少量特定示例以引导其回应,有助于它专注于主题和上下文。示例的质量至关重要,因为糟糕的示例可能导致更多幻觉。思维链式提示:鼓励LLM在最终答案之前生成推理步骤,可以通过逐步思考或提供推理示例来实现。然而,这可能会引入产生幻觉推理的风险。数据增强:当上下文超出模型窗口时,数据增强可以通过添加专有数据或外部工具/知识来帮助。技术包括:检索增强生成(RAG):将模型知识与检索系统结合起来,在实时中获取相关数据。工具集成:使用函数调用、API调用和其他工具来提高准确性,尽管这需要进行广泛测试和实验。

Others are asking
两张照片还原人脸,用什么AI工具
以下是一些可用于两张照片还原人脸的 AI 工具和方法: 1. Stable Diffusion: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时放大图片。 利用 GFPGAN 算法将人脸变清晰,可参考文章。 将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型进行修复,vae 选择 vqgan,提示词可不写。 2. Midjourney(MJ):加上简单的相机参数、写实风格,使用 MJ v 6.0 绘图,可调整图片比例。 3. InsightFaceSwap: 输入“/saveid”,idname 可随意填写,上传原图。 换脸操作输入“/swapid”,id 填写之前设置的名称,上传分割好的图。 选择效果较好的图片,注意插件每日免费使用次数。 此外,还会用到 PS 进行图片的角度调整、裁切、裁剪、拼接等操作。
2025-02-21
AI编程的落地场景是什么
以下是 AI 编程的一些落地场景: 1. 智能体开发:从最初只有对话框的 chatbot 到具有更多交互方式的应用,低代码或零代码的工作流在某些场景表现较好。 2. 证件照应用:以前实现成本高,现在可通过相关智能体和交互满足客户端需求。 3. 辅助编程: 适合原型开发、架构稳定且模块独立的项目。 对于像翻译、数据提取等简单任务,可通过 AI 工具如 ChatGPT 或 Claude 解决,无需软件开发。 支持上传图片、文档,执行代码,甚至生成视频或报表,大幅扩展应用场景。 4. 自动化测试:在模块稳定后引入,模块变化频繁时需谨慎。 5. 快速迭代与发布 MVP:尽早发布产品,不追求完美,以天或周为单位快速迭代。 需要注意的是,AI 编程虽强,但目前适用于小场景和产品的第一个版本,在复杂应用中可能导致需求理解错误从而使产品出错。在进度不紧张时可先尝试新工具,成熟后再大规模应用。同时,压缩范围,定义清晰的 MVP(最小可行产品),先完成一个 1 个月内可交付的版本,再用 1 个月进行优化迭代。
2025-02-21
不同ai模型的应用场景
以下是不同 AI 模型的应用场景: 基于开源模型: Civitai、海艺 AI、liblib 等为主流创作社区,提供平台让用户利用 AI 技术进行图像创作和分享,用户无需深入了解技术细节即可创作出较高质量的作品。 基于闭源模型: OpenAI 的 DALLE 系列: 发展历史:2021 年初发布 DALLE,2022 年推出 DALLE 2,2023 年发布 DALLE 3,不断提升图像质量、分辨率、准确性和创造性。 模型特点:基于变换器架构,采用稀疏注意力机制,DALLE 2 引入 CLIP 模型提高文本理解能力,DALLE 3 优化细节处理和创意表现。 落地场景:2C 方面可控性强于 Midjourney,但复杂场景和细节处理能力不如 Midjourney;2B 方面与 Midjourney 场景类似。 商业化现状:通过提供 API 服务,使企业和开发者能集成到应用和服务中,采取分层访问和定价策略。 伦理和合规性:加强对生成内容的审查,确保符合伦理和法律标准。 大模型: 文本生成和内容创作:撰写文章、生成新闻报道、创作诗歌和故事等。 聊天机器人和虚拟助手:提供客户服务、日常任务提醒和信息咨询等服务。 编程和代码辅助:用于代码自动补全、bug 修复和代码解释。 翻译和跨语言通信:促进不同语言背景用户之间的沟通和信息共享。 情感分析和意见挖掘:为市场研究和产品改进提供数据支持。 教育和学习辅助:创建个性化学习材料、自动回答学生问题和提供语言学习支持。 图像和视频生成:如 DALLE 等模型可根据文本描述生成相应图像,未来可能扩展到视频内容生成。 游戏开发和互动体验:创建游戏中的角色对话、故事情节生成和增强玩家沉浸式体验。 医疗和健康咨询:理解和回答医疗相关问题,提供初步健康建议和医疗信息查询服务。 法律和合规咨询:帮助解读法律文件,提供合规建议,降低法律服务门槛。 这些只是部分应用场景,随着技术进步和模型优化,AI 模型在未来可能会拓展到更多领域和场景。同时,也需注意其在隐私、安全和伦理方面的挑战。
2025-02-21
爆款AI视频
以下是关于爆款 AI 视频的相关内容: 2025AI 春晚: 行业身份:首届 AI 春晚发起人&总导演,包括央视总台论坛&直播、TEDxAI 演讲、得到分享等。 爆款视频案例:快手&国家反诈中心合作,微博 650w+热搜,快手 520w+热搜(6 月 28 日);央视&海尔冰箱首支 AI 概念短片(6 月 29 日);个人制作视频,无推流,快手平台 636w 播放(6 月 29 日)。 社区与企业关系:涉及 WaytoAGI、AIGCxChina 等聚会,以及德必集团、万兴集团、福布斯 AItop50 等的论坛分享,还有嘉定区政府颁奖、温州 AI 音乐大会、腾讯研究院论坛、江西财经大学分享、宣亚集团分享等。 WTF:1w 粉 10w 粉仅仅用时 13 天,像素级拆解《动物时装秀》: 作者模仿动物时装秀账号效果不错并分享教程。一个爆款视频至少要满足以下几点: 切片:短视频通过不断切片,增加信息密度,从长视频和其他短视频中脱颖而出。 通感:利用人的直觉脑,不让观众动脑子,如头疗、水疗直播间靠声音让人舒服,美食直播间靠展示美食吸引人。 反差:可参考抖音航线里行舟大佬的相关文档。 视频模型:Sora: OpenAI 突然发布首款文生视频模型 Sora,能够根据文字指令创造逼真且充满想象力的场景,生成 1 分钟的超长一镜到底视频,女主角、背景人物等都有惊人的一致性和稳定性,远超其他 AI 视频工具。
2025-02-21
AI音频与数字人
以下是关于 AI 音频与数字人的相关信息: 数字人口播配音: 操作指引:输入口播文案,选择期望生成的数字人形象及目标语言,选择输出类型,点击开始生成。 支持的数字人形象和语言多样,能让视频制作更高效。 图片换脸: 操作指引:上传原始图片和换脸图片,点击开始生成。 图片大小上限 5M,支持 JPG、PNG 格式。 视频换脸: 操作指引:上传原始视频和换脸图片,点击生成。 音频合成数字人: 操作指引:上传音频文件,选择数字人角色和输出类型,点击开始生成。 支持 MP3 和 WAV 格式的音频文件,文件大小上限 5M,工具支持使用 100+数字人模板,可解决无素材冷启问题。 AI 配音: 多语种(包含菲律宾语、印地语、马来语等小语种)智能配音,同时支持区分男声和女声。 操作指引:输入需配音文案,选择音色,点击立即生成。 注意输入的配音文案需和选择音色语种保持一致。 AI 字幕: 操作指引:点击上传视频,开始生成,字幕解析完成后下载 SRT 字幕。 支持 MP4 文件类型,大小上限为 50M。 在数字人语音合成方面,提到了声音克隆,有新的声音克隆且音质很不错。算法驱动的数字人相关开源代码仓库有: ASR 语音识别:openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition)。 大模型:ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分:可以使用 LangChain 的模块去做自定义(https://www.langchain.com/)。 TTS:微软的 edgetts(https://github.com/rany2/edgetts)、VITS(https://github.com/jaywalnut310/vits)、sovitssvc(https://github.com/svcdevelopteam/sovitssvc)。 构建简单数字人的方式包括通过手动建模(音频驱动)或者 AIGC 的方式生成人物的动态效果(例如 wav2lip 模型),但仍存在一些问题,如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作、数字人如何使用知识库做出某个领域的专业性回答等。
2025-02-21
现阶段最智能的AI工具是哪一款?
现阶段很难确切地指出哪一款 AI 工具是最智能的,因为这取决于不同的应用场景和需求。以下为您介绍一些表现出色的 AI 工具: Unity 推出的两款 AI 工具: Copliot 工具:可通过与 Muse Chat 聊天快速启动创建游戏项目,如生成塔防类游戏基础框架、创建人物角色动作,还能协助编码和熟悉工程环境。 Unity Sentis:能在 Unity 运行时为游戏或应用程序嵌入 AI 模型,增强玩法和功能,是首个将 AI 模型嵌入实时 3D 引擎的跨平台解决方案。 基于 2022 年 9 月至 2023 年 8 月访问量的 10 个最佳人工智能工具: ChatGPT:访问量达 146 亿次,在美国使用率最高,男性用户占比较大,多用于写作和内容创作、教育和常识等方面。 Character AI QuillBot Midjourney Hugging Face Google Bard NovelAI CapCut JanitorAI Civitai 不同类型的 AI 工具在不同领域各有优势,例如聊天机器人在流量份额上占比较大,而图像生成器、视频生成器、语音和音乐工具等也在各自领域表现出色。您可以根据具体需求选择适合的工具。
2025-02-21
你好,我想做一个用照片做视频的博主,请帮我构思一套详细的视频号起号的框架、流程、以及每一步骤的详细执行指导
很抱歉,目前没有关于用照片做视频的博主起号的相关内容。但我可以为您提供一个大致的框架和流程,以及每一步骤的简要执行指导供您参考: 框架: 1. 明确视频号定位:确定您的视频号是以何种风格、主题展示照片视频,例如旅行照片集、宠物照片故事等。 2. 内容策划:规划好要发布的照片系列,制定一个长期的内容计划。 3. 品牌塑造:包括起一个吸引人的账号名称、设计独特的头像和封面。 流程: 1. 账号注册与设置:选择一个易记且与主题相关的账号名,完善个人简介,突出您的特色和价值。 2. 素材准备:整理和筛选高质量的照片,并对其进行分类。 3. 视频制作:使用合适的软件将照片制作成精彩的视频,添加音乐、特效等元素增强吸引力。 4. 发布策略:选择合适的时间发布视频,保持一定的发布频率。 每一步骤的详细执行指导: 账号注册与设置: 账号名要简洁、有特色,能反映您的视频主题。 个人简介要清晰地介绍您的视频号定位、能为观众带来什么价值。 素材准备: 从大量照片中挑选出清晰、美观、有故事性的照片。 按照主题或时间顺序对照片进行分类,方便后续制作。 视频制作: 学习并熟练使用视频编辑软件,如剪映等。 选择适合照片风格的音乐,注意版权问题。 适当添加转场效果、文字说明等,提升视频的观赏性。 发布策略: 分析目标受众的活跃时间,例如晚上或周末。 初期可以每周发布 12 个视频,根据反馈逐渐调整频率。 希望以上内容对您有所帮助,祝您成功!
2025-02-08
总结一下当前AI发展现状以及指导非开发者一类的普通用户如何使用及进阶使相关工具
当前 AI 发展现状: 涵盖了不同领域的应用和发展,如电子小说行业等。 包括了智能体的 API 调用、bot 串联和网页内容推送等方面。 对于非开发者一类的普通用户使用及进阶相关工具的指导: 可以先从国内模型工具入手,这些工具不花钱。 学习从提示词开始,与模型对话时要把话说清,强调提示词在与各类模型对话中的重要性及结构化提示词的优势。 对于技术爱好者:从小项目开始,如搭建简单博客或自动化脚本;探索 AI 编程工具,如 GitHub Copilot 或 Cursor;参与 AI 社区交流经验;构建 AI 驱动的项目。 对于内容创作者:利用 AI 辅助头脑风暴;建立 AI 写作流程,从生成大纲开始;进行多语言内容探索;利用 AI 工具优化 SEO。 若想深入学习美学概念和操作可报野菩萨课程。国内模型指令遵循能力较弱时,可使用 launch BD 尝试解决。
2025-01-31
我是一个AI小白,我使用AI的主要目的是使用这些工具,简化我工作中费时费力的事情,比如:表格的制作,筛选数据;图片的抠图,渲染,产品的口播介绍;日常工厂管理文件的编写及执行步骤;工作手册及岗位绩效的编写;作业指导书的编写
以下是为您整合的相关内容: 对于 AI 小白来说,使用 AI 工具简化工作中的费时费力之事是可行的。 在接触 AI 工具时,对于超出自己理解范围的事情,最简单有效的方法就是尝试。学习新事物,实践比听闻更重要。 比如在 AI 视频制作方面,人物设定与剧本是关键部分,包括主体、动作、场景等要素;分镜处理也较为重要,要考虑用几个镜头表述内容;生成环节如同抽卡,可多尝试,最后进行粗检和后期处理,如 AI 配音剪辑、加过渡滤镜等。小白制作 AI 视频要做好脚本即提示词,有耐心抽卡,并不断提升撰写提示词的能力。撰写提示词时要了解主体、动作、场景,避免使用专有名词和网络名词,给 AI 清晰描述。工具选用方面,没有绝对好的工具,只有适合的,如小白可使用剪映,主力机是 MacBook Pro 可使用 final cut。还可向 ChatGPT 询问获取灵感。 另外,在“AI 布道”活动中发现,AI 工具虽强大能做很多事,但也在其与普通人之间形成了一道墙。AI 是未来必然的方向,其科普还有很长的路要走,但尽可能简单地试用它,能让普通人更快受益。无论是什么身份、什么年龄段的人,都可以尝试使用 AI 工具。 如果您想要跟相关作者交朋友、一起在 AI 路上探寻,欢迎戳这里:
2025-01-30
如何书写文生视频提示词达到连贯效果 并且根据自己的运镜指导运镜
以下是关于如何书写文生视频提示词达到连贯效果并且指导运镜的方法: 1. 在 PixelDance V1.4 中,支持在 prompt 里写入运镜控制,可用自然语言描述想要的镜头变化,例如“镜头环绕口红拍摄”“黑白风格,镜头环绕着戴墨镜的女人拍摄,从她侧面移动到正面,最后聚焦于女人的面部特写”“雨后模糊的玻璃逐渐聚焦,一个男人举着伞,带着一只金毛犬路过”等。 2. 对于更复杂的视频项目,在为 Generate video(beta)编写提示词时,可提供背景或背景故事,有助于生成连贯且引人入胜的序列。同时,Firefly 通常可以模拟真实世界的摄像机工作,可具体说明希望摄像机的角度或移动,如常见的相机方向有特写、广角镜头、平移/缩放/跟踪、从天而降、从下方拍摄等。 3. 在制作商业级的 AI 视频广告时,以汽车内饰片段为例,登录 runway 账户,在首页左侧点击“Text/Imagine to Video”,上传图片,更改大模型版本,在提示词方框中输入运镜方式,如“Roll Clockwise Shot slowly”(摄像机围绕垂直轴顺时针旋转)。不想动脑时可根据分镜表建议填写运镜方式,也可参照“运镜方式大全”。注意提示词不宜过多,可通过改变提示词、生成时长等多尝试几次。
2025-01-23
flux lora调参数,我训练出来的人物模型和数据集的人物图片不像,出现这种情况的原因都有哪些,应该调整哪些参数,我需要我的flux模型训练出来的模型是一致性还原性,和泛化性比较不错的,按照这个方向给我指导
以下是关于 flux lora 调参数以获得一致性、还原性和泛化性较好的人物模型的指导: 打标环节: 选择基础大模型,如“麦橘写实”,并为 lora 命名。 将照片导入,选择合适分辨率,可勾选“脸部加强训练”,然后进行预处理。手动裁剪图片比自动裁剪更可靠。 预处理后会出现脸部和整体文件夹,且每张照片自动打好 tag 标签。 可为整体添加统一标签,也可单独修改每张图片的标签。标签有助于 AI 理解图片,描述越详细,人物变化可能越多,泛化性可能越好。仔细检查每张图片的标签,其质量会影响人物 lora 的泛化性。 参数调整环节: 大部分参数是固定的,主要的几个按照人物参数配置一遍。后期根据生成结果再调整。 炼丹环节: 例如 18 张脸部图片,20 张整体图片,各训练 50 步,循环训练 10 次,并行步数为 1。训练总步数和时长会有所不同,loss 值可作为参考,但最终效果仍需通过测试判断。 此外,在 Lora 串联方面,多个 Lora 串联时左右顺序不影响结果,可复制并点对点连接。CLIP 层 1 和 2 的效果不同,加 Lora 时某些 Lora 可能更适合 2。Lora 可用于生成底模无法画出的内容。在运行中点击取消可打断正在渲染跑的图。图像放大可通过 up scale image using model 节点,选择放大模型,用 resize 节点调整尺寸,再用编码器和采样器处理。放大模型直接放大的图像效果不佳,需再次采样增加细节。添加飞桨缺失节点可通过拖入工作流查看标红节点,从管理器安装或从 GitHub 获取节点包放入文件管理系统。采样器和调度器参数设置建议参考模型作者推荐,并结合自己调试。Web UI 中 Lora 库有刷新按钮,将 Lora 丢到文件夹后多点几次刷新即可。
2025-01-04
我在设计一个分镜的网站,有没有什么ai模型 可以指导我做这个网站?
以下是一些可以帮助您设计分镜网站的 AI 模型和工具: 1. Adobe Firefly 视频模型:能够为视频编辑、动态图形设计等提供支持,帮助您探索新的创意和提高效率。 2. HDAidMaster:一款云端工具,在建筑设计、室内设计和景观设计领域表现出色,可用于有趣的方案创作。 3. Maket.ai:主要面向住宅行业,在户型设计和室内软装设计方面有 AI 技术探索,能根据需求自动生成户型图。 4. ARCHITEChTURES:AI 驱动的三维建筑设计软件,提供全新设计模式,并能引入标准和规范约束设计结果。 5. Fast AI 人工智能审图平台:形成全自动智能审图流程,将建筑全寿命周期内的信息集成,实现数据汇总与管理。 需要注意的是,每个工具都有其特定的应用场景和功能,建议您根据自己的具体需求来选择合适的工具。同时,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-13
长期记忆设计
关于长期记忆设计,主要包括基础设定和人物背景两方面。 基础设定方面,设计了一些初始属性,如人物生日和星座、MTBI 性格分型(ENFJ)、出生地、职业、聊天习惯等。 人物背景方面,使用 AI 自动扩写了大约 100 条,涵盖了三观、爱好、日常习惯、教育经历、家庭背景、工作经历、恋爱经历等内容。
2024-12-29
有没有AI能长期记住对话内容
AI 能够实现长期记住对话内容。在智能体中,长期记忆主要有长文本(持久化)、总结、RAG 这三种实现方式。长文本(KV Cache)是 Transformer 架构中的一个功能,能通过缓存历史计算的 Key(K)和 Value(V)来减少冗余计算,加速模型的推理过程,但需要额外的存储空间,可能导致显存占用增加,为此有研究者提出多种优化技术。如果未来能结合持久化 KV Cache、KV Cache 的压缩技术,控制成本,就有可能打造出记忆力超越人类的智能体,能回忆更多详细信息,并在服务中展现更高级别的个性化和情感连贯性。 当下比较推荐将临时记忆转换为长期记忆的方式是定期总结+RAG,即定期对上下文对话内容进行总结,然后对总结后的文本进行索引,并将索引后的内容存储到数据库中。整个过程和人记忆内容的过程相似,但要注意避免在归纳和记忆时产生偏见,比如在归纳信息时回顾并整合已有记忆,在推理中加入反思环节,对于同一事物的记忆详细记录每次情况等。
2024-12-17
gpt 长期记忆功能
ChatGPT 的长期记忆功能已上线,能够跨聊天记忆用户信息,从而提供更相关和个性化的回答。用户可以控制记忆内容,同时也考虑到了隐私和安全问题。此外,GPTs 也将拥有记忆功能。 然而,GPT 模型在长期记忆方面仍存在一些局限性: 模型的上下文有限,以“无状态”方式运行,没有明显方法教会模型新事实,甚至不清楚其能否执行需要不断发展记忆和上下文的任务,如阅读一本书并理解对先前章节的引用。 缺乏更新自身或适应变化环境的能力,训练完成后固定,没有机制纳入新信息或用户、世界的反馈。虽可在新数据上微调模型,但可能导致性能下降或过拟合,且由于训练周期的潜在滞后,系统容易过时。 在个性化方面,模型没有有效方法将个性化信息纳入响应,除非使用有限且低效的元提示。 相关链接:
2024-08-20
如何构建一个专属自己的智能体,用于撰写公司新闻稿,我会长期输入公司信息 请选择几家大模型公司的产品,具体说下操作步骤
以下是一些可用于构建专属智能体以撰写公司新闻稿的平台及操作步骤: 1. Coze:这是新一代的一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot。它集成了丰富的插件工具,能极大地拓展 Bot 的能力边界。 2. Microsoft 的 Copilot Studio:其主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据自身需求打造大模型时代的产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行设计良好的工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托于钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 在实际构建和应用智能体时,您可以遵循以下准则: 1. 彻底让自己变成一个“懒人”。 2. 能动嘴的不要动手(用嘴说出您想做的事远比打字来的快)。 3. 能动手的尽量用 AI(用 AI 远比您苦哈哈的手敲要来的快)。 4. 把您手上的工作单元切割开,建设属于自己的智能体。 5. 根据结果反馈不断调整自己的智能体。 6. 定期审视自己的工作流程,看哪个部分可以更多的用上 AI。 您可以根据自己的需求选择适合的平台进行进一步探索和应用。
2024-08-09
如何构建一个专属自己的智能体,用于撰写公司新闻稿,我会长期输入公司信息
构建一个用于撰写公司新闻稿的专属智能体,您可以按照以下步骤进行: 1. 明确需求和目标:确定您希望智能体生成的新闻稿的风格、格式、内容重点等方面的要求。 2. 数据收集与整理:长期输入公司的相关信息,包括但不限于公司的发展历程、业务范围、近期重大事件、领导讲话等。确保数据的准确性、完整性和时效性。 3. 选择合适的技术和平台:有许多自然语言处理和机器学习的框架和平台可供选择,例如 TensorFlow、PyTorch 等。 4. 模型训练:使用收集到的数据对模型进行训练,不断调整参数以提高生成效果。 5. 测试与优化:在训练完成后,进行测试,查看生成的新闻稿是否符合预期,并根据测试结果对模型进行优化。 6. 持续学习与更新:随着公司的发展和信息的变化,持续为智能体提供新的数据,使其能够不断学习和改进。 需要注意的是,构建这样一个智能体需要一定的技术知识和实践经验,如果您不具备相关能力,可能需要寻求专业的技术团队或服务提供商的帮助。
2024-08-09
我希望画项目流程图
以下是使用 AI 绘制项目流程图的相关信息: 推荐工具和平台: 1. Lucidchart: 简介:强大的在线图表制作工具,集成 AI 功能,可自动化绘制多种示意图。 功能:拖放界面,易于使用;支持团队协作和实时编辑;丰富的模板库和自动布局功能。 官网:https://www.lucidchart.com/ 2. Microsoft Visio: 简介:专业的图表绘制工具,适用于复杂的流程图等。AI 功能可帮助自动化布局和优化设计。 功能:集成 Office 365,方便与其他 Office 应用协同工作;丰富的图表类型和模板;支持自动化和数据驱动的图表更新。 官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware 3. Diagrams.net: 简介:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。 功能:支持本地和云存储(如 Google Drive、Dropbox);多种图形和模板,易于创建和分享图表;可与多种第三方工具集成。 官网:https://www.diagrams.net/ 4. Creately: 简介:在线绘图和协作平台,利用 AI 简化图表创建过程,适合绘制多种图。 功能:智能绘图功能,可自动连接和排列图形;丰富的模板库和预定义形状;实时协作功能。 官网:https://creately.com/ 5. Whimsical: 简介:专注于用户体验和快速绘图的工具,适合创建多种图。 功能:直观的用户界面,易于上手;支持拖放操作,快速绘制和修改图表;提供多种协作功能。 官网:https://whimsical.com/ 6. Miro: 简介:在线白板平台,结合 AI 功能,适用于团队协作和各种示意图绘制。 功能:无缝协作,支持远程团队实时编辑;丰富的图表模板和工具;支持与其他项目管理工具集成。 官网:https://miro.com/ 使用步骤: 1. 选择工具:根据具体需求选择合适的 AI 绘图工具。 2. 创建账户:注册并登录该平台。 3. 选择模板:利用平台提供的模板库,选择适合需求的模板。 4. 添加内容:根据需求添加并编辑图形和文字,利用 AI 自动布局功能优化图表布局。 5. 协作和分享:若需要团队协作,可邀请团队成员一起编辑。完成后导出并分享图表。 利用这些 AI 工具,您可以快速、高效地创建专业的项目流程图,满足工作和项目需求。
2025-02-21
我想做一个产品(生涯规划领域的垂直大模型),这个产品服务的对象是所有人:帮助所有人进行更好的职业规划。每个人都能通过使用这个产品更好地了解自己,了解自己的天赋、兴趣、优势,然后找到自己的热爱的领域和热爱的事业,并且能够个性化地推荐相关的行业和职业,包括职业的主要工作内容和核心能力要求等等。 请对这个产品进行可行性分析,并给出产品的发展规划,别忘了给这个项目起一个名字。
以下是对您提出的生涯规划领域垂直大模型产品的可行性分析和发展规划,并为项目取名为“生涯智途”。 可行性分析: 1. 需求广泛:帮助人们进行职业规划是一个普遍存在的需求,涵盖了各个年龄段和职业阶段的人群。 2. 数据可用性:可以通过各种渠道收集大量与职业相关的数据,包括行业报告、职位描述、人才需求等。 3. 技术支持:当前大模型技术的发展为实现这样的产品提供了可能,能够处理和分析大量复杂的数据。 发展规划: 1. 数据收集与整理:广泛收集各类职业数据,建立丰富的数据库,确保数据的准确性和完整性。 2. 模型训练与优化:利用收集到的数据进行模型训练,不断优化模型,提高预测和推荐的准确性。 3. 功能开发: 个性化测评:开发能够准确评估用户天赋、兴趣、优势的功能模块。 精准推荐:根据用户的特点,提供个性化的行业和职业推荐,并详细介绍职业的工作内容和核心能力要求。 持续学习与更新:随着行业变化,及时更新数据和模型,以提供最新的职业信息。 4. 用户体验优化:设计简洁、易用的界面,提供良好的用户交互体验。 5. 市场推广:通过线上线下多种渠道进行推广,提高产品的知名度和用户覆盖面。 希望以上分析和规划对您有所帮助。
2025-02-18
AI如何在项目中运用
AI 在项目中的运用非常广泛,主要包括以下几个方面: 1. 辅助创作与学习:例如 AI 智能写作助手可帮助用户快速生成高质量文本,还有 AI 语言学习助手、诗歌创作助手、书法字体生成器、漫画生成器等为用户的学习和创作提供支持。 2. 推荐与规划:涵盖 AI 图像识别商品推荐、美食推荐平台、旅游行程规划器、时尚穿搭建议平台、智能投资顾问等,能根据用户需求和偏好推荐合适的产品、服务或制定个性化计划。 3. 监控与预警:像 AI 宠物健康监测设备、家居安全监控系统、天气预报预警系统、医疗诊断辅助系统等,可实时监测各种情况并提供预警。 4. 优化与管理:涉及办公自动化工具、物流路径优化工具、家居清洁机器人调度系统、金融风险评估工具等,有助于提高工作效率和管理水平。 5. 销售与交易:包括 AI 艺术作品生成器、书法作品销售平台、摄影作品销售平台、汽车销售平台、房地产交易平台等,为各类产品和服务提供销售渠道。 对于技术纯小白开发真正的应用,可逐步学习和实践。按照项目规划,学习一个 POC 并应用到大项目中。当遇到错误时,可复制错误信息和相关代码让 AI 找错修复,若使用可识图的 Claude 或 GPT4o,截图、错误信息和代码三件套会很有用。但可能会遇到一些问题,如 AI 给出错误的代码版本,此时更有效的方式是找文档(可让 GPT 提供文档链接或问 perplexity),或去 stackoverflow 上找答案(注意回答和评论的日期),然后将这些信息提供给 AI 让其修复。如有可能,找老师傅支援会更好。 在有具体需求的项目中运用 AI 仍存在困难,但其能提高生产效率,如创造美术资源,在创意瓶颈时也能提供启发和灵感。
2025-02-18
数字人项目
以下是关于数字人项目的相关信息: 构建高质量的 AI 数字人: 建好的数字人模型可以使用 web 前端页面(如 Live2D 提供的 web 端 SDK)或者 Native 的可执行程序进行部署,最终以 GUI 的形式呈现给用户。 开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择 live2d 作为数字人躯壳,原因是其驱动方式相比 AI 生成式更可控和自然,相比虚幻引擎更轻量和简单。卡通二次元形象的接受度更高,超写实风格在目前技术下易出现一致性问题和恐怖谷效应。Live2d 的 SDK 驱动方式可参考官方示例:https://github.com/Live2D 。 MimicMotion 项目: 腾讯发布的 MimicMotion 项目效果显著优于阿里,支持面部特征和唇形同步,不仅用于跳舞视频,也可应用于数字人。 相较阿里的方案,MimicMotion 的优化包括:基于置信度的姿态引导机制,确保生成视频更加连贯流畅;基于姿态置信度的区域损失放大技术,显著减少图像扭曲和变形;创新的渐进式融合策略,在可接受的计算资源消耗下,实现任意长度视频生成。项目地址:https://github.com/tencent/MimicMotion ,节点地址:https://github.com/AIFSH/ComfyUIMimicMotion 。 爱的传承·数字母亲: 内容负责人:朱睿电子酒 统筹负责人:张小琳电子酒 摄影:万阳 剪辑:萧川布丁子健 数字人:大萌子 使用工具:剪辑:剪映、imovie、美图秀秀;数字人:heygen 为完成数字人的拍摄,朱妈妈吃了 4 片吗啡。2 月 4 号制作完数字人,2 月 5 号拍摄,布丁川川子健凌晨开始剪辑,协调补拍追加了很多镜头,朱哥也熬了几个通宵来丰满素材。虽然最后呈现的效果不完美,但相信这部片子具有一定的社会价值。
2025-02-18
生成式AI教育场景应用 项目式学习 中小学案例
以下是一些中小学在生成式 AI 教育场景应用中采用项目式学习的案例: 北京市新英才学校: 开设“AI 创作家”小学课后服务特色课程,12 个五、六年级的学生在老师的引导和帮助下,主导设计一款实用的桌游。 学生们提出解决学校面积大导致新生和访客迷路的问题,决定制作一款学校地图桌游。 课程中,学生有时听老师讲解人工智能知识和工具使用方法,有时自己写 prompt 与大语言模型对话,还使用文生图 AI 工具生成桌游卡牌背后的图案,手绘第一版学校地图,选择游戏机制并梳理游戏流程。 在教育领域,生成式 AI 带来了诸多改变: 解决了教育科技长期以来在有效性和规模之间的权衡问题,可大规模部署个性化学习计划,为每个用户提供“口袋里的老师”,如实时交流并给予发音或措辞反馈的语言老师。 出现了众多辅助学习的产品,如教授新概念、帮助学习者解决各学科问题、指导数学作业、提升写作水平、协助创建演示文稿等。
2025-02-18
做chatbi有什么开源项目可以参考
以下是一些可参考的做 chatbot 的开源项目: Inhai:Agentic Workflow:其中介绍了大模型利用「网页搜索」工具的典型例子,还包括 Agent 自行规划任务执行的工作流路径以及多 Agent 协作的内容。 ChatDev:吴恩达通过此开源项目举例,可让大语言模型扮演不同角色相互协作开发应用或复杂程序。 ChatMLX:多语言支持,兼容多种模型,具有高性能与隐私保障,适用于注重隐私的对话应用开发者。链接:https://github.com/maiqingqiang/ChatMLX
2025-02-17