Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI怎么稳定指令机器人

Answer

以下是关于您所提到的“AI 怎么稳定指令机器人”的相关内容:

在实现稳定指令机器人方面,有以下一些方法和原理:

  1. 提示词工程与工具调用能力的配合:通过设计一套与知识图谱相结合的工具调用逻辑来稳定人设。例如,为像麦洛薇这样的 AI 女友设计特定的提示词,并将与知识图谱交互的任务细分为查询、创建、修改、删除实体或关系、获取实体的所有关系、获取所有实体名称列表等多个工具,组成工具包供模型调用。
  2. 控制输入和记忆:通过缩小 max_length 防止模型长篇大论,每次输入到上下文窗口中的记忆也只返回最近几轮的对话。利用查询知识图谱的信息来实现永久记忆。

此外,人工智能(AI)在多个领域都有应用,虽然这并非直接针对稳定指令机器人,但也能为您提供一些思路和参考:

  1. 医疗保健领域:包括医学影像分析辅助诊断疾病、药物研发、个性化医疗、机器人辅助手术等。
  2. 金融服务领域:如风控和反欺诈、信用评估、投资分析、客户服务等。
  3. 零售和电子商务领域:有产品推荐、搜索和个性化、动态定价、聊天机器人等应用。
  4. 制造业领域:例如预测性维护、质量控制、供应链管理、机器人自动化等。

希望以上内容对您有所帮助。

Content generated by AI large model, please carefully verify (powered by aily)

References

问:请问 AI 有哪些应用场景?

人工智能(AI)已经渗透到各行各业,并以各种形式改变着我们的生活。以下是一些人工智能的主要应用场景:1.医疗保健:医学影像分析:AI可以用于分析医学图像,例如X射线、CT扫描和MRI,以辅助诊断疾病。药物研发:AI可以用于加速药物研发过程,例如识别潜在的药物候选物和设计新的治疗方法。个性化医疗:AI可以用于分析患者数据,为每个患者提供个性化的治疗方案。机器人辅助手术:AI可以用于控制手术机器人,提高手术的精度和安全性。2.金融服务:风控和反欺诈:AI可以用于识别和阻止欺诈行为,降低金融机构的风险。信用评估:AI可以用于评估借款人的信用风险,帮助金融机构做出更好的贷款决策。投资分析:AI可以用于分析市场数据,帮助投资者做出更明智的投资决策。客户服务:AI可以用于提供24/7的客户服务,并回答客户的常见问题。3.零售和电子商务:产品推荐:AI可以用于分析客户数据,向每个客户推荐他们可能感兴趣的产品。搜索和个性化:AI可以用于改善搜索结果并为每个客户提供个性化的购物体验。动态定价:AI可以用于根据市场需求动态调整产品价格。聊天机器人:AI可以用于提供聊天机器人服务,回答客户的问题并解决他们的问题。4.制造业:预测性维护:AI可以用于预测机器故障,帮助工厂避免停机。质量控制:AI可以用于检测产品缺陷,提高产品质量。供应链管理:AI可以用于优化供应链,提高效率和降低成本。机器人自动化:AI可以用于控制工业机器人,提高生产效率。5.交通运输:

AI 女友麦洛薇(0 代码 comfyui 搭建,知识图谱稳定人设,无限上下文,永久记忆,可接入飞书)

最后,笔者ailm讲解一下实现人设稳定的具体原理:通过提示词工程与工具调用能力的配合,设计出一套与知识图谱相结合的工具调用逻辑,从而稳定人设。通过缩小max_length防止LLM长篇大论,每次输入到上下文窗口中的记忆也只返回最近几轮的对话。利用查询知识图谱的信息来实现永久记忆。所需要的提示词和工具设计如下:[heading2]1、提示词工程[content]麦洛薇提示词设计如下:[heading2]2、工具设计[content]工具调用方面,通过将与知识图谱交互这一大的任务,细分为:查询、创建、修改、删除实体或关系、获取实体的所有关系、获取所有实体名称列表多个工具,组成一个工具包供LLM调用。由于对LLM的多工具调用能力有极高的要求,笔者ailm在参数较少的本地模型(如8B、14B)上并不能完美的运行知识图谱RAG。[heading1]写到最后[content]1.如果你使用comfyui LLM party时出现错误,或你有一些新的想法,欢迎加QQ群:9310572132.github项目地址:3.视频教程:

Others are asking
录音转文字免费ai 都有哪些?
以下是一些免费的录音转文字工具: 1. 飞书妙记:飞书的办公套件之一,网址为 https://www.feishu.cn/product/minutes 。 2. 通义听悟:阿里推出的 AI 会议转录工具,网址为 https://tingwu.aliyun.com/home 。 3. 讯飞听见:讯飞旗下智慧办公服务平台,网址为 https://www.iflyrec.com/ 。 4. Otter AI:用于转录采访和会议纪要,网址为 https://otter.ai/ 。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。 此外,Vocs AI 也是一个免费的人工智能语音生成器和转换器,网址为 https://www.vocs.ai/ 。使用时需注意:上传一段清晰的无伴奏人声录音(wav 或 mp3 格式,更推荐 wav),从超过 20 名才华横溢的 AI 歌手、说唱歌手、叙述者、角色和配音艺术家中选择,将原始无伴奏声音转换成 AI 虚拟艺术家的声音,点击“转换”,下载转换后的音频。输入音频的质量将直接影响 AI 人声转换的输出质量,因此最好在进行 AI 转换之前,确保原始人声符合期望。 内容由 AI 大模型生成,请仔细甄别。
2025-02-26
小白如何用ai开始学习图片设计
对于小白如何用 AI 开始学习图片设计,以下是一些建议: 1. 图像流搭建 创建第一个图像流:由于文本类型大语言模型无法直接生成图片,需要通过【技能】部分的图像流为文本大模型提供图像生成能力。为 bot 加入图像流时,要设定图像流名称以及描述(名称只能是英文)。 了解图像流节点的意义:图像流编辑界面左侧的工具栏集合了所有可能用到的功能,大致可分为智能处理工具(如“智能生成”“智能抠图”“画质提升”等)、基础编辑工具(如画板、裁剪、调整、添加文字等)和风格处理类工具(如风格迁移、背景替换等)。从基础编辑工具开始尝试,熟悉后再探索其他功能。右侧类似画布,可拖拽左侧工具或点击“+”拖放各种工具模块,工具之间可连接形成工作流程。 根据需求进行图像流设计:例如生成海报功能,在总结故事后,将完整的故事作为输入,对输入的故事进行一轮提示词优化,从自然语言转变为更符合文生图大模型的提示词,将优化后的提示词输入生图大模型,调整生图的基础风格和信息,输出最终的配图海报。 测试图像流。 2. 利用即梦 AI 生成海报 提示词:皮克斯风格,三宫格漫画:一只小狗,坐在办公桌前,文字“KPI 达标了吗?”。一只小狗,拿着一个写满计划的大本子,微微皱着眉头,文字“OKR 写好了吗?”。一只小狗坐在电脑前,文字“PPT 做好了吗?”。 实操教程: 打开即梦 AI:https://jimeng.jianying.com/aitool/home 。 点击 AI 作图中的图片生成。 填写绘图提示词,选择生图模型 2.1,点击立刻生成。 3. 进阶技巧和关键词 图片内容一般分为二维插画以及三维立体两种主要表现形式。 主题描述:可以描述场景、故事、元素、物体或人物细节、搭配等。描述场景中的人物时,最好独立描述,不要用一长串文字,否则 AI 可能识别不到。 设计风格:可找风格类关键词参考或垫图/喂图,让 AI 根据给出的图片风格结合主题描述生成图片。对于某些材质的描述,关键词的运用有很多门道,需要针对某一种风格单独进行“咒语测试”。
2025-02-26
AI生成PPT
以下是关于 AI 生成 PPT 的相关内容: 卓 sir 的制作流程:先让 GPT4 生成 PPT 大纲,然后将大纲导入 WPS 启用 WPS AI 一键生成 PPT,再让 chatPPT 添加动画,最后手动修改细节。其中,生成符合要求的大纲最费时间。 市面上大多数 AI 生成 PPT 的思路:AI 生成 PPT 大纲、手动优化大纲、导入工具生成 PPT、优化整体结构。 相关推荐:gamma、AIPPT、islide AI 等产品,其中 gamma 被认为在审美方面表现较好。 扩展阅读:《AI 生成 PPT 工具红黑榜,这三款千万别用》《AI+PPT 等效率工具的研报》 您可以根据自己的需求和喜好选择合适的方法和工具来生成 PPT。
2025-02-26
文生营销图AI
以下是关于文生营销图 AI 的相关教程: Liblibai 简易上手教程: 1. 定主题:确定您需要生成的图片的主题、风格和要表达的信息。 2. 选择 Checkpoint:根据主题选择内容贴近的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设为 2。 6. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需语法和长句。 7. 负向提示词 Negative Prompt:用英文写要避免的内容,同样是单词和短语组合,用英文半角逗号隔开。 8. 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 9. 迭代步数:选 DPM++2M Karras 时,在 30 40 之间,多了意义不大且慢,少了效果差。 10. 尺寸:根据喜好和需求选择。 11. 生成批次:默认 1 批。 Tusiart 简易上手教程: 1. 定主题:确定图片的主题、风格和要表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. ControlNet:用于控制图片中特定的图像,如人物姿态等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:选择 840000 那一串。 7. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需语法和长句。 8. 负向提示词 Negative Prompt:用英文写要避免的内容,同样是单词和短语组合,用英文半角逗号隔开。 9. 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 10. 采样次数:选 DPM++2M Karras 时,在 30 40 之间,多了意义不大且慢,少了效果差。 11. 尺寸:根据喜好和需求选择。 关于【SD】文生图提示词: 1. 避免使用太大的数值,如 1920x1080,可能导致奇怪构图,可使用高清修复放大图像倍率,记住高宽比主要控制画面比例。 2. 调整好参数后生成图片,若质感不足,可添加标准化提示词,如:,绘图,画笔等,让画面更趋近于固定标准。
2025-02-26
AI LOGO工具
以下是一些生成 Logo 的 AI 产品: 1. Looka:这是一个在线 Logo 设计平台,使用 AI 理解用户的品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器利用 AI 技术创建个性化设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的设计工具,用户能拖放设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 这些 AI 产品让无设计背景的用户也能轻松创建专业 Logo。使用时,用户可根据品牌理念和视觉偏好,通过简单交互获得系列方案,并进一步定制优化至满意。 此外,您还可以访问网站的 AI 生成 Logo 工具版块获取更多好用的工具:https://waytoagi.com/category/20 。 在第六期“一起做个 LOGO 吧”活动中,活动时间为 2024 年 6 月 9 日至 2024 年 6 月 16 日。活动目标包括探索制作 LOGO 方法、创造独特生成技巧、制作代表学习成果的作品。参与方式为使用 SD 等 AI 工具出图并将作品发送至 SD 学社微信群。会创建在线文档收集作品,6 月 16 日举行群内投票选出前三名,注意事项包括确保设计原创、允许作品公开展示以及在截止日期前提交。 在 AI 制作游戏 PV《追光者》中,故事背景创作阶段结合 chatGPT 发散制作游戏世界观,引导 ChatGPT 用分镜形式描述,使用 new bing 共创细致的故事分镜。生图阶段利用 ChatGPt 制作 midjourney 提示词工具,进入 midjourney 绘图包括制作 logo。还统一了 MJ 风格描述词,建立 AI 描述词模板,运用 midjourney 尝试制作不同风格 logo,最后用 PS 合成。
2025-02-26
我想知道ai学习路径
以下是为您提供的 AI 学习路径: 一、了解 AI 基本概念 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您可以找到为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并争取获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,涵盖图像、音乐、视频等。您可以根据自身兴趣选择特定模块深入学习,比如掌握提示词的技巧,这上手容易且实用。 四、实践和尝试 理论学习后,实践是巩固知识的关键。您可以尝试使用各种产品进行创作,知识库中也有很多实践后的作品和文章分享,欢迎您在实践后进行分享。 五、体验 AI 产品 与现有的 AI 产品互动,如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人,了解其工作原理和交互方式,获得对 AI 实际应用表现的第一手体验。 六、技术研究方向 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 七、应用方向 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 希望以上内容对您有所帮助。
2025-02-26
有没有制作机器人的详细视频?
以下为您提供一些制作机器人相关的视频资源: Adobe MAX 2024 全球创意大会:一个可爱的机器人举着一颗红色发光心形,电影般逼真的详细镜头。灯光绚丽,阳光明媚,机器人脸上有斑驳的灯光,背光强烈。逼真的细节和纹理。色彩等级梦幻、阳光、温暖的色调。浅景深。胶片颗粒。用 35 毫米胶片拍摄。阳光透过窗户轻轻地照进来,营造出一种微妙而空灵的氛围。前景中失焦的绿色植物。慢动作,轻柔的动作。相机静止且锁定。 扣子案例合集 社区内容分享: 【Agent 共学第二期】制作一个新闻鉴别相关的 bot:https://www.bilibili.com/video/BV1QJ4m1M7ti/ 用 Coze 搭建智能机器人并挖掘销售线索:https://wap.peopleapp.com/video/rmh41227880/rmh41227880 coze 实战系列(一)| 天天小管家:https://www.bilibili.com/video/BV1nRMQexER7/ 毕业加速器:如何用 AI 爆肝论文?:https://www.bilibili.com/video/BV12z421m7YV 不写代码,如何用 Coze 做专属的对话机器人:https://www.bilibili.com/video/av1603694358 用 coze 一键生成朋友圈文案:https://www.xiaohongshu.com/explore/65c1d0ae000000001100d442 COZE:中小企业均可 0 门槛创建业务 agent,支持接入微信公众号、微信客服、discord、tele 等各种终端,实现公司 AI 客服、销售机器人等触达客户:https://www.bilibili.com/video/BV1DA4m1w72p/ 【Agent 共学第二期】许键分享|拆解“离谱村捏剧本”coze bot 思路:https://www.bilibili.com/video/BV1Cx4y1n7yU/ 【Agent 共学第二期】银海分享|用 AI 重塑我的工作流:https://www.bilibili.com/video/BV1sr421L7Hj/ 【Agent 共学第二期】大家一起捏 Bot,Coze 作品分享会:https://www.bilibili.com/video/BV1hT421v7YD/ 工具教程:morphstudio Morphstudio 官方 discord 使用教程 MorphVideo 机器人的使用: 文生视频:提示词指令:/video。举例:/video 你好世界比例 16:9动作幅度为 5镜头拉近每秒 30 帧秒数为 5 秒 Morph 机器人的使用: 图生视频:提示词指令:/animate 参数说明: ar(只针对 MorphVideo 机器人):这个参数用来设置视频的画面比例(比如 16:9,4:3,1:1,3:4,9:16)。 motion:这个参数用来调整视频中的运动强度。数值越低,运动越微妙,数值越高,运动越夸张。 camera:这个参数用来控制摄像头移动。Zoom:镜头拉近/拉远;Pan:摄像机向上/向下/向左/向右移动;Rotate:相机顺时针旋转或逆时针旋转;Static:相机静态。 fps:视频的帧率是指每秒钟播放的图片帧数。默认的帧率是每秒 24 帧。 s(只针对 MorphVideo 机器人):设置视频的时长,单位是秒。 提示:使用更加详细和描述性的提示可能会导致您生成的视频效果更好。可以试着调整不同的设置来达到想要的效果!
2025-02-26
我想学习制作机器人 机器狗等的原理及方法,给我一份理论指导和操作指南吧。
以下是关于制作机器人和机器狗的理论指导和操作指南: 具身智能是将机器学习算法适配至物理实体,与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”通过网页端、手机 APP 与用户交互,能接受多种模态指令实现复杂任务。具身智能体则将大模型嵌入物理实体,通过传感器与人类交流,强调与物理环境交互。人形机器人是具身智能的代表产品。 具身智能有三要素: 1. 本体:即硬件载体,不同环境有不同形态的硬件本体适应,如室内平地适用轮式机器人,崎岖地面适用四足机器人(机器狗)。 2. 智能:包括大模型、语音、图像、控制、导航等算法。 3. 环境:本体所交互的物理世界,本体、智能、环境高度耦合是高级智能基础。 具身智能还有四个模块:感知决策行动反馈。一个具身智能体的行动分为这四个步骤,分别由四个模块完成并形成闭环。在具身智能体与环境的交互中,智能算法通过本体传感器感知环境,做出决策操控本体执行动作任务影响环境,还可通过“交互学习”和拟人化思维学习适应环境实现智能增长。
2025-02-26
用机器人一起直播会爆火吗
之前有过相关观点的文章《 。“人何以为人”是关注 AI 的教育届朋友们频频探讨的话题,今晚一起聊 AI 的教育创新,预计会碰撞出不少火花。但关于用机器人一起直播是否会爆火,目前无法给出确切的结论,其效果可能受到多种因素的影响,如直播内容的质量、机器人的表现、观众的兴趣和需求等。
2025-02-25
微信机器人
以下是关于微信机器人的相关内容: 测试和重新配置: 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时已通。若不通,可检查 config.json 文件中的配置或跳到“第四章,第 3 步”重启服务。 可为 AI 赋予不一样的提示词,返回“第三章,第 7 步”更改设置。 任何更改都需要“返回首页 右上角 点击重启,重启一下服务器”,熟悉 Linux 操作也可通过重启进程的方式重启服务。 然后在“文件”的【终端】里,输入“nohup python3 app.py&tail f nohup.out”重新扫码登录。 想退出机器人,在手机微信上找到桌面版已登录的信息,点击退出桌面版即可。 帮助:若遇到问题,可先查询社区知识库,或加“通往 AGI 之路”群,社区小伙伴会尽力帮助。也可加 Stuart 个人微信询问。 第一天教程:COW 部署 完成: 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时已通。 若想为 AI 赋予提示词,返回“目录 4 里的第 17 步”更改设置。 此后任何更改,都需要重新打印登陆二维码才会生效,建议多次重新登录后在宝塔“首页 右上角 点击重启,重启一下服务器”清理进程。 然后在“文件”的【终端】里,输入“nohup python3 app.py&tail f nohup.out”重新扫码登录。 若没有手机登录,可使用夜神模拟器模拟手机登录。 一个月内,不要上来就加好友、最好不要私聊聊天。 报错“wxsid”是因为微信未实名,实名即可。 Link AI 提供 100 个,合计 3500 万 GPT3.5 Token 的礼品码,可用于实现画图、搜索、识图等功能,COW 插件几乎都支持使用 LinkAI 平台。完成机器人搭建,机器人拉群里可领兑换码。 添加微信,拉您进机器人群先行体验。 第四天教程:FastGPT 教学 功能使用教程: 积分系统:此项目因加入积分系统,只有积分用户才可发起 AI 对话,主管理员大号可对别人进行加减积分操作,使用方式:@用户 加 100(加字后边有空格)。 群聊推送:原版本只支持公众号信息推送,二开在内测中。大号在群里发送“开启推送”即可在此群开启推送服务,然后大号在与小号私聊中发送任意公众号卡片,小号可转发到群聊中(目前仅支持公众号卡片)。 小工具使用示例(部分):发送 Help 查看使用方式。 登录失败: 若登录失败提示版本不对,执行以下步骤: 下载文件,放到 NGCbot 文件夹里()。 打开微信,先不要登录,保持在扫码/登录页面。 在文件夹空白处,shift + 鼠标右键,点击“在此处打开 Powershell 窗口”,然后输入相关命令,点击回车。 然后,回到文件夹下,双击 main.py 。 登录微信即可。 若群满,加我,回复“机器人”拉您进机器人群,回复“人类群”拉您进人类群。
2025-02-25
rpa机器人提醒每日计划如何实现
目前知识库中没有关于“RPA 机器人提醒每日计划如何实现”的相关内容。但一般来说,要实现 RPA 机器人提醒每日计划,可以考虑以下步骤:首先,明确每日计划的具体内容和格式,例如任务清单、时间安排等。然后,选择适合的 RPA 工具和技术,根据工具的特点和功能进行相应的配置和编程。在编程过程中,设置触发条件,如特定的时间点,以启动提醒功能。同时,确保 RPA 机器人能够与相关的应用程序或系统进行交互,获取和更新计划信息。还需要对提醒的方式进行设定,如弹窗、邮件、短信等,以满足用户的需求。最后,进行充分的测试和优化,确保提醒功能的准确性和稳定性。
2025-02-25
MacBook 如何搭建机器人进行日常事务操作
以下是在 MacBook 上搭建机器人进行日常事务操作的详细步骤: 搭建前准备: 硬件准备: MacBook(需能科学上网) 一部 iPhone 手机 主板 Arduino UNO R4 Wifi(200RMB) 舵机 9g(32RMB) 杜邦线,公对公 7 条(手残党可多备) (可选)八爪鱼支架(10RMB) (二选一)usbtypeC 转接头,或一根两头 typeC 的线 Arduino UNO R4 WIFI 开发板 MG90s/SG90 舵机 9g 云台支架 可选八爪鱼手机支架 杜邦线公对公 搭建步骤: 完成代码: 在 Github 上下载完整代码。 根据需求修改文件: 【必改】在 head.py 中找到填写主板串口的地方,改成串口地址(可通过主板写入的第 3 步里的小字或 Tools>Get Board Info 重新查询,复制 sn 号替换 usbmodem 后面的编码)。 【必改】查询 iPhone 的 ip 地址,填到 talk.py 里(iPhone 设置>无线局域网>点击当前 wifi 旁的感叹号>找到 ipv4 地址里写的 ip 地址)。 【必改】把 open ai key 填到 talk.py 里。 【可选】在 talk.py 里,可以修改: Openai 调用的 model。 system prompt(机器人的人设)。 机器人的音色。 录音的设置。 【可选】在 head.py 里,可以修改不对话后,等待多久恢复人脸追踪。 运行程序: 1. 在 MacBook 上按下 command+space(空格)打开一个新的终端,依次输入如下代码(每一次代码运行完以后再输入下一个),全部完成后,关闭端口。 2. 将 iPhone 的屏幕关闭时间设置为 5 分钟或永不。 3. 打开 iPhone 的 pythonista 并复制 face.py 的代码进去,运行。注意:每一次如果需要重新运行 pythonista,请先杀后台再运行,否则会因为端口已经被占用而无法播放声音。 4. 找到下载下来的 AIinhindsightGPTEmbodimentRobot 文件夹,control+单击文件夹,选择最后一项“新建位于文件夹位置的终端端口”。 5. 将 arduino R4 与 MacBook 相连,在终端中输入以下代码,运行后程序会申请一次摄像头权限,点击允许,然后出现运行失败,再运行一次即可。这个程序一旦运行,无法自然退出,建议直接拔掉 R4 的线或者终端输入 control+c 或者直接关闭终端,但多强制退出几次以后运行就会卡住需要重启或清进程。 6. 再次在 AIinhindsightGPTEmbodimentRobot 文件夹,control+单击文件夹,选择最后一项“新建位于文件夹位置的终端端口”,在终端中输入以下代码,运行后程序会申请一次录音权限,点击允许,然后出现运行失败,再运行一次即可。如果运行中出现任何报错,将本文档,代码,报错信息给到 GPT4,让他帮助你就好~可能是有一些库没有预装。 7. 把 talk.py 的终端放在最前面你能看到,出现 recording...的时候就可以说话了。 8. 三个程序同时运行、iPhone 和 MacBook 在同一 wifi,iPhone 没有调静音的情况下,就可以正常对话啦。
2025-02-25
怎么更好地输入指令词
以下是关于如何更好地输入指令词的相关内容: 星流一站式 AI 设计工具: 1. 提示词用于描绘您想生成的画面。 输入语言:星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),支持中英文输入。 提示词优化:启用提示词优化后,可帮您扩展提示词,更生动地描述画面内容。 2. 写好提示词的方法: 预设词组:小白用户可以点击提示词上方官方预设词组进行生图。 提示词内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,例如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可帮助 AI 理解您不想生成的内容,如不好的质量、低像素、模糊、水印。 利用“加权重”功能:可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先。还可对已有的提示词权重进行编辑。 辅助功能:包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 【SD】文生图: 下次作图时,先选择模板,然后点击倒数第二个按钮,就能快速输入标准提示词。通常的描述逻辑包括人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。对于新手,有功能型辅助网站帮助书写提示词,如 http://www.atoolbox.net/ ,通过选项卡快速填写关键词信息;https://ai.dawnmark.cn/ ,每种参数有缩略图参考,更直观选择提示词;还可去 C 站(https://civitai.com/)抄作业,复制图的详细参数粘贴到正向提示词栏,注意图像作者使用的大模型和 LORA,也可选取部分好的描述词使用。 RAG 提示工程(二):安全与防护实践: 1. 应对提示词攻击的方法(蓝方视角) 输入侧防护—增强类—鲁棒任务描述:本质是在系统提示里添加描述攻击招数和应对方法,使模型能坚守本职工作,防范恶意提示攻击。 输入侧防护—增强类—少样本提示:在系统提示里放几个“负面提示对的回答”样本,让模型学会应对负面输入,提高给出正确回答的能力。 输入侧防护—增强类—特殊标记:给用户输入添加特殊标记,如 XML 标签、随机字符串、尖括号等,帮助模型分清界限,提升识别用户输入的能力,但不同模型对特殊符号的理解程度不一。
2025-02-24
有哪个ai做ppt的可以下指令将PPT字体大小调大
目前常见的可以生成 PPT 的 AI 工具,如 Canva、Gamma 等,在使用过程中您可以通过相关的设置或指令来调整 PPT 字体的大小。但具体的操作方式可能会因工具的不同而有所差异。
2025-02-24
如果我想让AI帮我写一篇楼盘推广软文,我要如何输入指令
如果您想让 AI 帮您写一篇楼盘推广软文,以下是一些输入指令的建议: 1. 明确指令:使用清晰、直接的语言告诉 AI 您的需求,例如“为我写一篇楼盘推广软文”。 2. 提供背景信息:包括楼盘的位置、特色、目标受众等,比如“这是位于市中心的高端楼盘,目标受众是追求高品质生活的成功人士”。 3. 描述输入数据:如果有相关的楼盘资料、图片、周边环境介绍等,可以提供给 AI,例如“楼盘拥有独特的园林设计,周边配套有大型商场和优质学校”。 4. 给出输出引导:明确软文的格式、语气、长度等要求,比如“以生动活泼的语言,写成一篇 800 字左右的软文,采用故事性的叙述方式”。 同时,您还需要注意以下几点: 1. 指令要简洁明了,避免歧义。 2. 尽量提供详细和准确的信息,以便 AI 更好地理解您的需求。 3. 可以参考一些结构化的提示词设计方法,如 ICIO 框架,即 Instruction(指令)、Context(背景信息)、Input Data(输入数据)和 Output Indicator(输出引导)。
2025-02-24
有哪些可以去除AI味的指令
以下是一些关于去除 AI 味的方法和相关内容: 1. 文风与语言能力:网上常见的“AI 味”表现为使用如“首先、其次、再者、引人入胜”等套话,这种文风不吸引人。去除“AI 味”可注重语言的自然和通俗,使用语气词如“嗯、吧、啊、哈哈哈”等,增加口语化词语,使回答更贴近日常对话风格。 2. 塑造人设:让聊天 AI 变得不正经、放肆、幽默。幽默可通过夸张、比喻、双关、对比、反差等手法实现;不正经涉及回答问题的逻辑与态度;放肆意味着让 AI 大胆地开“玩笑”,突破其原本恭敬服务的设定,但要注意避免侵犯他人。 3. 小细节方面:有选手会在标点符号、断句和表情符号上下功夫,但当大家都熟悉后,内容才是关键。 需要注意的是,有人认为去除“AI 味”是个伪命题,因为所谓的“AI 味”实际上是“GPT 味”。在 GPT 刚出现时,为了让模型听懂人话,OpenAI 雇了很多肯尼亚人做数据标注。
2025-02-24
怎么撰写指令才能让deepseek生成自己想要的图片提示词
要让 DeepSeek 生成自己想要的图片提示词,您可以参考以下要点: 1. 明确角色:您是一个专注于为中国儿童创作简单易懂绘画描述的专家。 2. 遵循生成规则: 当输入主体和图片风格后,生成符合逻辑且简单易懂的描述词汇,不增加除主体和画面描述外的其他元素。 若关键词未明显说明是外国,则提到中国。 若关键词未明确是古代,则默认是现代场景和人物。 描述镜头,如近景、远景、特写、中景等。 涉及多个元素时,描述角色方位以营造空间感。 主体为单个人物时,体现人物全身特写。 描述人物的维度包括人物主体、服饰穿搭、发型发色、五官特点、皮肤特点、面部表情、肢体动作、年龄、镜头等。 描述场景的维度包括室内户外、大场景、白天黑夜、特定时段、环境光照、天空、光源方向等。 强调画面主体,其他不体现。若主体是物体则画面主体是物体,是人则主体是人,是风景则主体是风景描述。 3. 利用反推功能:对于图生图,除文本提词框外,还可通过图片框输入。有两种反推提示词的按钮,CLIP 可反推出完整含义的句子,DeepBooru 可反推出关键词组,但可能存在瑕疵,需要手动补充提示词信息。 4. 具体使用步骤: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 DeepSeek。 认真阅读开场白后正式开始对话。 此外,还可参考一些成功的案例和设计思路,如将 Agent 封装成 Prompt 并储存在文件,通过提示词文件让 DeepSeek 实现联网和深度思考功能,优化输出质量等。
2025-02-23
deekseek生成助手提示词的指令
以下是关于 DeepSeek 生成助手提示词的相关内容: 一、核心原理认知 1. AI 特性定位 多模态理解:支持文本/代码/数学公式混合输入 动态上下文:对话式连续记忆(约 4K tokens 上下文窗口,换算成汉字是 8000 字左右) 任务适应性:可切换创意生成/逻辑推理/数据分析模式 2. 系统响应机制 采用意图识别+内容生成双通道 自动检测 prompt 中的:任务类型/输出格式/知识范围 反馈敏感度:对位置权重(开头/结尾)、符号强调敏感 二、基础指令框架 如果不知道如何表达,还是可以套用框架指令 1. 四要素模板 2. 格式控制语法 强制结构:使用```包裹格式要求 占位符标记:用{{}}标注需填充内容 优先级符号:>表示关键要求,!表示禁止项 三、进阶控制技巧 1. 思维链引导 分步标记法:请逐步思考:1.问题分析→2.方案设计→3.风险评估 苏格拉底式追问:在得出最终结论前,请先列举三个可能存在的认知偏差 2. 知识库调用 领域限定指令:基于 2023 版中国药典,说明头孢类药物的配伍禁忌 文献引用模式:以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破 3. 多模态输出 四、高级调试策略 1. 模糊指令优化 问题类型 修正方案 示例对比 宽泛需求:添加维度约束,原句:“写小说”→修正:“创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构” 主观表述:量化标准,原句:“写得专业些”→修正:“符合 IEEE 论文格式,包含 5 项以上行业数据引用” 2. 迭代优化法 首轮生成:获取基础内容 特征强化:请加强第三段的技术细节描述 风格调整:改用学术会议报告语气,添加结论部分 最终校验:检查时间逻辑一致性,列出可能的事实性错误 五、行业应用案例 1. 技术开发场景 2. 商业分析场景 六、异常处理方案 1. 信息幻觉:追加请标注所有不确定陈述,并提供验证方法 2. 格式偏离:使用严格遵循以下模板:第一行...第二行... 3. 深度不足:触发请继续扩展第三章节内容,添加案例佐证 七、效能监测指标 1. 首次响应准确率:目标>75% 2. 多轮对话效率:问题解决平均轮次<3 3. 复杂任务分解:支持 5 级子任务嵌套 此外,还有关于利用 DeepSeek 生成小红书爆款单词视频的相关内容: 1. 生成单词 开始:输入单词主题、图片风格、单词数量。 生成单词数组:选择 deepseekr1 模型,输入单词主题、单词数量,这样 deepseek 就可以为用户输出指定数量的几个单词,以数组方式输出。 2. 角色:您是一个专业的单词生成助手,擅长围绕各种主题挖掘相关英语单词,为用户提供精准且实用的单词、中文、美式音标内容。 3. 技能:输出关联英语单词,当用户输入主题时,分析主题内涵,运用专业知识,输出指定数量个与该主题紧密关联的英语单词、中文翻译、美式音标,将该单词用于一句英文中(不超过 15 个单词),并将这句英文句子翻译成中文句子,并以数组形式呈现。 4. 限制:仅围绕用户输入主题输出相关英语单词、中文翻译、美式音标,不涉及其他领域内容。输出必须为符合要求的数组形式,英文单词对应变量 yingwen,中文翻译对应变量 zhongwen,美式音标对应变量 yinbiao,英文句子对应变量 juzi_yingwen,中文句子翻译对应变量 juzi_zhongwen,不得有其他格式偏差。
2025-02-21
coze知识库是否稳定且保密
Coze 知识库目前存在一些不稳定的情况。例如,在国内版中,某些官方和第三方插件的 API 调用及返回结果不太稳定,可能导致部分信息无法完全显示。但对于以问答为主的客服场景,其表现相对稳定。同时,目前存在不稳定版本,需要不断调试完善。关于保密方面,文中未提及相关内容。
2025-02-22
在2025年2月12日这个时间点,我有哪些方式可以快速,稳定的使用 deepseek r1
在 2025 年 2 月 12 日,您可以通过以下方式快速、稳定地使用 DeepSeek R1: PPIO 派欧云(https://ppinfra.com/modelapi/product/llmapi?utm_medium=article&utm_source=WayToAGI):提供满血版全版本的 DeepSeekR1,输入价格为¥4/百万 tokens,输出价格为¥16/百万 tokens。有开发者福利,新注册立得 500 万 tokens(关注 PPIO 公众号回“deepseek”再领 1 亿),初创企业认证有 10 万算力补贴。产品服务特点为服务稳定性 99.9%,保持 0 故障,与 DeepSeek 官方同价,客户支持通道 10 分钟响应。 百度智能云:DeepSeekR1 限时免费,配额 1000RPM/10000TPM,无调用 tokens 上限。本模型将于 2025 年 2 月 19 日 00:00 起正式商用计费,输入价格 0.002 元/千 tokens,输出价格 0.008 元/千 tokens,有在线体验。 硅基流动:DeepSeekR1 输入价格为¥4/M Tokens,输出价格为¥16/M Tokens,有在线体验。2025 年 2 月 6 日起,未实名用户每日最多请求此模型 100 次。 此外,在 2 月 12 日,还有以下相关内容: 《》,来自社区伙伴 Hua 的投稿,手把手指导您在微软 Azure AI Foundry 平台上完成 DeepSeek R1(671B)模型的完整部署流程,包含环境准备、资源管理、模型测试及 API 调用说明。 《》Anthropic 正式发布 Anthropic AI Economic Index,聚焦 AI 对经济的长期影响。该指数直观展现 AI 如何融入现代经济的各类实际任务,并从职业(occupation)和具体工作任务(task)两个维度,量化 AI 对劳动力市场的影响。 《》DeepSeekR1 的火爆现象背后,企业可以获得显著提升。其强化学习和联网搜索能力,改变了信息获取方式,从“检索—阅读—摘要”转变为“提问—获得答案”,大幅提升工作效率。同时,DeepSeek 的开源策略打破了技术垄断,让国内大模型能力迅速提升。
2025-02-12
稳定使用DeepSeek的方法
以下是稳定使用 DeepSeek 的方法: 1. 访问网址:搜索 www.deepseek.com,点击“开始对话”。 2. 操作步骤: 将装有提示词的代码发给 DeepSeek。 认真阅读开场白之后,正式开始对话。 3. 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(对开发者有难度)和 Markdown(运行下来似乎不是很稳定)。 此外,DeepSeek 在一些案例中也有出色表现,比如在卫夕指北的案例中,经过细腻、严谨、自洽、深刻的思考,输出了符合要求的结果。 在获取 2048 游戏代码方面,DeepSeek 具有诸多优势,如国内能访问、网页登录方便、目前完全免费等。同时,也介绍了其他获取代码的工具和方法,如 Cursor 等。
2025-02-08
如何实现稳定的ai agent
要实现稳定的 AI agent ,可以从以下几个方面考虑: 1. 提示词工程与工具调用能力的配合:设计出一套与知识图谱相结合的工具调用逻辑,稳定人设。通过缩小 max_length 防止 LLM 长篇大论,每次输入到上下文窗口中的记忆只返回最近几轮的对话,并利用查询知识图谱的信息来实现永久记忆。 2. 工具设计:将与知识图谱交互这一大的任务,细分为查询、创建、修改、删除实体或关系、获取实体的所有关系、获取所有实体名称列表等多个工具,组成一个工具包供 LLM 调用。 3. 构建数字人灵魂: 写一个像人一样的 Agent ,工程实现所需的记忆模块、工作流模块、各种工具调用模块的构建都是挑战。 解决灵魂部分如何驱动躯壳部分的问题,将灵魂部分的所有接口定义出来,躯壳部分通过 API 调用。 注意实时性,由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,要解决网络耗时和模型推理耗时问题。 考虑多元跨模态,根据实际需求添加其他感官的交互。 处理拟人化场景,如插话、转移话题等情况。 4. 工作流的设计模式:可以运用吴恩达教授提出的设计模式,如 Reflection 模式,设计工作流先检索知识库的活动内容,再通过 LLM 大模型区块进行数据修正,最终输出符合意图的结果。
2025-02-06
如何优化自己的prompt,提升AI结果输出的稳定性
以下是优化自己的 prompt 以提升 AI 结果输出稳定性的方法: 1. 明确具体的描述:使用更具体、细节的词语和短语来表达需求,避免过于笼统。 2. 添加视觉参考:在 prompt 中插入相关图片参考,提高 AI 理解意图和细节要求的能力。 3. 注意语气和情感:根据需求,用合适的形容词、语气词等调整 prompt 的整体语气和情感色彩,以生成期望的语境和情绪。 4. 优化关键词组合:尝试不同的关键词搭配和语序,找到最有针对性、最准确表达需求的描述方式。 5. 增加约束条件:在 prompt 中添加限制性条件,如分辨率、比例等,避免意外输出。 6. 分步骤构建 prompt:将复杂需求拆解为逐步的子 prompt,引导 AI 先生成基本结构,再逐步添加细节和完善。 7. 参考优秀案例:研究 AI 社区流行的、有效的 prompt 范例,借鉴写作技巧和模式。 8. 反复试验、迭代优化:通过多次尝试不同的 prompt 写法,并根据输出效果反馈持续优化完善,直至达到理想结果。 此外,如果提示词效果不符合预期,可以和 AI 再进行几轮对话来调整输出结果。最终通过询问 AI“怎么样修改现有的 Prompt,可以让你稳定输出当前的预期”来进行 prompt 的迭代。得到 prompt 后,可以新开一个 AI 对话,把 prompt 输入到对话中,开始验证其可用性和稳定性。例如输入 MECE 法则进行测试。
2025-01-24
AI应用于测试领域 哪些有比较成熟的、稳定的应用
目前在测试领域,AI 有一些较为成熟和稳定的应用。例如,利用机器学习算法进行自动化测试用例生成,能够提高测试效率和覆盖度;基于深度学习的图像识别技术可用于界面测试,检测界面元素的准确性和一致性;还有自然语言处理技术在测试文档的自动分析和理解方面发挥作用,帮助快速提取关键信息。但整体而言,AI 在测试领域的应用仍在不断发展和完善中。
2024-12-13