Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我想学习制作机器人 机器狗等的原理及方法,给我一份理论指导和操作指南吧。

Answer

以下是关于制作机器人和机器狗的理论指导和操作指南:

具身智能是将机器学习算法适配至物理实体,与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”通过网页端、手机 APP 与用户交互,能接受多种模态指令实现复杂任务。具身智能体则将大模型嵌入物理实体,通过传感器与人类交流,强调与物理环境交互。人形机器人是具身智能的代表产品。

具身智能有三要素:

  1. 本体:即硬件载体,不同环境有不同形态的硬件本体适应,如室内平地适用轮式机器人,崎岖地面适用四足机器人(机器狗)。
  2. 智能:包括大模型、语音、图像、控制、导航等算法。
  3. 环境:本体所交互的物理世界,本体、智能、环境高度耦合是高级智能基础。

具身智能还有四个模块:感知-决策-行动-反馈。一个具身智能体的行动分为这四个步骤,分别由四个模块完成并形成闭环。在具身智能体与环境的交互中,智能算法通过本体传感器感知环境,做出决策操控本体执行动作任务影响环境,还可通过“交互学习”和拟人化思维学习适应环境实现智能增长。

Content generated by AI large model, please carefully verify (powered by aily)

References

一篇具身智能的最新全面综述!(上)

具身智能,即“具身+智能”,是将机器学习算法适配至物理实体,从而与物理世界交互的人工智能范式。以ChatGPT为代表的“软件智能体”(或称“离身智能体”)使用大模型通过网页端、手机APP与用户进行交互,能够接受语音、文字、图片、视频的多种模态的用户指令,从而实现感知环境、规划、记忆以及工具调用,执行复杂的任务。在这些基础之上,具身智能体则将大模型嵌入到物理实体上,通过机器配备的传感器与人类交流,强调智能体与物理环境之间的交互。通俗一点讲,就是要给人工智能这个聪明的“头脑”装上一副“身体”。这个“身体”可以是一部手机,可以是一台自动驾驶汽车。而人形机器人则是集各类核心尖端技术于一体的载体,是具身智能的代表产品。具身智能的三要素:本体、智能、环境具身智能的三要素:“本体”,即硬件载体;“智能”,即大模型、语音、图像、控制、导航等算法;“环境”,即本体所交互的物理世界。本体、智能、环境的高度耦合才是高级智能的基础。不同环境下的会有不同形态的硬件本体以适应环境。比如室内平地更适用轮式机器人,崎岖不平的地面更适用四足机器人(机器狗)。在具身智能体与环境的交互中,智能算法可以通过本体的传感器以感知环境,做出决策以操控本体执行动作任务,从而影响环境。在智能算法与环境的交互中还可以通过“交互学习”和拟人化思维去学习和适应环境,从而实现智能的增长。具身智能的四个模块:感知-决策-行动-反馈一个具身智能体的行动可以分为“感知-决策-行动-反馈”四个步骤,分别由四个模块完成,并形成一个闭环。

Others are asking
有没有制作机器人的详细视频?
以下为您提供一些制作机器人相关的视频资源: Adobe MAX 2024 全球创意大会:一个可爱的机器人举着一颗红色发光心形,电影般逼真的详细镜头。灯光绚丽,阳光明媚,机器人脸上有斑驳的灯光,背光强烈。逼真的细节和纹理。色彩等级梦幻、阳光、温暖的色调。浅景深。胶片颗粒。用 35 毫米胶片拍摄。阳光透过窗户轻轻地照进来,营造出一种微妙而空灵的氛围。前景中失焦的绿色植物。慢动作,轻柔的动作。相机静止且锁定。 扣子案例合集 社区内容分享: 【Agent 共学第二期】制作一个新闻鉴别相关的 bot:https://www.bilibili.com/video/BV1QJ4m1M7ti/ 用 Coze 搭建智能机器人并挖掘销售线索:https://wap.peopleapp.com/video/rmh41227880/rmh41227880 coze 实战系列(一)| 天天小管家:https://www.bilibili.com/video/BV1nRMQexER7/ 毕业加速器:如何用 AI 爆肝论文?:https://www.bilibili.com/video/BV12z421m7YV 不写代码,如何用 Coze 做专属的对话机器人:https://www.bilibili.com/video/av1603694358 用 coze 一键生成朋友圈文案:https://www.xiaohongshu.com/explore/65c1d0ae000000001100d442 COZE:中小企业均可 0 门槛创建业务 agent,支持接入微信公众号、微信客服、discord、tele 等各种终端,实现公司 AI 客服、销售机器人等触达客户:https://www.bilibili.com/video/BV1DA4m1w72p/ 【Agent 共学第二期】许键分享|拆解“离谱村捏剧本”coze bot 思路:https://www.bilibili.com/video/BV1Cx4y1n7yU/ 【Agent 共学第二期】银海分享|用 AI 重塑我的工作流:https://www.bilibili.com/video/BV1sr421L7Hj/ 【Agent 共学第二期】大家一起捏 Bot,Coze 作品分享会:https://www.bilibili.com/video/BV1hT421v7YD/ 工具教程:morphstudio Morphstudio 官方 discord 使用教程 MorphVideo 机器人的使用: 文生视频:提示词指令:/video。举例:/video 你好世界比例 16:9动作幅度为 5镜头拉近每秒 30 帧秒数为 5 秒 Morph 机器人的使用: 图生视频:提示词指令:/animate 参数说明: ar(只针对 MorphVideo 机器人):这个参数用来设置视频的画面比例(比如 16:9,4:3,1:1,3:4,9:16)。 motion:这个参数用来调整视频中的运动强度。数值越低,运动越微妙,数值越高,运动越夸张。 camera:这个参数用来控制摄像头移动。Zoom:镜头拉近/拉远;Pan:摄像机向上/向下/向左/向右移动;Rotate:相机顺时针旋转或逆时针旋转;Static:相机静态。 fps:视频的帧率是指每秒钟播放的图片帧数。默认的帧率是每秒 24 帧。 s(只针对 MorphVideo 机器人):设置视频的时长,单位是秒。 提示:使用更加详细和描述性的提示可能会导致您生成的视频效果更好。可以试着调整不同的设置来达到想要的效果!
2025-02-26
用机器人一起直播会爆火吗
之前有过相关观点的文章《 。“人何以为人”是关注 AI 的教育届朋友们频频探讨的话题,今晚一起聊 AI 的教育创新,预计会碰撞出不少火花。但关于用机器人一起直播是否会爆火,目前无法给出确切的结论,其效果可能受到多种因素的影响,如直播内容的质量、机器人的表现、观众的兴趣和需求等。
2025-02-25
微信机器人
以下是关于微信机器人的相关内容: 测试和重新配置: 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时已通。若不通,可检查 config.json 文件中的配置或跳到“第四章,第 3 步”重启服务。 可为 AI 赋予不一样的提示词,返回“第三章,第 7 步”更改设置。 任何更改都需要“返回首页 右上角 点击重启,重启一下服务器”,熟悉 Linux 操作也可通过重启进程的方式重启服务。 然后在“文件”的【终端】里,输入“nohup python3 app.py&tail f nohup.out”重新扫码登录。 想退出机器人,在手机微信上找到桌面版已登录的信息,点击退出桌面版即可。 帮助:若遇到问题,可先查询社区知识库,或加“通往 AGI 之路”群,社区小伙伴会尽力帮助。也可加 Stuart 个人微信询问。 第一天教程:COW 部署 完成: 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时已通。 若想为 AI 赋予提示词,返回“目录 4 里的第 17 步”更改设置。 此后任何更改,都需要重新打印登陆二维码才会生效,建议多次重新登录后在宝塔“首页 右上角 点击重启,重启一下服务器”清理进程。 然后在“文件”的【终端】里,输入“nohup python3 app.py&tail f nohup.out”重新扫码登录。 若没有手机登录,可使用夜神模拟器模拟手机登录。 一个月内,不要上来就加好友、最好不要私聊聊天。 报错“wxsid”是因为微信未实名,实名即可。 Link AI 提供 100 个,合计 3500 万 GPT3.5 Token 的礼品码,可用于实现画图、搜索、识图等功能,COW 插件几乎都支持使用 LinkAI 平台。完成机器人搭建,机器人拉群里可领兑换码。 添加微信,拉您进机器人群先行体验。 第四天教程:FastGPT 教学 功能使用教程: 积分系统:此项目因加入积分系统,只有积分用户才可发起 AI 对话,主管理员大号可对别人进行加减积分操作,使用方式:@用户 加 100(加字后边有空格)。 群聊推送:原版本只支持公众号信息推送,二开在内测中。大号在群里发送“开启推送”即可在此群开启推送服务,然后大号在与小号私聊中发送任意公众号卡片,小号可转发到群聊中(目前仅支持公众号卡片)。 小工具使用示例(部分):发送 Help 查看使用方式。 登录失败: 若登录失败提示版本不对,执行以下步骤: 下载文件,放到 NGCbot 文件夹里()。 打开微信,先不要登录,保持在扫码/登录页面。 在文件夹空白处,shift + 鼠标右键,点击“在此处打开 Powershell 窗口”,然后输入相关命令,点击回车。 然后,回到文件夹下,双击 main.py 。 登录微信即可。 若群满,加我,回复“机器人”拉您进机器人群,回复“人类群”拉您进人类群。
2025-02-25
rpa机器人提醒每日计划如何实现
目前知识库中没有关于“RPA 机器人提醒每日计划如何实现”的相关内容。但一般来说,要实现 RPA 机器人提醒每日计划,可以考虑以下步骤:首先,明确每日计划的具体内容和格式,例如任务清单、时间安排等。然后,选择适合的 RPA 工具和技术,根据工具的特点和功能进行相应的配置和编程。在编程过程中,设置触发条件,如特定的时间点,以启动提醒功能。同时,确保 RPA 机器人能够与相关的应用程序或系统进行交互,获取和更新计划信息。还需要对提醒的方式进行设定,如弹窗、邮件、短信等,以满足用户的需求。最后,进行充分的测试和优化,确保提醒功能的准确性和稳定性。
2025-02-25
MacBook 如何搭建机器人进行日常事务操作
以下是在 MacBook 上搭建机器人进行日常事务操作的详细步骤: 搭建前准备: 硬件准备: MacBook(需能科学上网) 一部 iPhone 手机 主板 Arduino UNO R4 Wifi(200RMB) 舵机 9g(32RMB) 杜邦线,公对公 7 条(手残党可多备) (可选)八爪鱼支架(10RMB) (二选一)usbtypeC 转接头,或一根两头 typeC 的线 Arduino UNO R4 WIFI 开发板 MG90s/SG90 舵机 9g 云台支架 可选八爪鱼手机支架 杜邦线公对公 搭建步骤: 完成代码: 在 Github 上下载完整代码。 根据需求修改文件: 【必改】在 head.py 中找到填写主板串口的地方,改成串口地址(可通过主板写入的第 3 步里的小字或 Tools>Get Board Info 重新查询,复制 sn 号替换 usbmodem 后面的编码)。 【必改】查询 iPhone 的 ip 地址,填到 talk.py 里(iPhone 设置>无线局域网>点击当前 wifi 旁的感叹号>找到 ipv4 地址里写的 ip 地址)。 【必改】把 open ai key 填到 talk.py 里。 【可选】在 talk.py 里,可以修改: Openai 调用的 model。 system prompt(机器人的人设)。 机器人的音色。 录音的设置。 【可选】在 head.py 里,可以修改不对话后,等待多久恢复人脸追踪。 运行程序: 1. 在 MacBook 上按下 command+space(空格)打开一个新的终端,依次输入如下代码(每一次代码运行完以后再输入下一个),全部完成后,关闭端口。 2. 将 iPhone 的屏幕关闭时间设置为 5 分钟或永不。 3. 打开 iPhone 的 pythonista 并复制 face.py 的代码进去,运行。注意:每一次如果需要重新运行 pythonista,请先杀后台再运行,否则会因为端口已经被占用而无法播放声音。 4. 找到下载下来的 AIinhindsightGPTEmbodimentRobot 文件夹,control+单击文件夹,选择最后一项“新建位于文件夹位置的终端端口”。 5. 将 arduino R4 与 MacBook 相连,在终端中输入以下代码,运行后程序会申请一次摄像头权限,点击允许,然后出现运行失败,再运行一次即可。这个程序一旦运行,无法自然退出,建议直接拔掉 R4 的线或者终端输入 control+c 或者直接关闭终端,但多强制退出几次以后运行就会卡住需要重启或清进程。 6. 再次在 AIinhindsightGPTEmbodimentRobot 文件夹,control+单击文件夹,选择最后一项“新建位于文件夹位置的终端端口”,在终端中输入以下代码,运行后程序会申请一次录音权限,点击允许,然后出现运行失败,再运行一次即可。如果运行中出现任何报错,将本文档,代码,报错信息给到 GPT4,让他帮助你就好~可能是有一些库没有预装。 7. 把 talk.py 的终端放在最前面你能看到,出现 recording...的时候就可以说话了。 8. 三个程序同时运行、iPhone 和 MacBook 在同一 wifi,iPhone 没有调静音的情况下,就可以正常对话啦。
2025-02-25
微信机器人
以下是关于微信机器人的相关内容: 测试和重新配置 1. 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时表示已通。若未通过,可检查 config.json 文件中的配置或跳到“第四章,第 3 步”重启服务。 2. 为机器人设置不同的提示词,可返回“第三章,第 7 步”或“目录 4 里的第 17 步”,修改其中双引号内的 value 部分。 3. 此后任何更改,都需要“返回首页 右上角 点击重启,重启一下服务器”,或者若熟悉 linux 操作,可通过重启进程的方式来重启服务。然后,重新在“文件”的【终端】里,直接输入“nohup python3 app.py&tail f nohup.out”重新扫码登录即可。 4. 若想退出机器人,在手机微信上找到桌面版已登录的信息,点击退出桌面版即可。 帮助 如果遇到问题,可以先查询社区知识库,或者加“通往 AGI 之路”群,社区小伙伴们(比如梦飞大佬,熊猫大侠)会尽力帮助。也可以加 Stuart 个人微信询问。 第一天教程:COW 部署 完成 1. 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时表示已通。 2. 若想设置提示词,可返回“目录 4 里的第 17 步”修改。 3. 此后任何更改,都需要重新打印登陆二维码才会生效。建议在多次重新登录后,在宝塔“首页 右上角 点击重启,重启一下服务器”清理进程。 4. 然后,重新在“文件”的【终端】里,直接输入“nohup python3 app.py&tail f nohup.out”重新扫码登录即可。 5. 如果没有手机登录,可以使用夜神模拟器模拟手机登录。 6. 一个月内,不要上来就加好友、最好不要私聊聊天! 7. 报错“wxsid”是因为微信未实名,实名即可。 8. Link AI 提供 100 个,合计 3500 万 GPT3.5 Token 的礼品码,可用于实现画图、搜索、识图等功能,COW 插件里几乎都支持使用 LinkAI 平台。完成机器人搭建,机器人拉群里,可领兑换码。 9. 添加微信,拉您进机器人群,先行体验。 第四天教程:FastGPT 教学 功能使用教程 1. 积分系统:此项目因加入积分系统,只有积分用户才可发起 AI 对话,主管理员大号可对别人进行加减积分操作,使用方式:@用户 加 100(加字后边有空格)。 2. 群聊推送:原版本只支持公众号信息推送,二开版本在内测中。大号在群里发送“开启推送”,即可在此群开启推送服务。然后,大号在与小号的私聊中发送任意公众号卡片,小号就可以把信息转发到群聊中(目前仅支持公众号卡片)。 3. 小工具使用示例(部分):其他功能,可发送 Help 查看使用方式。 登录失败 如果登录失败提示版本不对,执行以下步骤: 1. 下载文件,放到 NGCbot 文件夹里。 2. 打开微信,先不要登录,保持在扫码/登录页面。 3. 在文件夹空白处,shift + 鼠标右键,点击“在此处打开 Powershell 窗口”,然后输入相关命令,点击回车。 4. 然后,回到文件夹下,双击 main.py 。 5. 登录微信即可。 若群满,加我,回复“机器人”拉您进机器人群,回复“人类群”拉您进人类群。
2025-02-24
deepseek的安装与使用指南
以下是关于 DeepSeek 的安装与使用指南: 安装: DeepSeek 网址为:https://www.deepseek.com/zh 。国内能访问,网页登录方便,目前完全免费。 使用: 1. 搜索 www.deepseek.com ,点击“开始对话”。 2. 点击开始对话后,左边选择代码助手。 3. 将装有提示词的代码发给 DeepSeek 。 4. 认真阅读开场白之后,正式开始对话。 此外,通过以下方式可以让 DeepSeek 的能力更上一层楼: 1. 用 Coze 做效果对比测试。 2. 设计思路包括将 Agent 封装成 Prompt 并储存在文件,通过提示词文件让 DeepSeek 实现同时使用联网功能和深度思考功能,在模型默认能力基础上优化输出质量等。 3. 完整提示词可参考相关版本。 在 AI 编程与炼金术方面,DeepSeek 也有相关应用,例如在 Trae 中的使用,具体可参考以下知识图谱: |章节|知识点| ||| || || || || || || || || || || || ||
2025-02-25
转行做AI产品经理的自学指南,并帮我找到学习资源途径
以下是一份转行做 AI 产品经理的自学指南及学习资源途径: 自学指南: 1. 了解 AI 基础知识,包括常见的概念、技术和应用。 2. 学习产品管理的核心知识,如需求分析、用户体验设计等。 3. 关注技术原理,例如思维链、RAG、PAL、ReAct 等,可通过相关论文和科普视频进行学习。 4. 积累实践经验,尝试参与实际项目或模拟项目。 学习资源途径: 1. WaytoAGI(通往 AGI 之路):这是一个致力于人工智能学习的中文知识库和社区平台,提供系统全面的 AI 学习路径,涵盖从基础概念到实际应用的各个方面。 汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。 提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 定期组织实践活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 2. 相关技术论文:虽然对于小白有难度,但可以借助 AI 辅助阅读,完成一定知识储备。 3. 科普视频:如林粒粒呀的相关科普视频。 4. 行业访谈:例如安克创新 CEO 阳萌的访谈,获取前沿观点和启发。 此外,您还可以参考北京分队中相关人员的经验,如 Sundy 从产品运营转行当 AIGC 产品经理的经历。
2025-02-21
清华104页AI使用指南
以下是清华 104 页 AI 使用指南的相关内容: 智能纪要部分: 共学课程涵盖 config UI 从入门到精通,还有个人专栏研究报告、产品数据、全球投融资情况等内容,做项目时可查看细分赛道融资情况,也可学习 AI 功能创业,介绍了企业专栏内容如 Kimi 的技巧等。 提到了 AI 的案例和投稿,包含开发相关、微信机器人、人物角色等内容,还有日报动态、法律法规、历史更新和社区介绍等,布置了关于 AI 兴趣方向的小作业。 介绍了 CONFIUI 生态大会东京站 11 月 16 17 日的活动内容及报名,包括社区共创项目、大奖、首届活动情况、海外创作者共学等。 总结了关于 AI 知识库使用及 AIPO 活动的介绍,包括使用情况、发起背景、内容安排及相关资源等;AIPO 线下活动及 AI 相关探讨,包括规则、玩法、重要地位和研究方向等;way to AGI 社区活动与知识库介绍,包括活动安排、材料准备、使用和内容更新等;还包括时代杂志评选的领军人物、AI 相关名词解释、知识库的信息来源、社区共创项目、学习路径、经典必读文章、初学者入门推荐、历史脉络类资料等。 介绍了 AI 相关技术与活动,如 AI 音乐创作、数字人语音合成、config UI 的应用,以及社区共创项目如东京的 confii 生态大会、AI 文旅视频、娃卡奖、李普村共创故事、AI 春晚等,还有作业与报名、线下寄送物料组织活动、AI 春晚即将开始、AIPO 活动及相关挑战、共学活动与技能提升、硬件机器人材料购买、自媒体发布与流量扶持、活动奖项与历史玩法、工具使用与新大赛预告等。
2025-02-17
写一篇关于个人AI生存协作的探索指南
以下是一篇关于个人 AI 生存协作的探索指南: 一、相关研究和报告 1. 平安证券发布的《AI 系列深度报告(六):AI 智能眼镜:AI 技术应用落地新风口,25 年有望迎来新品密集发布》指出,AI 技术推动终端创新,AI 智能眼镜成为新风口,具有轻薄、功能聚焦视听、佩戴舒适等特点,预计 2025 年新品将密集发布,销量有望翻倍。 2. 腾讯研究院发布的《2025 年 AI 转型的进展洞察报告》深入探讨了 AI 转型的定义、内涵、应用现状、投资情况、挑战与风险以及未来展望。报告指出企业对生成式 AI 的探索集中在核心业务环节,但在职能性环节成熟度更高,应用时以多目标为导向,优先聚焦提升核心能力和优化现有业务。 二、基础篇 过去一年持续进行了关于 AI 协作探索的研究和分享,包括 AI 产品的流量和竞争视角分析等。 三、协同智能的七种武器 1. 认知层/武器一:As Team,Be Leader 2. 视角层/武器二:AI as Person 3. 视角层/武器三:AI as ME 4. 视角层/武器四:AI as Alien 5. 实践层/武器五:AI as Tool 6. 实践层/武器六:AI as Mirror&Coach 7. 实践层/武器七:AI as Coworker&Friend 四、拓展阅读 包括 Gamma embed、AIGC 行业、AI 变革、公司/产业实践等方面的内容。 五、人类价值的低替代、提升方向和方式重塑 在领导决策、创新思维、沟通能力等方面,思考和创新占 70%,想法的实现执行和与 AI 协作执行占 30%。
2025-02-12
deepseek 使用指南
以下是 DeepSeek 的使用指南: 1. 效果对比:用 Coze 做了小测试,可对比查看相关视频。 2. 如何使用: 步骤 1:搜索 www.deepseek.com,点击“开始对话”。 步骤 2:将装有提示词的代码发给 DeepSeek。 步骤 3:认真阅读开场白之后,正式开始对话。 3. 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用,减轻调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力基础上优化输出质量,减轻 AI 味,增加可读性。 设计了阈值系统,可能形式大于实质,之后根据反馈可能会修改。 用 XML 进行更为规范的设定,而非 Lisp 和 Markdown。 4. 完整提示词:v 1.3 5. 特别鸣谢:李继刚的【思考的七把武器】在前期提供了很多思考方向;Thinking Claude 是最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源;Claude 3.5 Sonnet 是最得力的助手。 此外,还有以下相关内容: 1. 2 月 7 日的社区新闻速递中,《》是清华大学新闻与传播学院新媒体研究中心出品的指南,详细阐述了 DeepSeek 的功能及使用方法。 2. DeepSeekR1 提示词系统完全指南: 核心原理认知:包括 AI 特性定位(多模态理解、动态上下文、任务适应性)和系统响应机制(采用意图识别+内容生成双通道理,自动检测 prompt 中的任务类型/输出格式/知识范围,对位置权重、符号强调敏感)。 基础指令框架:如果不知道如何表达,可套用框架指令,包括四要素模板、格式控制语法(强制结构、占位符标记、优先级符号)。 进阶控制技巧:包括思维链引导(分步标记法、苏格拉底式追问)、知识库调用(领域限定指令、文献引用模式)、多模态输出。
2025-02-12
deepseek使用指南
以下是 DeepSeek 的使用指南: 1. 效果对比:用 Coze 做了小测试,可对比查看 2. 如何使用: 步骤 1:搜索 www.deepseek.com,点击“开始对话” 步骤 2:将装有提示词的代码发给 Deepseek 步骤 3:认真阅读开场白之后,正式开始对话 3. 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用,同时减轻调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(有难度)和 Markdown(运行不太稳定)。 4. 完整提示词:v 1.3 5. 特别鸣谢:李继刚的【思考的七把武器】在前期提供了很多思考方向;Thinking Claude 是现在最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源;Claude 3.5 Sonnet 是最得力的助手。 此外,还有以下相关内容: 1. 2 月 7 日的社区新闻速递中,《》是清华大学新闻与传播学院新媒体研究中心出品的指南,详细阐述了 DeepSeek 的功能,包括智能对话、文本生成、代码生成、自然语言理解等,并探讨了如何使用 DeepSeek,包括推理模型与通用模型的区别、提示语设计策略以及如何从入门到精通。文章还介绍了提示语设计的核心技能、常见陷阱及应对方法,旨在帮助用户更好地掌握 AI 工具的使用,提升工作效率和创新能力。 2. DeepSeekR1 提示词系统完全指南: 核心原理认知: AI 特性定位:多模态理解,支持文本/代码/数学公式混合输入;动态上下文,对话式连续记忆(约 4K tokens 上下文窗口);任务适应性,可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别+内容生成双通道理,自动检测 prompt 中的任务类型/输出格式/知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架:如果不知道如何表达,可套用框架指令。包括四要素模板、格式控制语法(强制结构:使用```包裹格式要求;占位符标记:用{{}}标注需填充内容;优先级符号:>表示关键要求,!表示禁止项)。 进阶控制技巧: 思维链引导:分步标记法,如请逐步思考:1.问题分析→2.方案设计→3.风险评估;苏格拉底式追问,在得出最终结论前,请先列举三个可能存在的认知偏差。 知识库调用:领域限定指令,如基于 2023 版中国药典,说明头孢类药物的配伍禁忌;文献引用模式,如以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破。 多模态输出。
2025-02-11
那普通人要研发机器狗从哪方面开始学习?
对于普通人想要研发机器狗,以下这些 AI 相关的基础知识是很有帮助的: 1. 了解 AI 的概念:AI 即人工智能,是让计算机模拟人类智能的技术。 2. 掌握机器学习:这是电脑找规律学习的方式,包括监督学习、无监督学习和强化学习。 监督学习:使用有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归任务。 无监督学习:处理没有标签的数据,让算法自主发现规律,例如聚类任务,像将一堆新闻文章按主题或内容特征分组。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训练小狗。 3. 深度学习:这是一种参照人脑构建神经网络和神经元的方法,由于有很多层所以称为深度。神经网络可用于监督学习、无监督学习和强化学习。 4. 熟悉生成式 AI:能够生成文本、图片、音频、视频等内容形式。 5. 了解 LLM(大语言模型):对于生成式 AI,生成图像的扩散模型不属于大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解,像上下文理解、情感分析、文本分类等,但不太擅长文本生成。 6. 关注技术里程碑:例如 2017 年 6 月谷歌团队发表的论文《Attention is All You Need》,首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖循环神经网络或卷积神经网络。 这些基础知识能为您研发机器狗提供理论支持和技术思路。
2025-02-26
普通人怎么研发制作机器狗?
普通人研发制作机器狗具有很大的挑战性,需要具备多方面的知识和技能。以下是一些关键的步骤和要点: 首先,要了解具身智能的概念。具身智能是将机器学习算法适配至物理实体,与物理世界交互的人工智能范式。人形机器人是具身智能的代表产品,而机器狗作为一种具身智能体,其研发涉及到“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界)三要素的高度耦合。 不同的环境需要不同形态的硬件本体来适应。例如,崎岖不平的地面更适用四足机器人(机器狗)。在具身智能体与环境的交互中,智能算法可以通过本体的传感器感知环境,做出决策以操控本体执行动作任务,从而影响环境。 在研发过程中,还需要关注以下方面: 1. 感知决策行动反馈的四个模块,形成一个闭环,以实现机器狗的有效行动。 2. 模拟训练环境的运用,例如像 Jim 团队在模拟环境中训练机器狗,并通过特定的代理和技术,将其转移到现实世界中。 3. 脑电波控制技术,如 MIT 研究团队通过特殊眼镜读取脑电波和眼动来控制波士顿动力机器狗,这为控制方式提供了新的思路。 然而,对于普通人来说,要完成机器狗的研发制作,还需要足够开放的环境、大规模预训练数据和强大的基础模型,这是非常困难的。但如果您有强烈的兴趣和决心,可以通过学习相关的专业知识,逐步积累经验来尝试。
2025-02-26
稍微技术点的科普书,机器学习一类的
以下为您推荐两本关于机器学习的科普书: 1. 《入门|机器学习研究者必知的八个神经网络架构》 神经网络是机器学习文献中的一类模型,受到生物神经网络的启发,目前深度神经网络效果很好,可应用于任何从输入到输出空间复杂映射的机器学习问题。 学习神经计算的三个理由:了解大脑工作原理、了解受神经元及其适应性连接启发的并行计算风格、使用受大脑启发的新颖学习算法解决实际问题。 一般来说,神经网络架构可分为三类:前馈神经网络(是实际应用中最常见的类型,若有多个隐藏层则称为“深度”神经网络)、循环网络(连接图中定向了循环,动态复杂,更具生物真实性)。 2. 《这是一份「不正经」的深度学习简述》 深度学习是使用不同类型神经网络的表征学习,通过优化网络的超参数来获得对数据的更好表征。 列举了几个经典案例,如反向传播(相关参考阅读:、A theoretical framework for BackPropagation——Yann Lecun:http://yann.lecun.com/exdb/publis/pdf/lecun88.pdf)、更好的初始化网络参数(初始化策略需根据所使用的激活函数选择)。
2025-02-25