Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

midjourney邀请好友使用

Answer

Midjourney 是在 AI 绘图领域家喻户晓的产品,具有强大的模型和充分的个性化设置,能生成高质量图像,但使用过程不太便捷,需要通过 Discord 应用加入其频道或创建自己的频道并邀请 Midjourney 机器人才能开始生成图片,学习难度较大,在用户体验和易用性方面有待改进。

关于 Midjourney 的更新:

  1. 在提示符后面输入--p 可激活基于排名偏好的个性化。若要永久启用个性化功能,可使用命令/settings 并在[🙋 Personalization]下选择适当选项;在 Midjourney 网页应用程序中,查找切换“Personalization 个性化:[开][关]”的选项。
  2. 在 Discord 的公共创作频道中,可使用--p @名字应用他人的个性化代码,但无法在私信中使用。
  3. 可以同时使用多个--p 代码来混合不同的个性化风格,并使用权重语法调整每个代码的影响力,例如--p 1uwjacn::1 1yjtfcj::0.5。
  4. 参数--s 允许控制个性化(--p)与其他风格(--style)的影响力,默认影响力值为 100,0 表示最小影响力,1000 表示最大影响力。
  5. 个性化(--p)与其他风格参数功能类似,可使用--s 调节它们的组合效果。在网页界面上,确保使用整数调整权重,使用小数会导致错误。

此外,我们的学社有相关的招募和学习活动:

  1. 目标是大家一起收集和测试适用 AI 绘画提示词中的核心关键词,让新手规避无效探索,为相关从业人员节省时间。
  2. 招募有 Midjourney 账号且喜欢 AI 绘画的人员,一起根据群中每天给出的关键词,通过出图测试关键词效果,扫飞书二维码进群。
  3. 学习方面是根据关键词做创意,收录不错的作品。
Content generated by AI large model, please carefully verify (powered by aily)

References

给小白的AI产品推荐

在AI绘图领域,Midjourney可以说是家喻户晓的产品了。如果你接触过AI绘图工具,Midjourney很可能是你听到最多的名字。Midjourney的确有许多优点:它的模型非常强大,能生成高质量的图像,而且用户可以进行充分的个性化设置。然而,它的使用过程并不那么便捷。你需要通过Discord应用加入Midjourney的频道,或者创建自己的频道并邀请Midjourney机器人,才能开始生成图片。因此,从学习难度来看,我认为Midjourney的学习曲线是最陡峭的。另外,从某种程度上说,它并不是一个完整的产品,因为它没有帮助用户解决"最后一公里"的问题,也就是说,它在用户体验和易用性方面还有待改进。

学社说明

在各大社交平台上,我们能欣赏到众多以AI技术创作的精美画作。博主们通常会分享一组英文提示词,让你能够依此复现这些作品。然而,随着时间推移,你可能会发现自己陷入了仅仅复制与粘贴的循环中,似乎并未从中学到任何实质性的技能。你也尝试理解那些复杂的提示词时,密集的英文表述和不准确的翻译常常令人望而却步。但实际上,掌握并理解一些提示词中的核心关键词并不像想象中那么困难,只要掌握了正确的方法,你完全有能力独立还原并创新创作过程。[heading1]目标[content]大家一起收集和测试,适用AI绘画提示词中的核心关键词,让新手规避无效探索,为相关从业人员节省时间。[heading1]招募[content]一起根据群中的每天给出的关键词,通过出图测试关键词效果,有midjourney账号,喜欢AI绘画即可。扫飞书二维码进群[heading1]学习[content]根据关键词做创意,收录不错的作品。

Midjourney 更新 · --sref 「风格参考」和 --p 「个性化模型」混合使用

·在你的提示符后面输入--p,以激活基于你的排名偏好的个性化。·若要永久启用个性化功能,不必每次都输入--p,可以使用命令/settings并在[🙋 Personalization]下选择适当的选项。·如果使用Midjourney网页应用程序,请查找切换“ Personalization个性化:[开][关]”的选项。·在Discord的公共创作频道中,可以使用--p @名字应用他人的个性化代码(指的是你在/info页面顶部看到的用户ID。它是永久性的,即使你的个性化风格发生变化,这个代码也不会改变。你无法保存一个今天的代码作为“今天”的快照,然后在将来获取一个新的代码作为“六周后”的快照。无论是今天还是六周后,这个代码都是相同的,但是风格可能已经发生了变化),但无法在私信中使用。5.使用多个代码·你可以同时使用多个--p代码来混合不同的个性化风格。·使用权重语法调整每个代码的影响力,例如--p 1uwjacn::1 1yjtfcj::0.5,指定每个代码的不同权重。6.使用--s控制影响力·参数--s允许你控制个性化(--p)与其他风格(--style)的影响力。默认影响力值为100,0表示最小影响力,1000表示最大影响力。7.兼容性与使用·个性化(--p)与其他风格参数(如--style raw)的功能类似,你可以使用--s来调节它们的组合效果。·在网页界面上,确保使用整数调整权重;使用小数会导致错误。通过了解这些内容,你可以有效地利用和管理个性化功能,根据自己的视觉偏好定制输出。

Others are asking
midjourney
以下是关于 Midjourney 的相关信息: 隐私政策: 本隐私政策适用于 Midjourney,Inc.、Midjourney.com 网站和 Midjourney 图像生成平台的服务。Midjourney 是一家通信技术孵化器,提供图像生成服务以增强人类创造力并促进社会联系。 个人数据指与个人相关、可用于直接或间接识别个人身份的任何信息。本政策适用于 Midjourney 收集、使用和披露的个人数据,包括通过服务、训练机器学习算法过程、网站以及第三方来源收集的数据,但不适用于 Midjourney 员工和候选人等的个人数据。 可能会不时更新政策,适用法律要求时会通知变更。若不接受变更应停止互动。 定义方面,“您”指访问或使用服务的个人或代表该个人的公司等。使用数据指自动收集的数据。 收集的数据类型包括个人数据。 图像提示: 要将图像添加到提示中,可按“/imagine”开始输入,出现提示框后,将图片文件拖入或右键单击并粘贴图片的 URL。 使用 Midjourney Bot 在私信中上传图像可防止其他服务器用户看到,除非用户具有隐身模式,否则图像提示在 Midjourney 网站上可见。 给出了多个例子,如阿波罗雕像、复古花图、恩斯特·海克尔的水母等,以及不同模型版本和纵横比提示。 社区准则: Midjourney 是默认开放的社区,内容必须为 P。 要友善并尊重彼此和员工,禁止不尊重、攻击性或辱骂性的图像或文本提示,不容忍任何形式的暴力或骚扰。 禁止成人内容或血腥内容,未经许可不得公开转发他人创作,分享时要小心。 违反规则可能导致服务被禁止,规则适用于所有内容。
2025-03-17
Midjourney怎样生成人物侧脸照?
要在 Midjourney 中生成人物侧脸照,您可以按照以下步骤进行操作: 1. 初始图(单人画面生成结果)。 2. 找到已生成的人物纯图,提取图片链接(url)做准备工作。 3. 基于生成的构图清晰但人物失控的成图基础上,进行重绘 Vary Region。具体操作包括:框选需要被替换的人物,然后将准备好的链接,贴入框内界面 cref 后面,注意先把原始的 cref(即红色部分)删掉。 4. 连续“抽卡”后找到合适的角度,选中理想的图片,U1/U2/U3/U4 点击后就可以拿出来使用。 5. 假设需求是让配角转头营造“偷看主角”的感觉。先准备一个正脸照的链接,然后进入重绘界面圈起红色部分,更新 cref 的链接为正脸照链接。如果还是出不来,再修改原有指令词,要求将女性的侧脸照替换成正脸。坚持几轮抽卡后就可以得到需要的结果。 此外,Midjourney V6 更新了角色一致性命令“cref”。您可以添加角色参考图像,并选择一个“cw”以达到效果。Midjourney 能够从参考图像中识别的角色属性将与提示混合,从而创建出您角色的最终表现。您可以通过使用“cw N”参数(cref 权重)来大致控制转移,其中 N 的值可以从 1 到 100,默认值为 100。需要注意的是,“cw”参数不会改变角色参考图像的强度/影响力,“cw 100”的值(默认值)将捕捉整个角色,“cw 99 到cw 1”之间的值将开始捕捉较少的整个角色,仅集中于转移面部,“cw 0”的值将仅捕捉面部,大致类似于面部替换。
2025-03-17
学习MIdjourney
学习 Midjourney 可以采取以下步骤: 1. 注册 Discord 账号并加入 Midjourney 服务器:这是使用 Midjourney 的基础,Midjourney 也推出了在线版本,可以直接使用。 2. 掌握 Midjourney 的提示词(Prompt)结构:了解 Prompt 的基本组成部分,如“主体”“媒介”“环境”等,学习如何构建有效的 Prompt 来生成理想的图像。 3. 熟悉 Midjourney 的常用参数和命令:学习 Midjourney 的各种参数设置,如放大、细节等,掌握常用的 Midjourney 命令,如/imagine、/test 等。 4. 针对不同应用场景练习创作:尝试针对插画、游戏、框架等不同场景进行创作练习,通过实践不断提高 Prompt 编写和图像生成的技巧。 5. 学习他人的优秀作品并进行模仿:观察和学习其他用户的优秀作品,了解他们的 Prompt 技巧,通过模仿练习,提高自己的创作水平。 此外,还可以通过以下方式辅助学习: 训练 Midjourney 的 prompt:把 Midjourney 的官网说明书喂给 GPT,让它根据说明一步步了解机制和结构,给出适合的提示词。如果官网说明更新了,可以自主替换,也可以用这个方法去学习一些其他技能。 参考 Midjourney 官方指南:在私信 Midjourney Bot 使用/imagine 命令,了解更多的 Prompts,学习如何编写基础提示信息,探索如何通过艺术媒介、地点和时期的描述来改变图像。还可以学习如何使用/blend 命令合并图片,上传至少两张图像,然后使用命令加上已上传的图像 ID,调整混合过程中的各种设置。 总的来说,系统地学习 Prompt 编写技巧、熟悉 Midjourney 的功能,并通过大量实践创作,是学习 Midjourney 的有效方法。同时也要善于学习他人的经验,不断提升自己的创作能力。内容由 AI 大模型生成,请仔细甄别。
2025-03-16
Midjourney
以下是关于 Midjourney 的相关信息: 隐私政策: 本隐私政策适用于 Midjourney,Inc.、Midjourney.com 网站和 Midjourney 图像生成平台的服务。Midjourney 是一家通信技术孵化器,提供图像生成服务以增强人类创造力并促进社会联系。 个人数据指与个人相关、可用于直接或间接识别个人身份的任何信息。本政策适用于 Midjourney 收集、使用和披露的个人数据,包括通过服务、训练机器学习算法过程、网站以及第三方来源收集的数据,但不适用于某些特定人员的个人数据。 可能会不时更新政策,适用法律要求时会通知变更。 定义了“您”或“您的”的含义以及使用数据的概念。 收集的数据类型包括个人数据。 图像提示: 要将图像添加到提示中,可按/imagine 输入,出现提示框后,将图片文件拖入或右键单击并粘贴链接。 使用 Midjourney Bot 在私信中上传图像可防止其他服务器用户看到,除非用户具有隐身模式,否则图像提示在 Midjourney 网站上可见。 给出了多个例子,如不同的起始图像和中途模型版本的相关示例,还提到纵横比提示,即将图像裁剪为与最终图像相同的宽高比以获得最佳效果。 社区准则: Midjourney 是默认开放的社区,内容必须为 P。 要友善并尊重彼此和员工,不创建不尊重、攻击性或辱骂性的图像或使用此类文本提示,禁止任何形式的暴力或骚扰。 无成人内容或血腥内容,未经许可不公开转发他人创作,分享时要小心。 任何违反规则的行为可能导致服务被禁止,规则适用于所有内容。
2025-03-12
midjourney 一致性
Midjourney 推出了角色一致性功能,以下是相关要点: 1. 该功能在 MJ 一鸽再鸽后终于放出,同步支持 MJ V6 和 Niji V6。 2. 风格一致性、角色一致性、场景一致性是进入生产管线的重要可控性功能,实现难度由低到高。 3. cref 背后参数 cw 的值可从 0 设到 100,cw 100 是默认参数,会参考原图的脸部、头发和衣服,但会非常不吃 Prompt;cw 0 时,就只会参考脸部,约等于一个换脸。 4. 使用方法:在提示词后输入 `cref URL` 并附上一个人物图像的 URL,注意一定要在提示词后面,第一次没注意加在前面会报错。可以使用 `cw` 来修改参考强度,强度 100 是默认值,会使用面部、头发和衣服;强度 0 时,只会关注面部,适合改变服装、发型等。 5. cref 命令适用于单一主题、单一角色的图像。如果计划在场景中添加多个角色,需要使用平移按钮来添加,基于 cref 的多个角色放置到单个画布上的最佳方法是使用平移功能将新的画布与现有画布拼接在一起,每个新画布的部分都将有自己的 cref。使用时需先使用 /settings 将 Remix 打开,然后选择 ,选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来,寻找蓝色小箭头添加新角色。 6. 您可以仅描述环境、周围环境、背景或情境,Midjourney 将努力将角色融入场景中。如果出现不连贯的结果,可尝试使用更高值的样式化(s),例如 s 800。 7. 体验 MJ 网页版的网址:https://alpha.midjourney.com/
2025-03-11
midjourney 提示词
以下是关于 Midjourney 提示词的相关内容: Midjourney V6 更新风格参考命令 2.0: 将 sref 和 URL添加到提示的末尾,以指定风格参考图像。使用“风格参考”图像的魔力在于 Midjourney 将努力捕捉参考图像的美学特质而非语义内容。新提示本身不应包含美学内容,这有助于 sref 的执行。例如:A young man stands at the edge of the forest cliff,looking over the ocean below.sref https://s.mj.run/9DFZsjKwkyEv 6.0 Midjourney 基础知识·提示: 在 Midjourney 中,提示是提供给 AI 的文本命令,用于指示其创建内容,可以是单词、句子或详细描述。提示设计越周到,结果越可能符合预期。 简单提示示例:Prompt:An alien humanoidv 6.1 提示:一个外星人形生物v 6.1 详细提示示例:Prompt:A lowangle shot of an alien humanoid creature with a glowing screen on its face,looking down from the side,atmospheric lighting,and a minimalist backgroundv 6.1 提示:一个外星人形生物的低角度镜头,它的脸上有一个发光的屏幕,从侧面向下看,大气的照明,和极简主义的背景v 6.1 色彩缤纷的油画: 在 Midjourney 中,"colorful oil painting"是特定提示词,用于引导生成具有油画质感且色彩丰富的图像。"Colorful"指包含许多鲜明、明亮的颜色,"Oil painting"指使用油画颜料作画的艺术形式,特点是颜料质地浓厚、层次丰富、色彩深邃。 艺术风格: "Oil painting"通常与古典艺术和现实主义联系,也可与多种艺术风格和主义结合,如印象派、表现主义或超现实主义等。 使用"colorful oil painting"提示词时,构图通常呈现油画特有的质感和笔触,可能采用传统油画构图技巧,如黄金分割、三分法或动态对称来平衡画面元素。 "Colorful"强调色彩丰富多样,生成的图像通常包含鲜艳、饱和的色彩及对比色或互补色运用,以增加视觉冲击力。 此外,关于 Midjourney V6、V5.2 和 niji 6 的出图部分未提供具体内容。如果您想了解更多关于 Midjourney 提示词的信息,建议参考 Midjourney 官方文档或相关教程。
2025-03-10
微信ai好友
以下是关于搭建 AI 微信聊天机器人的相关内容: 直接对接 Coze 平台 Bot 的微信聊天机器人搭建: 服务器相关配置是最复杂的部分,但已将很多代码相关的集成隐藏和优化,只需使用简单的模板配置,基于上一篇教程的编排模板进行修改即可切换对接 Coze。 具体步骤包括修改容器编排模板、新建或参考无描述性的配置、删除可能冲突的服务、创建新的容器编排并启动服务,服务启动成功后可进入 COW 服务扫码绑定微信机器人。 DIN:全程白嫖拥有一个 AI 大模型的微信助手: 搭建步骤包括搭建 接入微信,并配置 FastGpt 将知识库问答系统接入微信,建议先用小号以防封禁风险。 该助手能解答任何问题,可接入微信或群聊提供自动答疑服务,能投喂特定知识,满足不同需求,支持多场景应用,全程免费,小白也能轻松搭建。
2025-03-15
如何实现定时通过用一个指定的豆包智能体给微信好友 发送自定义语音消息,,
要实现定时通过指定的智能体给微信好友发送自定义语音消息,您可以参考以下步骤: 1. 找到相关设置中的高级下开场白,点击展开,填写开场白文案和开场白预置问题。 2. 勾选用户问题建议,在 Bot 回复后,根据 Prompt 提供最多 3 条用户提问建议。 3. 添加语音选择,让智能体不仅会写,还能通过语音交流。 4. 点击“发布”,选择发布平台,如微信客服。 5. 提前准备一个闲置的微信,因为这种方法是非官方接口,有可能微信号会受到官方限制。 6. 点击容器,查看运行的服务,接口文档中可能启动了两个服务。 7. 点击“wcandyaibot”后面的日志按钮,用提前预备好的微信进行扫码。 8. 手动刷新界面验证是否成功,点击“刷新日志”,若显示“WeChat login success”,则微信登录成功。 9. 为确保微信实时在线,点击“日志管理”的“wcandyaibot”的“刷新日志”,若显示“wechat login seccess”则表示微信正常登录中。 10. 把绑定的微信号拉到群里或者单独对话进行效果测试,训练的数据越好,对话效果越好。
2025-01-26
我想实现定时通过用我的声音生成的智能体给微信好友 发送自定义语音消息,,如何实现, 并且帮我做出能实现这个功能的工具
目前暂时没有直接能实现您这个需求的现成工具。但要实现这个功能,可能需要以下步骤: 1. 声音采集与处理:首先需要采集您的声音,并进行处理和特征提取,以便后续生成语音。 2. 智能体开发:利用相关技术开发能够模拟您声音的智能体。 3. 微信接口对接:由于微信的接口限制和安全策略,直接对接微信发送消息可能存在困难,需要寻找合法合规的途径。 4. 定时任务设置:通过编程实现定时发送的功能。 这是一个较为复杂的综合性项目,可能需要涉及语音处理、人工智能、软件开发等多方面的知识和技术。
2025-01-26
AI 制作电子邀请函
以下是关于 AI 制作电子邀请函的一些信息: 《PROMPTS FOR AI DANCE MUSIC》:这是一本与 AI 合作创作音乐相关的电子书,其中提到把它看作是与 AI 合作的邀请,共同创作更多音乐,包括充满生命力的节拍、让灵魂想跳舞的节奏和萦绕心中的旋律等。 祝您 2025 天天开心副本:使用 AI 写了来自硅基世界的邀请函,在制作过程中包括汇编和检查等工作,如保证创作者信息无误、协调满足特殊需求等,还选择了合适的特种纸以保证作品的美观和舒适,最终制成的日历沉甸甸的,受到大家喜爱。 XiaoHu.AI 日报 2 月 5 日:苹果推出了 Apple Invites,可使用照片库或内置背景创建个性化邀请函,内置地图和天气能自动提供活动地点和天气信息,还有共享相册、Apple Music 播放列表等功能,非 Apple 设备用户也可通过链接分享接受邀请。详细介绍和下载链接可参考相关网址。
2025-03-12
邀请函海报设计工具
以下是一些用于设计邀请函海报的 AI 产品: 1. Canva(可画):https://www.canva.cn/ 这是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,用户通过简单拖放操作即可创建海报,其 AI 功能可帮助选择合适的颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进的人工智能技术,能自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ 这是一个简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,其智能建议功能可帮助快速找到合适的设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,大大简化设计流程。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-04
想要使用AI软件对学生成绩进行分析,请问应该用什么提示词
以下是一些关于使用提示词对学生成绩进行分析的建议: 1. 明确分析目标:例如找出成绩优秀和较差的学生特点、分析成绩的趋势等。 2. 描述数据特点:包括成绩的科目、分数范围、数据量等。 3. 确定分析方法:如比较不同时间段的成绩、按照班级或年级进行分类分析等。 4. 强调重点关注内容:比如特定学科的成绩表现、成绩波动较大的学生等。 5. 注意提示词的准确性和清晰性,避免模糊或歧义的表述。 在实际编写提示词时,可以参考以下格式:“对的表现。” 同时,不同的 AI 工具可能对提示词的要求和处理方式有所不同,您可能需要根据具体工具的特点进行适当调整。
2025-03-17
Dify 怎么使用
Dify 有以下使用方式和相关信息: 云服务版本:可直接在官网 dify.ai 上注册账号使用。 部署社区版:开源且可商用,但不能作为多租户服务使用,对个人使用无限制。部署前提条件为 2 核 4G 云服务器一台(约 159 元),本地也可部署但较折腾。 构建知识库的具体步骤: 准备数据:收集文本数据,包括文档、表格等格式,并进行清洗、分段等预处理,确保数据质量。 创建数据集:在 Dify 中创建新数据集,上传准备好的文档,并编写良好描述。 配置索引方式:提供三种索引方式(高质量模式、经济模式和 Q&A 分段模式),根据需求选择。 集成至应用:将数据集集成到对话型应用中,在应用设置中配置数据集使用方式。 持续优化:收集用户反馈,优化知识库内容和索引方式,定期更新增加新内容。 Dify 是开源的大模型应用开发平台,结合后端即服务和 LLMOps 理念,提供直观界面快速构建和部署生产级别的生成式 AI 应用。具备强大工作流构建工具、支持广泛模型集成、提示词 IDE、全面的 RAG Pipeline 用于文档处理和检索,允许定义 Agent 智能体,通过 LLMOps 功能持续监控和优化应用性能。提供云服务和本地部署选项,满足不同用户需求。其设计理念注重简单性、克制和快速迭代,官方手册:https://docs.dify.ai/v/zhhans 。一般个人研究推荐单独使用,企业级落地项目推荐多种框架结合。
2025-03-17
适合客户端使用的 asr 模型有什么
以下是一些适合客户端使用的 ASR 模型: 1. Ollama: 支持多种大型语言模型,如通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 CPU 和 GPU。 提供模型库,用户可从中下载不同参数和大小的模型以满足不同需求和硬件条件,可通过 https://ollama.com/library 查找。 支持用户自定义模型,例如修改模型的温度参数来调整创造性和连贯性,或者设置特定的系统消息。 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 2. FishAudio 的 Fish Agent: 集成了自动语音识别(ASR)和文本到语音(TTS)技术,无需传统的语义编码器/解码器,即可实现语音到语音的直接转换。 模型经过 700,000 小时的多语言音频内容训练,支持包括英语、中文在内的多种语言,能够精准捕捉和生成环境音频信息。文本方面由 Qwen2.53B 处理。 相关链接: https://huggingface.co/fishaudio/fishagentv0.13b https://github.com/fishaudio/fishspeech 3. Gemini: Gemini Nano1 和 Gemini Pro 模型在各种 Benchmark 上的自动语音识别(ASR)任务中表现出色,如在 FLEURS、多语言 Librispeech 以及语音翻译任务 CoVoST 2 等测试集中。 相关链接:未提及。
2025-03-17
适合客户端使用的 tts 模型有什么
以下是一些适合客户端使用的 TTS 模型: 1. Fish Speech:语音处理接近人类水平,约十五万小时三语数据,对中文支持完美。开发者为 fishaudio,具有亿级参数,高效轻量,可在个人设备上运行和微调,适合作为私人语音助手。详细介绍及更多演示:https://xiaohu.ai/p/10779 ,GitHub:https://github.com/fishaudio/fishspeech 。 2. GPTSoVITS:只需 1 分钟语音即可训练一个自己的 TTS 模型,是一个声音克隆和文本到语音转换的开源 Python RAG 框架。5 秒数据就能模仿,1 分钟的声音数据就能训练出高质量的 TTS 模型,完美克隆声音。支持零样本 TTS、少量样本训练、跨语言支持、易于使用的界面等。GitHub: 。
2025-03-17
我是美区Tiktok shop 的卖家,希望使用AI生成带货短视频
以下是使用 AI 生成美区 TikTok Shop 带货短视频的步骤: 一、用 ChatGPT 生成短视频选题文案 表明身份,描述需求并提出回答要求,以美妆行业为例展开。 二、用 ChatGPT 生产短视频文案 将需求与框架结合,让 ChatGPT 为您生成短视频文案。 三、生成虚拟数字人短视频 1. 打开网站(需科学上网):https://studio.did.com/editor 2. 在右侧文字框输入从 ChatGPT 产生的内容,选择想要的头像。 3. 选择不同的国家和声音。 4. 内容和人像选择好后,点击右上角的“Create Video”,等待生成。 四、虚拟数字人结合产品做视频 1. 添加产品/介绍背景 若有自己的视频/图片素材可直接使用,若无,可根据搜索添加。 2. 扣像结合背景 在剪映中把数字人扣下来,导入视频,点击画面选择抠像,点击智能扣像,调整到合适的大小和位置。 3. 添加字幕和音乐 智能识别字幕。 可搜索添加音乐或手动添加喜欢的音乐。 这样就可以根据您的需求结合图片生成所需的视频,用于带货或讲解产品,也可应用于直播(直播可能收费,短视频可通过购买邮箱注册使用免费时长或直接购买会员版)。
2025-03-17
我需要搭建一个每个人都能使用的知识库
要搭建一个每个人都能使用的知识库,可以考虑使用 GPT 并借助 embeddings 技术。以下是相关步骤和原理: 1. 文本处理:将大文本拆分成若干小文本块(chunk)。 2. 向量转换:通过 embeddings API 将小文本块转换成与语义相关的 embeddings 向量,并在向量储存库中保存这些向量和文本块,作为问答的知识库。 3. 问题处理:当用户提出问题时,先将问题通过 embeddings API 转换成问题向量,然后与向量储存库中的所有文本块向量进行比对,查找距离最小的几个向量,提取对应的文本块,并与原有问题组合成新的 prompt 发送给 GPT API。 4. 容量限制:GPT3.5 一次交互支持的 Token 数量有限,embedding API 是解决处理大量领域知识的方案。 5. 理解 embeddings:embeddings 是浮点数字的向量,向量之间的距离衡量关联性,小距离表示高关联度。例如,“猫”和“狗”距离近,与“汽车”距离远。 例如,对于一篇万字长文,拆分成的 chunks 包含:文本块 1:本文作者:越山。xxxx。文本块 2:公众号越山集的介绍:传播效率方法,分享 AI 应用,陪伴彼此在成长路上,共同前行。文本块 3:《反脆弱》作者塔勒布xxxx。文本块 4:“科技爱好者周刊”主编阮一峰会记录每周值得分享的科技内容,周五发布。如果提问是“此文作者是谁?”,通过比较 embeddings 向量,可以直观地看出文本块 1 跟这个问题的关联度最高,文本块 3 次之。最后发送给 GPT API 的问题会类似于“此文作者是谁?从以下信息中获取答案:本文作者:越山。xxxx。《反脆弱》作者塔勒布xxxx。”这样大语言模型大概率能回答上这个问题。
2025-03-16