Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

测试大模型工具·

Answer

以下是关于测试大模型工具的相关内容:

使用 Coze IDE 创建插件

  • 网页搜索工具的元数据配置说明:
    • 名称:建议输入清晰易理解的名称,便于后续大语言模型搜索与使用工具。
    • 描述:用于记录当前工具的用途。
    • 启用:若工具未开发测试完成,建议先禁用;若需下线某一工具,可将其设置为禁用,或删除插件等。
    • 输入参数:准确、清晰易理解的参数名称等信息,可让大语言模型更准确使用工具。
    • 输出参数:准确、清晰易理解的参数名称等信息,可让大语言模型更准确使用工具。
  • 操作步骤:在页面右侧单击测试代码图标并输入所需参数,然后单击 Run 测试工具。若在元数据设置了输入参数,可单击自动生成图标,由 IDE 生成模拟数据,调整参数值即可进行测试。

获取字节火山 DeepSeek 系列 API 完整教程及使用方法

  • 可使用网页聊天和测试等方式。
  • 例如用“2024 年高考全国甲卷理科数学”压轴题测试火山引擎的 DeepSeek-R1 的速度,其推理速度比官方版本快,接口延迟低,回复迅速。

无需微调,仅用提示词工程就能让 LLM 获得 tool calling 的功能: 绝大多数小型本地开源大语言模型以及部分商用大模型接口不支持稳定的 tool calling 功能,现有的微调 LLM 解决方案会浪费大量时间和算力。本文提出仅使用提示词工程和精巧的代码设计,即可让 LLM 获得稳定的 tool calling 能力,使用多个不具备该功能的 LLM 作为测试模型,在多个工具调用任务上实验成功率为 100%,基于 comfyui 开发,适合无代码基础的人员复现和修改。

Content generated by AI large model, please carefully verify (powered by aily)

References

使用 Coze IDE 创建插件

以下是一个网页搜索工具的元数据,当Bot内添加了该工具后,模型会根据工具的元数据信息,在收到匹配的用户查询语句时,调用工具处理用户任务。例如,如果用户发送消息查询上海天气,Bot将会使用该工具响应用户。元数据配置说明:|配置项|描述||-|-||名称|工具名称。建议输入清晰易理解的名称,便于后续大语言模型搜索与使用工具。||描述|工具的描述信息,一般用于记录当前工具的用途。||启用|是否启用当前工具。使用说明:<br>如果工具未开发测试完成,建议先禁用该工具,只启用并发布已通过测试的工具。<br>如果需要下线某一工具,可将该工具设置为禁用,并再次发布插件。<br>如果插件中只有一个工具,则不支持禁用该工具。如需下线该工具,您可以选择直接删除该插件,或者创建另一个工具并完成开发测试后,再禁用该工具,最后发布插件。||输入参数|当前工具对应接口的输入参数信息。准确、清晰易理解的参数名称、描述等信息,可以让大语言模型更准确的使用工具。||输出参数|当前工具对应接口的输出参数信息。准确、清晰易理解的参数名称、描述等信息,可以让大语言模型更准确的使用工具。|1.在页面右侧单击测试代码图标并输入所需的参数,然后单击Run测试工具。如果您在元数据设置了输入参数,可单击自动生成图标,由IDE生成模拟数据,您只需要调整参数值即可进行测试。

获取字节火山DeepSeek系列 API完整教程,及使用方法,邀请可拿3000万tokens

既然已经部署完成,我们来使用一道“2024年高考全国甲卷理科数学”压轴题来测试一下R1的速度。面对这个复杂的推理问题,火山引擎的DeepSeek-R1的推理速度,足足比官方版本的快了“3分34秒”。在问题提出后,能够明显感受到火山引擎接口的延迟非常低,发出去问题的一瞬间就得到了回复。(因耗时长,剪辑时做了60倍加速)看着满屏流畅的推理日志,突然有些恍惚。曾几何时,大模型于开发者而言是隔着API的神秘黑箱,是算力成本与响应速度的艰难取舍,两年前第一次调用GPT-3.5接口时,盯着计费面板上跳动的数字,手心微微发汗——每千Token近4毛钱的价格,让每次点击回车键都像在投掷硬币。那时的我们不会想到,大模型赛道的狂奔会如此剧烈:从硅谷到北京,无数工程师用成山的GPU与代码重构了技术普惠的刻度。恍然惊觉这两年的光阴里,模型厂商们竟把算力的“黄金”炼成了“氧气”。这是AI浪潮中的动人叙事:当技术突破撞上工程化巨浪,曾经实验室里的星辰开始照亮普通开发者的键盘。或许,当你看着教程,敲下第一个API调用时也会像我一样听见时代齿轮与代码共鸣的清脆声响。

无需微调,仅用提示词工程就能让 LLM 获得 tool calling 的功能

大家好,我是一个开源项目作者ailm。目前,绝大多数小型本地开源大语言模型以及部分商用大模型接口都不支持稳定的tool calling功能。而现有的解决方案是微调LLM,这导致大量的时间和算力被浪费。本文提出一种仅使用提示词工程和一些精巧的代码设计,即可让LLM获得稳定的tool calling能力。本文使用多个不具备tool calling能力的LLM作为测试模型,在多个工具调用任务上进行实验,成功率为100%。本文所有工作是基于comfyui开发,适合完全没有代码基础的小伙伴们复现并且按自己的想法修改我的工作。

Others are asking
什么样的数据集适合测试大语言模型?
以下是一些适合测试大语言模型的数据集: Guanaco:地址为,是一个使用 SelfInstruct 的主要包含中日英德的多语言指令微调数据集。 chatgptcorpus:地址为,开源了由 ChatGPT3.5 生成的 300 万自问自答数据,包括多个领域,可用于训练大模型。 SmileConv:地址为,数据集通过 ChatGPT 改写真实的心理互助 QA 为多轮的心理健康支持多轮对话,含有 56k 个多轮对话,其对话主题、词汇和篇章语义更加丰富多样,更符合长程多轮对话的应用场景。 用于评估大语言模型的框架和基准有: GAOKAOBench:地址为,是以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架,收集了 2010 2022 年全国高考卷的题目,包括 1781 道客观题和 1030 道主观题。 AGIEval:地址为,是由微软发布的新型基准测试,选取 20 种面向普通人类考生的官方、公开、高标准往常和资格考试,包括普通大学入学考试(中国高考和美国 SAT 考试)、法学入学考试、数学竞赛、律师资格考试、国家公务员考试等。 Xiezhi:地址为,是由复旦大学发布的一个综合的、多学科的、能够自动更新的领域知识评估 Benchmark,包含 13 个学科门类,24 万道学科题目,516 个具体学科,249587 道题目。 此外,在多语言能力评测方面,还使用了以下数据集: MMMLU:来自 Okapi 的多语言常识理解数据集,在阿、德、西、法、意、荷、俄、乌、越、中这几个子集进行测试。 MGSM:包含德、英、西、法、日、俄、泰、中和孟在内的数学评测。针对人工评测,使用内部评估集比较了 Qwen272BInstruct 与 GPT3.5、GPT4 和 Claude3Opus,该评测集包括 10 种语言:ar(阿拉伯语)、es(西班牙语)、fr(法语)、ko(韩语)、th(泰语)、vi(越南语)、pt(葡萄牙语)、id(印度尼西亚语)、ja(日语)和 ru(俄语)。
2025-03-17
如何通过AI进行软件测试?有什么好用的AI工具,以及详细的步骤是什么?
以下是关于如何通过 AI 进行软件测试以及相关好用的 AI 工具和详细步骤的介绍: 一、基于规则的测试生成 1. 测试用例生成工具 Randoop:基于代码路径和规则生成测试用例,适用于 Java 应用程序。 Pex:微软开发的智能测试生成工具,自动生成高覆盖率的单元测试,适用于.NET 应用。 2. 模式识别 Clang Static Analyzer:利用静态分析技术识别代码模式和潜在缺陷,生成相应的测试用例。 Infer:Facebook 开发的静态分析工具,自动生成测试用例,帮助发现和修复潜在错误。 二、基于机器学习的测试生成 1. 深度学习模型 DeepTest:利用深度学习模型生成自动驾驶系统的测试用例,模拟不同驾驶场景,评估系统性能。 DiffTest:基于对抗生成网络(GAN)生成测试用例,检测系统的脆弱性。 2. 强化学习 RLTest:利用强化学习生成测试用例,通过与环境交互学习最优测试策略,提高测试效率和覆盖率。 A3C:基于强化学习的测试生成工具,通过策略梯度方法生成高质量测试用例。 三、基于自然语言处理(NLP)的测试生成 1. 文档驱动测试生成 Testim:AI 驱动的测试平台,通过分析文档和用户故事自动生成测试用例,减少人工编写时间。 Test.ai:利用 NLP 技术从需求文档中提取测试用例,确保测试覆盖业务需求。 2. 自动化测试脚本生成 Selenium IDE + NLP:结合 NLP 技术扩展 Selenium IDE,从自然语言描述中生成自动化测试脚本。 Cucumber:使用 Gherkin 语言编写的行为驱动开发(BDD)框架,通过解析自然语言描述生成测试用例。 四、基于模型的测试生成 1. 状态模型 GraphWalker:基于状态模型生成测试用例,适用于复杂系统的行为测试。 Spec Explorer:微软开发的模型驱动测试工具,通过探索状态模型生成测试用例。 2. 场景模拟 Modelbased Testing :基于系统模型自动生成测试用例,覆盖各种可能的操作场景和状态转换。 Tosca Testsuite:基于模型的测试工具,自动生成和执行测试用例,适用于复杂应用的端到端测试。 五、实践中的应用示例 1. Web 应用测试:使用 Testim 分析用户行为和日志数据,自动生成高覆盖率的测试用例,检测不同浏览器和设备上的兼容性问题。 2. 移动应用测试:利用 Test.ai 从需求文档中提取测试用例,确保覆盖关键功能和用户路径,提高测试效率和质量。 3. 复杂系统测试:采用 GraphWalker 基于系统状态模型生成测试用例,确保覆盖所有可能的状态和操作场景,检测系统的边界情况和异常处理能力。 六、好用的 AI 工具 Testim:AI 驱动的自动化测试平台,生成和管理测试用例。 Test.ai:基于 NLP 技术的测试用例生成工具,适用于移动应用和 Web 应用。 DeepTest:利用深度学习生成自动驾驶系统测试用例。 GraphWalker:基于状态模型生成测试用例,适用于复杂系统的行为测试。 Pex:微软开发的智能测试生成工具,自动生成高覆盖率的单元测试。 希望以上内容对您有所帮助。
2025-03-16
帮我找一点生成小红书的 Ai 提示词测试一下看看
以下是为您提供的一些生成小红书的 AI 提示词示例: 1. 五津:DeepSeek+扣子:1 分钟生成小红书爆款单词视频 角色:您是一个专业的单词生成助手,擅长围绕各种主题挖掘相关英语单词,为用户提供精准且实用的单词、中文、美式音标内容。 技能:当用户输入主题{{zhuti}}时,分析主题内涵,运用专业知识,输出{{shuliang}}个与该主题紧密关联的英语单词、中文翻译、美式音标,将该单词用于一句英文中(不超过 15 个单词),并将这句英文句子翻译成中文句子,并以数组形式呈现。 限制:仅围绕用户输入主题输出相关英语单词、中文翻译、美式音标,不涉及其他领域内容。输出必须为符合要求的数组形式,英文单词对应变量 yingwen,中文翻译对应变量 zhongwen,美式音标对应变量 yinbiao,英文句子对应变量 juzi_yingwen,中文句子翻译对应变量 juzi_zhongwen,不得有其他格式偏差。 2. 夙愿:用 AI 化繁为简,解决复杂问题的指南 提示词链:一个月前,通过逐步构建和不断优化提示词,最终迭代出一个小红书视频标题生成助手。收集高质量的标题示例作为后续分析的基础(纯人类),询问 GPT 分析标题特点的维度(人机协同),让 GPT 根据这些维度分析标题特点(人机协同),编写提示词(纯人类),测试提示词(人机协同),迭代提示词(人机协同)。 3. 一泽 Eze:样例驱动的渐进式引导法——利用 AI 高效设计提示词,生成预期内容 引言:一个精彩的 Prompt 是驱动 AI Agent 稳定运作的核心。例如常见的“小红书爆文生成 AI”提示词,包含精确、巧妙的提示。高质量的 Prompt 极度依赖用户通过逻辑思考,从知识经验中抽象表达出关键方法与要求。
2025-03-14
1、Puzzle 选择一个你(们)感兴趣的社会问题或者现象。 “赛博信仰”指在网络环境下衍生的一系列超现实、寄托心理期许的新兴文化现象。这种现象反映了人们在数字化时代中对精神寄托、心理安慰和未来预测的需求。赛博信仰不仅是一种文化现象,也反映了现代社会中人们对科技、信仰和现实之间关系的重新思考。 2、Facts 关于这个问题/现象,都有哪些基本事实? 比如有人购买电子形式的马克思、爱因斯坦的脑子,象征着对智慧的渴望;借助塔罗测试程序、deepseek算命等AI工具,尝试预知命运;夸赞鹿童、转发锦鲤
关于“赛博信仰”这一现象,目前所了解到的基本事实包括:有人购买电子形式的马克思、爱因斯坦的脑子以象征对智慧的渴望;借助塔罗测试程序、deepseek 算命等 AI 工具尝试预知命运;夸赞鹿童、转发锦鲤等。但目前掌握的相关事实相对有限,还需要进一步的研究和观察来更全面地了解这一现象。
2025-03-13
测试集
以下是关于测试集的相关信息: Meta 开源视频生成模型的测试集包括 Movie Gen Video Bench 和 Audio Bench。Movie Gen Video Bench 是目前规模最大、最全面的视频生成评估基准,包含 1000 多个提示词,涵盖多种概念并有不同运动幅度的测试。Movie Gen Audio Bench 用于评估视频音效生成及视频配音能力,包含 527 个视频及相应提示。 2023 年度中文大模型基准测评采用多维度、多视角的综合性测评方案,由多轮开放问题 SuperCLUEOPEN 和三大能力客观题 SuperCLUEOPT 两部分测评结果组成。评测集共 4273 题,其中 1060 道多轮简答题(OPEN),3213 道客观选择题(OPT)。测评采用待评估模型与基准模型对比,由超级模型评判,计算胜和率作为 OPEN 得分,最终 OPEN 分=0.7OPEN 分+0.3OPT 分,并经过人工校验。 在嵌入(Embeddings)相关内容中,通过对用户和产品的所有评论进行平均获得嵌入,并在单独的测试集上评估其有用性,发现甚至在用户收到产品之前,就可以比随机预测更好地预测用户是否喜欢该产品。此外,嵌入在聚类和文本搜索任务中也有应用。
2025-03-12
我想用ai对一个网站进行渗透测试 可以用哪些工具
以下是一些可用于对网站进行渗透测试的 AI 相关工具和信息: GPT4 能够在设计用于数字取证和渗透测试的 Linux 发行版上执行命令,并能扫描网络、确定目标主机、尝试常见密码等操作,但需要注意其使用应在合法范围内。 XBOW 正在开发的 AI 渗透测试员,其性能可与优秀的人类渗透测试员相媲美。 对于学习网络安全知识和技术,可参考以下合法途径: 阅读相关的书籍、论文、博客等。 参加专业的网络安全培训课程。 在合法的实验室环境下进行网络安全实验,如搭建虚拟网络环境、进行漏洞扫描和渗透测试等。 加入网络安全社区,与其他爱好者交流经验和技术。 同时,请确保所有的测试和实践都在合法和道德的范围内进行。
2025-03-10
哪个APP或大模型写公文比较好
目前在写公文方面,以下是一些相关的信息: 大模型工具推荐:chatGPT 4.0、kimichat、智谱清言 4。 飞书文档带有文本纠错功能。 但对于专门用于写公文的 APP ,上述内容中未明确提及。
2025-03-21
Stable Diffusion有哪些模型
Stable Diffusion 模型包括以下几种: 1. Stable Video Diffusion 模型: 避坑指南:直接使用百度网盘准备好的资源可规避大部分坑;若报显存溢出问题,可调低帧数或增加 novram 启动参数;云部署实战部分,基础依赖模型权重有两个 models–laion–CLIPViTH14laion2Bs32Bb79K 和 ViTL14.pt,需放到指定路径下。 总结:Sora 发布后,之前的视频生成模型略显逊色,Stable Video Diffusion 作为开源项目可自由创作无需充值,有独特优势。其生成的视频画质清晰、过渡自然,虽目前只能生成最多 4 秒视频,但在不断迭代。 2. 潜在扩散模型(Latent Diffusion Models): CLIP:将用户输入的 Prompt 文本转化成 text embedding。 核心组件:VAE EncoderDecoder、UNET(进行迭代降噪,在文本引导下进行多轮预测)。 存放路径:ComfyUI 存放路径为 models/checkpoints/。 基础预训练模型:SD1.5、SDXL。 训练方法:DreamBooth(by Google)。 格式:.pt、.safetensor。 融合模型:checkpoint+checkpoint、Lora+Lora、checkpoint+Lora。 模型自带已适配的 VAE。 微调模型:概念学习、Checkpoint。 3. 不同版本模型对比: Stable Diffusion 2.0 系列模型。 Stable Diffusion 2.1 系列模型。 Stable Diffusion 1.6 系列模型。 SD Turbo 模型。 4. 性能优化方面: 使用 TF32 精度加速 SD 模型训练与推理。 使用 FP16 半精度加速。 对注意力模块进行切片。 对 VAE 进行切片。 大图像切块。 CPU<>GPU 切换。 变换 Memory Format。 使用 xFormers 加速 SD 模型训练与推理。 使用 tomesd 加速 SD 模型推理。 使用 torch.compile 加速 SD 推理速度。 此外,还有关于 Stable Diffusion 训练数据集制作、微调训练、基于其训练 LoRA 模型、训练结果测试评估等方面的内容。
2025-03-21
我现在是学了一段时间的comfyui+flux,接下来准备学Python开发comfyui节点、对接模型,这样学下去方向有没有问题呢
您学习 ComfyUI 和 Flux 一段时间后准备学习 Python 开发 ComfyUI 节点并对接模型,这个方向是可行的。以下是一些相关的知识和要点供您参考: 工作流方面: 工作流节点可直接拖动单个节点到任意位置,也可按住 Control 键并用鼠标左键滑框选中多个节点,再按 Shift 键一起拖动。 选中节点后右键新建组,可修改组名、颜色等,组被覆盖时可直接拖动组。 选中节点后右键选择对齐方式,如顶部对齐、左边对齐等。 第三方节点的安装方式包括在 customer NODE manager 中安装、在 GitHub 上复制链接安装、通过终端输入指令安装、在秋叶启动器的版本管理中安装。 可通过 group by Parser 节点控制组,也可通过按住节点按 control b 跳过或按 control m 终止执行。 模型方面: 噪声强度由种子调节,种子固定噪声分布方式,噪声与 CLIP 无关,增大噪声设置值会增强模型对图片重绘的程度。 模型版本的提示词差异:1.5 以 tag 为主,XL 论文称以自然语言为主,但实际使用中因模型微调情况可能仍需用 tag。 Flux 模型有时生成黑图,可能有修复方案,需自行查询。图像生成结果为空,可能是 VAE 编码器与大模型未连接,调整连接后问题解决。 安装方面: 自动打标 joy_caption 副本的节点安装地址为 D:\\ComfyUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes。 安装步骤包括:(Comfyui evn python.exe)python m pip install rrequirements.txt 或点击 install_req.bat,注意 transformers 版本不能太低。 下载模型或者运行 ComfyUI 自动下载模型到合适文件夹,如从 https://huggingface.co/unsloth/MetaLlama3.18Bbnb4bit 下载并放到 Models/LLM/MetaLlama3.18Bbnb4bit 文件夹内。 新版的 PuLID 解决了模型污染的问题,使用新版的节点需要禁用或者删除之前的 PuLID 节点,不然可能会有冲突问题。模型放在 ComfyUI\\models\\pulid 文件夹里面,注意用新版的。 如果使用 PuLID,还需要安装 EVA CLIP 等模型。
2025-03-21
如何将coze工作流大模型输出内容变成格式化的文本
要将 Coze 工作流大模型输出内容变成格式化的文本,可以按照以下步骤进行: 1. 大模型批量总结文章内容: 模型选择:默认的豆包 32k 通常够用,若担心上下文长度不足,可选择更大的模型,如 kimi128k。 配置参数:选择批处理,批处理输入参数包括第 9 步中读取的文章内容正文、第 8 步代码处理后的 url 链接和标题。下方的输入参数有四个,分别是 content 正文、title 标题、url 文章链接、author 作者。提示词输入相关内容,将这四部分一起送给大模型进行总结,最终拼接成 markdown 格式输出。 2. 汇总格式化最终输出内容:使用代码节点,将大模型输出的内容进行最终输出的格式化。参数配置方面,输入选择上一步输出的 outputList,点击「在 IDE 中编辑」,选择『Python』,输入相应代码,配置输出项为 result。 3. 公众号总结推送到微信:此节点根据 Server 酱的 API 文档,使用自建插件。主要功能是把上一步格式化好的内容推送到用户的微信上。输出配置包括:title 为汇总公众号总结页面的标题,参数值选择「输入」并起名;desp 为页面主体内容,选择上一步最终输出内容;key 引用开始节点的 key。 在循环节点方面: 1. 关于如何将文本内容转为数组:循环节点中的循环数组参数必须引用上游节点的输出参数,且参数类型为数组类型。大模型、代码等节点均支持数组格式的输出参数。若只能拿到文本格式的内容,可通过代码节点将其转为数组格式。例如在长文总结场景下,使用 LinkReaderPlugin 插件提取 PDF 内容,其输出参数 pdf_content 为 String 类型,可通过代码节点转为数组类型。还可在大模型节点通过提示词和示例让大模型直接输出数组,或使用文本处理(文本分隔)。 2. 关于如何结束循环:循环节点模式不同,结束循环的方式不同。使用数组循环时,循环节点依次对数组中的元素执行处理后自动结束并跳出循环。指定循环次数时,循环节点执行指定次数后会自动终止循环。无限循环可通过终止循环节点停止循环,条件判断节点判断某个条件成立时,流转到终止循环节点,自动跳出循环。 3. 关于如何在循环体中插入节点:选中循环体时,才能向循环体中添加新节点,或拖入新节点至循环体画布。不支持将循环体外部的节点拖动至循环体内,循环体中的节点也不可移动到循环体之外。 在大模型节点配置方面: 输入与输出的变量名称可自定义,按习惯设定以便识别字段含义。 输入:直接引用开始节点中用户输入的{{BOT_USER_INPUT}}。 提示词区域:需要两个双花括号写明需要使用的输入项参数名,如{{input}}。 输出:有几项子内容需要生成,就设置几项。为让大模型理解最终输出的形式要求,在用户提示词最后添加输出格式段落,描述每个变量名称、输出内容、输出格式,且务必注意前后完全一致,否则会输出失败。
2025-03-21
对于NL2SQL,主要是让大模型生成sql语句,如何对提示词进行优化
目前知识库中没有关于 NL2SQL 提示词优化的相关内容。但一般来说,优化 NL2SQL 的提示词可以从以下几个方面考虑: 1. 明确输入描述的准确性和完整性,避免模糊和歧义。 2. 提供具体的示例和上下文信息,帮助模型更好地理解需求。 3. 强调关键的业务逻辑和约束条件。 4. 尝试使用不同的表述方式和词汇,以找到最适合模型理解的方式。 您可以参考相关的学术研究和实践经验,不断尝试和改进提示词,以获得更准确的 SQL 语句生成效果。
2025-03-21
3D模型做数字人
以下是一些关于用 3D 模型做数字人的相关信息: 工具汇总: 1. MakeACharacter:一键生成 3D 数字人,可自定义面部特征,生成逼真 3D 角色。基于真实人类扫描数据,使用 Unreal Engine 渲染。支持中英文提示,兼容多个行业应用。链接:https://x.com/xiaohuggg/status/1743986486780076279?s=20 2. Rodin Gen1:3D 原生生成模型,拥有 1.5B 参数,可实现 3Dto3D 生成。生成 3D 模型及物理基础渲染材质。支持 3D LoRA 技术,类似于 Stable Diffusion。链接:https://x.com/xiaohuggg/status/1743638052097184102?s=20 3. Skybox AI 0.9 版本更新:可以从文本提示或草图生成 360 度 3D 世界。使用 NeRF 技术,增强图像的空间深度和真实感。提供不同分辨率的 3D 网格下载。链接:https://x.com/xiaohuggg/status/1739926702158225859?s=20 4. 扫描物体生成 3D 模型:使用 APP 扫描物体,完成 3D 全貌捕获。创建 AR QR 码,展示物体于任何地点。苹果新品官网展示中应用此技术。链接:https://x.com/xiaohuggg/status/1739259052448944139?s=20 构建高质量的 AI 数字人的躯壳方式: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢。代表是 Live2D Cubism。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高。代表是 UE、Unity,虚幻引擎 MetaHuman 等。个人学习在电脑配置和学习难度上有一定门槛。 3. AIGC:虽然省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持 ID 一致性,帧与帧的连贯性上会让人有虚假的感觉。典型的项目有 wav2lip等。AIGC 还有一个方向是直接生成 2d/3d 引擎的模型,但该方向还在探索中。 摊位信息: 1. AI 3D 打印纹身印章:通过 AI 将图片转绘成简约线条插画风格,然后现场 3D 打印出来,最终交付定制化的纹身印章产品。具体流程:适用 comfyui 工作流生成+输出线稿素材;将线稿生成模型文件;输入 3D 打印机,输出定制图案模型(预计打印时间 35 分钟)。印章图案为软性材料,印章颜料为可水洗安全材料,可另选半永久植物染料。摊位区域:E,摊位编号:69,摊位类型:3D 印章。 2. AI 未病预测细胞仪:通过发送脉冲信号跟神经中枢互动,获取身体各器官的细胞信号,和背后 1500 万人的健康细胞库进行比对,结合医学算法,输出人体营养和各器官的健康度。摊位区域:D,摊位编号:7,摊位类型:产品宣传。 3. AI 研学及 AI 家长课程:摊位区域:E,摊位编号:70,摊位类型:剧本游体验。 4. AI 手办定制+AI 写真照片:摊位区域:E,摊位编号:71,摊位类型:手办。 5. 工作流 MetaGPT,游戏:摊位区域:E,摊位编号:72,摊位类型:游戏体验。 6. 数字人与 AI 硬件(情趣玩具)结合,可与 AI 谈恋爱、玩耍。摊位区域:E,摊位编号:73,摊位类型:AI 相框+成人陪伴产品宣传。
2025-03-21
有哪些比较好用的ai生成海报工具,免费的
以下是一些比较好用的免费 AI 生成海报工具: 1. Canva(可画):https://www.canva.cn/ 是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,用户通过简单拖放操作创建海报,其 AI 功能可帮助选择合适颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能帮助用户快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能。 此外,美图 WHEe 也推出了中文 AI 海报生成工具,支持文字可编辑图层,用户可拖动文字位置、更改字体并控制排版,内置模板,操作简单,适合小白与专业用户,目前仍在内测中,支持体验申请。 网址:https://oc.meitu.com/whee/5924/index.html 丨 官网:http://whee.com
2025-03-21
自动做网页的AI工具
以下是一些自动做网页的 AI 工具: 1. Wix ADI 网址:https://www.wix.com/ 特点:基于用户提供的信息,自动生成定制化网站;提供多个设计选项和布局,用户可进一步调整和自定义;集成了 SEO 工具和分析功能,帮助优化网站表现。 2. Bookmark 网址:https://www.bookmark.com/ 特点:AIDA通过询问用户几个简单问题,快速生成网站;提供直观的拖放编辑器,用户可轻松自定义网站内容和布局;包括多种行业模板和自动化营销工具。 3. Firedrop 网址:https://firedrop.ai/ 特点:Sacha 是 Firedrop 的 AI 设计助手,可根据用户指示创建和修改网站设计;提供实时编辑和预览功能,帮助用户随时查看网站效果;包含多种现代设计风格和自定义选项。 4. The Grid 网址:https://thegrid.io/ 特点:Molly 是 The Grid 的 AI 设计助手,可自动调整网站的设计和布局;基于内容和用户互动进行优化,提供个性化的网站设计体验;支持多种内容类型,包括博客、商店和画廊等。 5. Zyro 网址:https://zyro.com/ 特点:使用 AI 生成网站内容,包括文本、图像和布局建议;提供 AI 驱动的品牌和标志生成器,帮助创建独特的品牌形象;包含 SEO 和营销工具,帮助提升网站可见性和流量。 6. 10Web 网址:https://10web.io/ 特点:基于 AI 的 WordPress 网站构建工具,可自动生成网站布局和设计;提供一键迁移功能,将现有网站迁移到 10Web 平台;集成的 AI 驱动 SEO 分析和优化工具。 7. Jimdo Dolphin 网址:https://www.jimdo.com/ 特点:Dolphin 是 Jimdo 的 AI 网站构建器,通过询问用户问题来定制网站;提供自动生成的内容和图像,帮助快速启动网站;包含电子商务功能,适合小型企业和在线商店。 8. Site123 网址:https://www.site123.com/ 特点:简单易用的 AI 网站构建工具,适合初学者;提供多种设计模板和布局,用户可快速创建专业网站;包括内置的 SEO 和分析工具,帮助优化网站表现。 选择合适的 AI 网站制作工具时,可以考虑以下因素: 1. 目标和需求:确定网站目标(如个人博客、商业网站、在线商店)和功能需求。 2. 预算:有些工具提供免费计划或试用版,但高级功能可能需要付费订阅。 3. 易用性:选择符合自身技术水平的工具,确保能够轻松使用和管理网站。 4. 自定义选项:检查工具是否提供足够的自定义选项,以满足设计和功能需求。 5. 支持和资源:查看是否有足够的客户支持和学习资源(如教程、社区论坛),帮助解决问题。
2025-03-21
什么工具可以帮我做数字人
以下是一些可以帮助您制作数字人的工具: 1. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色。它运用深度学习算法生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等领域。 2. Synthesia:这是一个 AI 视频制作平台,允许用户创建虚拟角色并实现语音和口型同步。它支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:这是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意对生成内容的版权和伦理责任。 以下是使用剪映制作数字人的步骤: 1. 生成数字人:在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”,软件会根据提供的内容生成对应音视频并添加到当前视频中。左下角会提示渲染完成时间,之后可点击预览按钮查看效果。 2. 增加背景图片:删除先前导入的文本内容,为视频增加背景图片。点击左上角“媒体”菜单并点击“导入”按钮,选择本地图片上传。将图片添加到视频轨道上(会覆盖数字人),可通过拖拽轨道右侧竖线使图片在整个视频播放时都显示。
2025-03-21
提示词反推工具
以下是关于提示词反推工具的相关信息: LayerStyle 副本中的 LayerUtility 部分: PromptTagger:根据图片反推提示词,可以设置替换词。使用 Google Gemini API 作为后端服务,需在申请 API key,并填到插件根目录下的 api_key.ini 文件中(默认名字是 api_key.ini.example,初次使用需将文件后缀改为.ini,用文本编辑软件打开,在 google_api_key=后面填入 API key 并保存)。节点选项包括:api(目前只有"geminiprovision"一个选项)、token_limit(生成提示词的最大 token 限制)、exclude_word(需要排除的关键词)、replace_with_word(替换 exclude_word 的关键词)。 PromptEmbellish:输入简单的提示词,输出经过润色的提示词,支持输入图片作为参考。使用 Google Gemini API 作为后端服务,同样需按上述方式处理 API key。节点选项包括:image(可选项,输入图像作为提示词参考)、api(目前只有"googlegemini"一个选项)、token_limit(生成提示词的最大 token 限制)、discribe(在这里输入简单的描述,支持中文)。 SD 中的相关内容: 在图生图功能中,除了文本提词框外还有图片框输入口。随便照一张照片拖入后,文本输入框旁边有两个反推提示词的按钮:CLIP 可以通过图片反推出完整含义的句子;DeepBooru 可以反推出关键词组。但两种反推方式生成的提示词可能存在瑕疵,需要手动补充信息。写好提示词后,调整宽度和高度使红框匹配图片,同时注意两个重要参数:提示词相关性和重绘幅度。 其他: ImageScaleByAspectRatioV2 是 ImageScaleByAspectRatio 的 V2 升级版,在其基础上做了改变,节点选项包括 scale_to_side(允许按长边、短边、宽度、高度或总像素指定尺寸缩放)、scale_to_length(这里的数值作为 scale_to_side 指定边的长度,或者总像素数量)。 QWenImage2Prompt:根据图片反推提示词,是 ComfyUI_VLM_nodes 中 UFormGen2 Qwen Node 节点的重新封装。需从下载模型到 ComfyUI/models/LLavacheckpoints/files_for_uform_gen2_qwen 文件夹。节点选项包括 question(对 UFormGenQWen 模型的提示词)。
2025-03-21
Stable Diffusion、MidJourney、DALL·E 这些生成式AI工具有什么区别
Stable Diffusion、Midjourney 和 DALL·E 这三个生成式 AI 工具主要有以下区别: 1. 开源性:Stable Diffusion 是开源的,用户可以在任何高端计算机上运行。 2. 学习曲线:Midjourney 的学习曲线较低,只需键入特定的提示就能得到较好的结果。 3. 图像质量:Midjourney 被认为是 2023 年中期图像质量最好的系统。 4. 应用场景:Stable Diffusion 特别适合将 AI 与来自其他源的图像结合;Adobe Firefly 内置在各种 Adobe 产品中,但在质量方面落后于 DALL·E 和 Midjourney。 5. 训练数据:这些工具都是使用大量的内容数据集进行训练的,例如 Stable Diffusion 是在从网络上抓取的超过 50 亿的图像/标题对上进行训练的。 6. 所属公司:DALL·E 来自 OpenAI。 在使用方面: 1. Stable Diffusion 开始使用需要付出努力,因为要学会正确制作提示,但一旦掌握,能产生很好的结果。 2. DALL·E 已纳入 Bing(需使用创意模式)和 Bing 图像创建器,系统可靠,但图像质量比 Midjourney 差。 3. Midjourney 需要 Discord,使用时需键入特定格式的提示。
2025-03-20
,使用国内的 ai 绘画工具,怎么做文章中的插图,或者四格图?
以下是使用国内的 AI 绘画工具制作文章插图或四格图的一些方法和示例: 1. 像素风格插画: 关键词:3D,16bit pixel art,Super mario,Minecraft,LEGO,pixel style,Blocksplicing,girl with long hair,Alice in Wonderland,garden background,8K–uplight–ar 9:16–v 5 生成的图片示例:像素女孩插画 2. 手机壁纸插画: 关键词:mobile wallpaper illustrations,four seasons,natural landscapes,minimalist illustrations,line illustrations–ar 9:16–niji 生成的图片示例:手机壁纸 3. 新海诚风格插画: 关键词:Makoto Shinkai animation style,a girl,4K–ar 9:16–niji 生成的图片示例:新海诚动漫海报 4. 国潮插画: 关键词:Make posters of James Jean,white deer,auspicious clouds,birds,distant mountains,Chinese ChinaChic style,colorful,light color,gradient color–ar 9:16 生成的图片示例:国潮白鹿插画 此外,在使用 AI 绘画工具时,您还可以参考以下提示: 对于不同的需求和风格,精心设计和选择合适的关键词。 不断尝试和调整关键词,以获得更满意的绘画效果。 需要注意的是,不同的国内 AI 绘画工具可能在功能和效果上有所差异,您可以根据实际情况进行选择和探索。
2025-03-20