Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

Cursor什么添加模型

Answer

在 Cursor 中添加模型的方法如下:

  1. 使用光标聊天、Ctrl/⌘K 和终端 Ctrl/⌘K,您可以轻松地在您选择的不同模型之间切换。
  2. 在 AI 输入框下方,您将看到一个下拉列表,允许您选择要使用的模型。默认情况下,Cursor 已准备好使用以下模型:
    • GPT-4o
    • GPT-4
    • Claude 3.5 Sonnet
    • cursor-small:cursor-small 是 Cursor 的自定义模型,它不如 GPT-4 智能,但速度更快,用户可以无限制地访问它。
  3. 您可以在 Cursor Settings>Models>Model Names 下添加其他模型。

此外,有人通过接入更多模型如 Qwen2.5-Coder、Llama3.3、deepseek v3、gemini-2.0-flash 等对 Cursor 进行配置,但接入再多的模型也无法完全填平 Cursor 免费版和 Cursor Pro 的差距。

Content generated by AI large model, please carefully verify (powered by aily)

References

Models 模型

With Cursor Chat,Ctrl/⌘K,and Terminal Ctrl/⌘K,you can easily switch between different models of your choice.使用光标聊天、Ctrl/⌘K和终端Ctrl/⌘K,您可以轻松地在您选择的不同模型之间切换。[heading3][heading3]Model Dropdown模型下拉列表[content]Underneath the AI input box,you will see a dropdown that allows you to select the model you want to use.By default,Cursor has these models ready to use:在AI输入框下方,您将看到一个下拉列表,允许您选择要使用的模型。默认情况下,Cursor已准备好使用这些模型:[GPT-4o](https://openai.com/index/hello-gpt-4o/)[](https://openai.com/index/hello-gpt-4o/)[GPT-4o](https://openai.com/index/hello-gpt-4o/)[GPT-4](https://openai.com/index/gpt-4/)[](https://openai.com/index/gpt-4/)[GPT-4](https://openai.com/index/gpt-4/)[](https://openai.com/index/gpt-4/)[Claude 3.5 Sonnet](https://www.anthropic.com/news/claude-3-5-sonnet)cursor-smallcursor-small is Cursor’s custom model that isn’t as smart as GPT-4,but is faster and users have unlimited access to it.cursor-small是Cursor的自定义模型,它不如GPT-4智能,但速度更快,用户可以无限制地访问它。You can add additional models under Cursor Settings>Models>Model Names.您可以在Cursor Settings>Models>Model Names下添加其他模型。[heading3]

4款插件2个API,我把Cursor“迭代”成了满血超频版程序员

【前情提要】这是一篇囤了快三个月,迭代了近5个版本的Cursor配置教程。从穷👻套餐2.0开始,我对Cursor的配置主要集中在接入更多模型:Qwen2.5-Coder、Llama3.3、deepseek v3、gemini-2.0-flash等,大部分是为了省API费用,但这其实没有完全挖掘出Cursor的潜力。接入再多的模型也无法完全填平Cursor免费版和Cursor Pro的差距,Agent、Yolo、Composer、Tab代码补全这些都被ban了。那肯定不行啊,而且Pro版本有着明晃晃的次数限制,并不是每个月都够用,这也就给了我持续优化Cursor配置的空间。所以,这次我收集到了3个插件,2大API,和N个新的提示语用法,给Cursor装配上Tab代码补全、AI Agent、全系大模型接入、开发进度管理、状态回滚等功能,堪称史诗级加强。Here we go![heading1]

TAB-Overview 概述

Cursor Tab is our native autocomplete feature.It’s a more powerful Copilot that suggests entire diffs with especially good memory.Cursor Tab是我们的原生自动完成功能。它是一个更强大的Copilot,可以建议具有特别好内存的整个差异。[cpp-full-video.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/VGuzbZ3t9owXZrxnhjacAiK9nZc?allow_redirect=1)Powered by a custom model,Cursor Tab can:Cursor Tab由自定义模型提供支持,可以:Suggest edits around your cursor,not just insertions of additional code.围绕光标建议编辑,而不仅仅是插入其他代码。Modify multiple lines at once.一次修改多行。Make suggestions based on your recent changes and linter errors.根据您最近的更改和linter错误提出建议。Free users receive 2000 suggestions at no cost.Pro and Business plans recieve unlimited suggestions.免费用户可免费获得2000条建议。Pro和Business计划会收到无限的建议。[heading3]

Others are asking
Cursor什么使用
Cursor 的使用方法如下: 1. 在 AI 输入框下方,有一个下拉列表,您可以通过它选择要使用的模型。默认情况下,Cursor 已准备好使用的模型包括:、cursorsmall 等。其中,cursorsmall 是 Cursor 的自定义模型,不如 GPT4 智能,但速度更快,用户可无限制访问。 2. 您还可以在 Cursor Settings>Models>Model Names 下添加其他模型。 此外,Cursor 具有以下特点和优势: 1. 旨在让您极其高效,是使用 AI 进行编码的最佳方式。 2. 能够从您的代码库中获得最佳答案,或参考特定文件或文档,一键使用模型中的代码。 3. 通过预测您的下一个编辑,让您轻松完成更改。 4. 集成了 claude3.5sonnet、GPT4 等多个模型,国内可以直接使用,支持多种语言,如 python、java、C等,能用于聊天、辅助写代码、辅助写作等功能,还支持在多平台安装。 5. 继承了 vscode 的强大功能和用户界面,几乎一模一样,深度集成了 gpt 等大模型,无缝融入了包括 IntelliJ IDEA、Visual Studio Code 和 GitHub 在内的主流开发环境和代码库中。 6. 体量小,启动快,编程效率高。 目前,Cursor 提供了 3 种订阅模式。
2025-01-14
cursor怎么用来写公众号
以下是使用 Cursor 写公众号的相关内容: 1. 下载 Cursor:访问 https://www.cursor.com/ 。 2. 注册账号,可用邮箱如 google、github、163、qq 邮箱,直接接受二维码登录。 3. 安装中文包插件。 4. 参考相关文章,如 。 5. 在设置中 Rule for AI 配置。 6. 按 ctrl/cmd+i 输入需求。 此外,还有以下案例供您参考: 张梦飞用 Cursor 做贪吃蛇游戏:在网页中玩贪吃蛇游戏,需清晰表达需求,如游戏界面、蛇的移动、食物、增长、死亡条件、得分、难度递增和游戏结束等规则和逻辑。 白九龄用 Cursor 做微信小程序:先形成项目需求文档,与 composer 沟通确认细节,再整理对应模块,进行功能设计模块文档设计,包括明确需求、UI 和技术(前后端实现途径)、测试用例等,然后根据模块任务写代码,并做好代码文件和更改记录。 雪梅 May 用 Cursor 把 AI 明信片包装到小程序:先搭出小程序框架,再注册微信小程序账号,在代码平台上做版本管理,并用 Cursor 优化用户界面。
2025-01-14
cursor 如何使用
Cursor 是一款 AI 代码编辑工具,以下是关于它的使用方法: 1. 访问 Cursor 官方网站(https://www.cursor.com/)下载并注册账号,您可以使用各种邮箱(如 google、github、163、qq 邮箱)登录,也可以直接接受二维码登录。 2. 安装中文包插件。 3. 在设置中进行 Rule for AI 配置。 4. 按 Ctrl/Cmd + i 输入需求,例如“帮我做一个贪吃蛇游戏,在网页中玩”,并清晰表达需求,包括游戏界面、蛇的移动、食物、增长、死亡条件、得分、难度递增和游戏结束等规则。 5. Cursor 具有以下特点和功能: 旨在让您极其高效,是使用 AI 进行编码的最佳方式。 能够从您的代码库中获得最佳答案,或参考特定文件或文档,一键使用模型中的代码。 通过预测您的下一个编辑,让您轻松完成更改。 Cursor 的 Apply 功能允许您快速集成聊天中的代码块建议到您的代码中。要应用代码块建议,可以按每个聊天代码块右上角的播放按钮。应用代码块后,您可以浏览差异并接受或拒绝更改,也可以点击聊天代码块右上角的“接受”或“拒绝”按钮,Ctrl/⌘Enter 键接受,Ctrl/⌘Backspace 键拒绝。 您还可以在 Cursor 官方的博客文章(https://cursor.com/blog/instantapply)中阅读更多关于如何构建即时申请的信息。
2025-01-10
cursor
以下是关于“cursor”的相关信息: Models 模型: 使用光标聊天、Ctrl/⌘K 和终端 Ctrl/⌘K,您可以轻松在您选择的不同模型之间切换。 在 AI 输入框下方有一个下拉列表,允许您选择要使用的模型。默认情况下,Cursor 已准备好使用以下模型: cursorsmall:这是 Cursor 的自定义模型,不如 GPT4 智能,但速度更快,用户可无限制访问。您可以在 Cursor Settings>Models>Model Names 下添加其他模型。 Ignore Files 忽略文件: 要忽略包含在 Cursor 功能(如中的文件,可以在项目的根目录中使用.cursorignore 文件,其工作方式与.gitignore 对 git 的工作方式相同。 .cursorignore 遵循.gitignore。如果已有.gitignore,默认情况下将忽略相关文件。若要忽略其他文件,可将它们添加到.cursorignore 文件中。 cursor 宣布融资 6000 万美元:我们组建了出色的初始团队,共同构建了包括 SOTA 次级编辑预测模型、数十亿个文件检索系统以及通过推测推理进行快速代码重写的系统。最后,我们从 Andreessen Horowitz、Thrive Capital、OpenAI、Jeff Dean、Noam Brown 以及 Stripe、Github、Ramp、Perplexity 和 OpenAI 的创始人以及许多其他出色的公司筹集了 6000 万美元的 A 轮融资。
2025-01-10
如何使用cursor??
以下是使用 Cursor 的步骤: 1. 下载 Cursor:访问 https://www.cursor.com/ 进行下载。 2. 注册账号:可以使用自己的邮箱(如 google、github、163、qq 邮箱)直接登录,接受二维码登录即可。 3. 安装中文包插件。 4. 参考相关链接: 5. 在设置中进行 Rule for AI 配置。 6. 按 ctrl/cmd+i 输入需求,例如:帮我做一个贪吃蛇游戏,在网页中玩。 如果要做一个贪吃蛇游戏,在网页中玩,需要清晰表达需求: 游戏界面:在矩形网格上进行,玩家控制蛇。 蛇的移动:持续移动,玩家通过按键控制方向(上、下、左、右)。 食物:界面随机出现食物,蛇吃到食物增长身体。 增长:每次吃到食物,蛇身增加一节。 死亡条件:撞墙或撞自己。 得分:吃到食物获分数,与食物数量成正比。 难度递增:蛇速度加快或食物出现频率降低。 游戏结束:蛇死亡时结束,显示得分。 关于 Cursor 的其他信息: Cursor 是使用 AI 进行编码的最佳方式,旨在让您极其高效。 能够从您的代码库中获得最佳答案,或参考特定文件或文档,一键使用模型中的代码。 当 Cursor 仅添加其他文本时,补全将显示为灰色文本。如果建议修改现有代码,会在当前行右侧显示为 diff 弹出窗口。 接受建议可按 Tab 键,拒绝建议可按 Esc 键。逐字部分接受建议按 Ctrl/⌘→。继续输入或按 Escape 可取消/隐藏建议。 每次击键或光标移动,Cursor 会尝试根据您的近期更改提出建议,但不总会显示。 Cursor 可以从当前行上方一行更改为下方两行。 要打开或关闭相关功能,可将鼠标悬停在应用程序右下角状态栏上的“光标选项卡”图标上。
2025-01-08
cursor
以下是关于“cursor”的相关信息: Models 模型: 使用光标聊天、Ctrl/⌘K 和终端 Ctrl/⌘K,您可以轻松在您选择的不同模型之间切换。 在 AI 输入框下方有下拉列表,允许您选择要使用的模型。默认情况下,Cursor 已准备好使用的模型有:、cursorsmall。其中,cursorsmall 是 Cursor 的自定义模型,不如 GPT4 智能,但速度更快,用户可无限制访问。您还可以在 Cursor Settings>Models>Model Names 下添加其他模型。 Ignore Files 忽略文件: 要忽略包含在 Cursor 某些功能(如)中的文件,可以在项目根目录中使用.cursorignore 文件,其工作方式与.gitignore 对 git 的工作方式相同。.cursorignore 遵循.gitignore,如果已有.gitignore,默认会忽略相关文件。若要忽略其他文件,可添加到.cursorignore 文件中。 cursor 宣布融资 6000 万美元:组建了出色的初始团队,共同构建了包括 SOTA 次级编辑预测模型、数十亿个文件检索系统以及通过推测推理进行快速代码重写的系统。最后,从 Andreessen Horowitz、Thrive Capital、OpenAI、Jeff Dean、Noam Brown 以及 Stripe、Github、Ramp、Perplexity 和 OpenAI 的创始人等筹集了 6000 万美元的 A 轮融资。
2025-01-08
帮我生成一个小程序,功能涉及“个人多名片管理”“可以通过扫描纸质名片生成电子名片、手动填写信息生成电子名片、关键字词ai智能生成名片”“支持手动编辑名片信息”“每个信息都可以通过ai生成及润色”“支持添加案例”“支持客户名片管理”“分享客户后,客户打开名片,支持交换信息并生成自己的名片”
要开发您所描述的涉及“个人多名片管理”等功能的小程序,以下是一些参考步骤和相关信息: 微信小程序开发基础: 1. 注册小程序:登录微信公众号首页,选取小程序,用新邮箱绑定注册。 2. 小程序信息填写:注册验证通过后,填写小程序信息和类目,名称可根据功能设定,头像可网上获取或利用工具生成。 3. 开发者工具下载:回到发布流程页面,点击“普通小程序开发者工具”,选择“微信开发者工具”,下载 windows 64 位版本。 4. 创建小程序项目:打开下载好的微信开发者工具,选择创建小程序。注意获取账号信息中的 id,选择不使用云服务,并选择 javascript 基础模板。 相关案例: 1. 有“使用 GPT 的视觉功能和 TTS API 处理和讲述视频”的案例,演示了如何通过视频使用 GPT 的视觉功能。 2. “开发:GLM 等大模型外接数据库”的案例,可调整 prompt,匹配不同知识库,让 LLM 扮演不同角色,如财务分析师、智能客服等。 目前没有与您需求完全匹配的直接可用的开发案例,但您可以参考上述基础步骤和相关案例的思路,结合您的具体需求进行开发。
2024-11-25
我有一张图像,我要如何用stable Diffusion给它添加噪音。我是一个小白,请给出详细的步骤,用webui来操作。
以下是使用 WebUI 为图像添加噪音的详细步骤: 1. 首先,了解 Stable Diffusion 的加噪原理。从数据集中选择一张干净样本,然后用 random 函数生成 0 3 共 4 种强度的噪声,在每次迭代中随机选择一种强度的噪声添加到干净图片上,完成图片的加噪流程。 2. 在训练过程中,对干净样本进行加噪处理,采用多次逐步增加噪声的方式,直至干净样本转变成为纯噪声。 3. 加噪过程中,每次增加的噪声量级可以不同,假设存在 5 种噪声量级,每次都可以选取一种量级的噪声,以增加噪声的多样性。 4. 与图片生成图片的过程相比,在预处理阶段,先把噪声添加到隐空间特征中。通过设置去噪强度(Denoising strength)控制加入噪音的量。如果去噪强度为 0 ,则不添加噪音;如果为 1 ,则添加最大数量的噪声,使潜像成为一个完整的随机张量。若将去噪强度设置为 1 ,就完全相当于文本转图像,因为初始潜像完全是随机的噪声。
2024-11-18
我有一张图像,我要如何用stable Diffusion给它添加噪音
要使用 Stable Diffusion 给一张图像添加噪音,以下是相关的原理和过程: 在 Stable Diffusion 中,与 GAN 等生成式模型一样,它学习拟合训练集分布,并能够生成与训练集分布相似的输出结果。但与 GAN 相比,SD 模型训练过程更稳定,且具备更强的泛化性能,这归功于其核心的前向扩散过程和反向扩散过程。 在前向扩散过程中,SD 模型持续对一张图像添加高斯噪声直至变成随机噪声矩阵。而在反向扩散过程中,SD 模型进行去噪声过程,将一个随机噪声矩阵逐渐去噪声直至生成一张图像。 Stable Diffusion 的整个训练过程在最高维度上可以看成是如何加噪声和如何去噪声的过程,并在针对噪声的“对抗与攻防”中学习到生成图片的能力。 其训练逻辑为: 1. 从数据集中随机选择一个训练样本。 2. 从 K 个噪声量级随机抽样一个 timestep t。 3. 将 timestep t 对应的高斯噪声添加到图片中。 4. 将加噪图片输入 UNet 中预测噪声。 5. 计算真实噪声和预测噪声的 L2 损失。 6. 计算梯度并更新 SD 模型参数。 在训练时,需要把加噪的数据集输入模型中,每一次迭代用 random 函数生成从强到弱各个强度的噪声,通常会生成 0 1000 一共 1001 种不同的噪声强度,通过 Time Embedding 嵌入到训练过程中。Time Embedding 由 Timesteps(时间步长)编码而来,引入 Timesteps 能够模拟一个随时间逐渐向图像加入噪声扰动的过程。每个 Timestep 代表一个噪声强度(较小的 Timestep 代表较弱的噪声扰动,而较大的 Timestep 代表较强的噪声扰动),通过多次增加噪声来逐渐改变干净图像的特征分布。 以下是一个简单的加噪声流程示例:首先从数据集中选择一张干净样本,然后再用 random 函数生成 0 3 一共 4 种强度的噪声,然后每次迭代中随机一种强度的噪声,增加到干净图片上,完成图片的加噪流程。 在训练过程中,首先对干净样本进行加噪处理,采用多次逐步增加噪声的方式,直至干净样本转变成为纯噪声。接着,让 SD 模型学习去噪过程,最后抽象出一个高维函数,这个函数能在纯噪声中不断“优化”噪声,得到一个干净样本。其中,将去噪过程具像化,就得到使用 UNet 预测噪声,并结合 Schedule 算法逐步去噪的过程。加噪和去噪过程都是逐步进行的,假设进行 K 步,那么每一步,SD 都要去预测噪声,从而形成“小步快跑的稳定去噪”。与此同时,在加噪过程中,每次增加的噪声量级可以不同,假设有 5 种噪声量级,那么每次都可以取一种量级的噪声,增加噪声的多样性。
2024-11-18
我想让AI帮我润色两句话,让其符合科研论文的用语习惯,并且有逻辑,可以适当改变语序、及表达方式,也允许添加或删除部分内容,该怎么下指令
以下是关于让 AI 润色两句话使其符合科研论文用语习惯且有逻辑的指令建议: 首先,明确您要润色的两句话的具体内容,并清晰地向 AI 描述您的需求。例如:“请将以下两句话按照科研论文的用语习惯进行润色,使其逻辑清晰、表达准确。句子 1:。” 在指令中,可以强调一些具体的要求,比如:“适当调整语序和表达方式,在不改变原意的基础上,优化句子结构,使其更具学术性和专业性。” 同时,您还可以补充一些相关的背景信息或特定的学科领域,以便 AI 更好地理解您的需求并进行更精准的润色。 常见的适合文章润色的 AI 工具包括: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体的 AI 写作助手,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于学生和写作人员的多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,可以帮助用户优化文章的语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可以根据输入生成符合要求的学术论文。 总的来说,这些 AI 工具涵盖了文章润色的各个环节,包括校对、改写、大纲生成、内容生成等,可以有效提高写作效率和质量。科研人员和学生可以根据自身需求选择合适的工具进行使用。
2024-10-20
有什么可以把中文字幕翻译成英文字幕并添加到原视频的工具推荐给我吗?
以下是为您推荐的可以把中文字幕翻译成英文字幕并添加到原视频的工具: 1. 按照一种方案,您可以: 用 whisper 生成原视频的英文字幕。 让 GPT 结合字幕全文翻译,并根据原英文字幕的拆分,将译文进行同样行数的拆分。 将 GPT 译文拆分的结果插入到原英文字幕文件中形成一个新的双语字幕文件。这个过程中的执行脚本可以让 GPT 写。 2. 另外,还有以下单独的视频自动字幕工具推荐: Reccloud:免费的在线 AI 字幕生成工具,可上传视频精准识别,能对识别的字幕进行翻译,自动生成双语字幕。已处理 1.2 亿+视频,识别准确率接近 100%。 绘影字幕:一站式专业视频自动字幕编辑器,提供字幕制作和翻译服务,支持 95 种语言,准确率高达 98%,可自定义字幕样式。 Arctime:能对视频语音自动识别并转换为字幕,支持自动打轴,支持 Windows 和 Linux 等主流平台及 SRT 和 ASS 等字幕功能。 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 以上工具各有特点,您可以根据自身需求选择最适合的。请注意,部分内容由 AI 大模型生成,请仔细甄别。
2024-10-15
我添加flux的模型后,在webui中要从哪里找到
在 webui 中找到添加的 flux 模型的方法如下: 首先,您可以安装 Civitai 助手插件。如果您上不了 C 站,可以去我的百度云盘里下载,然后放在“……\\sdwebuiakiv4\\extensions”路径文件夹下。安装完成后,重启 webUI,就可以在上方的标签选项卡中找到这个插件。 另外,下载模型后需要将之放置在指定的目录下,不同类型的模型放置目录不同: 1. 大模型(Ckpt):放入 models\\Stablediffusion。 2. VAE 模型:一些大模型需要配合 vae 使用,对应的 vae 同样放置在 models\\Stablediffusion 或 models\\VAE 目录,然后在 webui 的设置栏目选择。 3. Lora/LoHA/LoCon 模型:放入 extensions\\sdwebuiadditionalnetworks\\models\\lora,也可以在 models/Lora 目录。 4. Embedding 模型:放入 embeddings 目录。 模型的类型可以通过检测。安装 Civitai 助手插件后,它可以自动扫描您的所有文件,如果您的模型是从 C 站下载的,它会帮您自动匹配好缩略图。点击刷新旁边的按钮,再把鼠标放在模型的名字上,可以看见新的四个图标:🖼:用当前生成图替换为预览图;🌐:在新标签页打开这个模型的 Civitai 页面;💡:一键添加这个模型的触发词到关键词输入框;🏷:一键使用这个模型预览图所使用的关键词。
2024-08-22
模型下载
以下是关于模型下载的相关信息: ComfyUI BrushNet 模型下载: 原项目:https://tencentarc.github.io/BrushNet/ 插件地址:https://github.com/kijai/ComfyUIBrushNetWrapper 模型下载:https://huggingface.co/Kijai/BrushNetfp16/tree/main 第一次运行会自动下载需要的模型,如果使用 ComfyUIBrushNetWrapper 节点,模型将自动从此处下载:https://huggingface.co/Kijai/BrushNetfp16/tree/main 到 ComfyUI/models/brushnet。 因环境问题,也可手动下载后放在这个文件夹里面。另外,BrushNet 提供了三个模型,个人测试下来,random 这个效果比较好。 SD 模型下载: 常用的模型网站有: 下载模型后需要将之放置在指定的目录下,不同类型的模型放置目录不同: 大模型(Ckpt):放入 models\\Stablediffusion VAE 模型:一些大模型需要配合 vae 使用,对应的 vae 同样放置在 models\\Stablediffusion 或 models\\VAE 目录,然后在 webui 的设置栏目选择。 Lora/LoHA/LoCon 模型:放入 extensions\\sdwebuiadditionalnetworks\\models\\lora,也可以在 models/Lora 目录 Embedding 模型:放入 embeddings 目录
2025-01-14
大模型排名怎么查看
要查看大模型排名,您可以通过以下几种方式: 1. 查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台,这些渠道通常会及时发布最新的排名和评价。 2. 在通往 AGI 之路的知识库里,在会定期更新相关的排名报告,可以供您查阅。 3. 例如,您可以访问聊天机器人竞技场网站,输入一些问题,根据两个模型的响应选择获胜者,通过这种方式根据胜率计算 ELO 分数来确定排名。越高越好。目前表现最好的模型多为专有模型,如 OpenAI 的 GPT 系列,以及 Anthropic 的 Claude 系列等。 4. 斯坦福发布的大模型排行榜 AlpacaEval 也可作为参考,其支持两种模式的模型评估方式: alpaca_eval:直接根据目标模型输出的响应来评估模型。 alpaca_eval evaluate_from_model:根据 HuggingFace 已注册模型或这 API 提供商来端到端评测模型。评测过程分为以下 3 步: 选择一个评估集,并计算指定为 model_outputs 的输出。默认情况下,使用来自 AlpacaEval 的 805 个示例。 计算 golden 输出 reference_outputs。默认情况下,在 AlpacaEval 上使用 textdavinci003 的输出。 通过 annotators_config 选择指定的自动标注器,它将根据 model_outputs 和 reference_outputs 计算胜率。这里建议使用 alpaca_eval_gpt4 或 claude。根据不同的标注器,使用者还需要在环境配置中设定 API_KEY。 需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2025-01-14
大模型评测
以下是关于大模型评测的相关信息: 招聘信息:有大模型算法工程师/产品经理(实习)岗位在北京,工作包括大模型效果评测,要求研究生及以上学历,相关专业优先,有相关实习经验、代码能力强等。 开源评测体系及平台: FlagEval(天秤):旨在建立科学、公正、开放的评测基准、方法、工具集,创新构建了“能力任务指标”三维评测框架。 CEval:构造了覆盖多学科的中文知识和推理型测试集,并给出主流中文 LLM 的评测结果。 SuperCLUElyb:中文通用大模型匿名对战评价基准,发布了初步结果和基于 Elo 评级系统的排行榜。 测评示例:小七姐对文心一言 4.0、智谱清言、KimiChat 进行小样本测评,包括测评机制、目标、能力考量和多轮测评任务,如复杂提示词理解和执行、推理能力、文本生成能力、提示词设计能力、长文本归纳总结能力等,每轮测评都有不同的任务和模型参与。
2025-01-14
目前来看 AI生图模型 哪个最好用
目前比较好用的 AI 生图模型有以下几种: 1. Artguru AI Art Generator:是一个在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,能将上传的照片转换为芭比风格,效果很好。 此外,Leonardo 也是一款不错的 AI 生图模型: 支持用户上传自己 DIY 的模型,尤其是 Lora 模型,增强了应用的灵活性和个性化。 提供丰富的模型选择,包括官方精心微调过的模型和社区贡献的 Lora 模型。 能够生成高质量的图片,在细节精致程度和整体艺术效果上表现出色。 价格已变得更加合理,但存在访问限制的问题。 在选择平台时,目前市面上有线上和线下本地部署两种: 线上平台出图速度快,不依赖本地显卡配置,无需下载大型模型,能看其他创作者的作品,但出图分辨率有限,制作横板、高清图片会受限。 线下部署可自己添加插件,出图质量高,但使用时电脑基本宕机,配置不高可能出现爆显存导致出图失败。 可以充分发挥线上和线下平台的优势,线上用于找参考、测试模型,线下作为主要出图工具。先在线上绘图网站的绘图广场发现想要的画风,点击创作会自动匹配模型和标签,截取游戏人物底图将线上算力集中在人物身上,多尝试不同画风得出合适模型和组合,最后在 C 站下载对应模型到本地加载部署后正式生图。但这些模型仍存在一些局限,如偶尔性能不稳定、生成内容不当等问题。
2025-01-14
智能体(AI Agent)对比大模型在应用中的优势是什么
智能体(AI Agent)对比大模型在应用中的优势主要包括以下方面: 1. 能够回答私有领域问题,例如公司制度、人员信息等,而大模型存在无法回答此类问题的局限性。 2. 可以及时获取最新信息,如实时天气、比赛结果等,大模型在这方面有所不足。 3. 能准确回答专业问题,如复杂数学计算、图像生成等,大模型在这些方面表现欠佳。 4. 适用于多种客户场景,如有企业官网、钉钉、微信等渠道,期望为客户提供产品咨询服务的场景,以及缺少技术人员开发大模型问答应用的情况。 5. 基于大模型,通过集成特定的外部能力,弥补大模型的不足。例如集成实时信息获取、回答私有领域问题等外部能力。 6. 典型场景丰富,包括私有领域知识问答、个性化聊天机器人、智能助手等。如私有领域知识问答,只需准备好相关知识库文件,就可在百炼控制台快速创建应用;个性化聊天机器人可通过长期记忆保存关键历史对话信息,并集成夸克搜索和图像生成等插件扩展功能;智能助手可引入 RAG 能力、长期记忆和自定义插件等功能提升工作效率。 在基准测评方面,AI Agent 智能体正在最大程度释放 LLM 潜能,逐渐成为通向 AGI 的技术共识。现有关于 Agent 能力的测评,主要在英文场景或任务,目前还没有一个在中文任务和场景上针对中文大模型的全面测评。通过测评结果发现,在 Agent 核心基础能力上,国内模型已经较为接近或部分超过 GPT3.5 水平。 从原理上看,智能体中间的“智能体”就是 LLM 或大模型,通过为其增加工具、记忆、行动、规划四个能力来实现。行业里主要用到的是 langchain 框架,它把 LLM 之间以及 LLM 和工具之间通过代码或 prompt 的形式进行串接,在 prompt 层和工具层完成主要的设计逻辑。
2025-01-13
什么是多模态模型?
多模态模型是指能够处理和融合多种不同模态信息(如视觉、语言、音频等)的模型。 以下为一些常见的多模态模型示例: 智谱·AI 推出的具有视觉和语言双模态的模型: CogAgent18B:基于 CogVLM17B 改进的开源视觉语言模型,拥有 110 亿视觉参数和 70 亿语言参数,支持 11201120 分辨率的图像理解,在 CogVLM 功能的基础上,具备 GUI 图像的 Agent 能力。代码链接:。 CogVLM17B:强大的开源视觉语言模型(VLM),基于对视觉和语言信息之间融合的理解,在多模态权威学术榜单上综合成绩优异。代码链接:。 Visualglm6B:开源的支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数;图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。代码链接:。 RDM:Relay Diffusion Model,级联扩散模型,可以从任意给定分辨率的图像快速生成,而无需从白噪声生成。代码链接:。 Google 的人工智能多模态大模型叫 Gemini,它是 Google DeepMind 团队开发的,不仅支持文本、图片等提示,还支持视频、音频和代码提示。能够理解和处理几乎任何输入,结合不同类型的信息,并生成几乎任何输出。被称为 Google 迄今为止最强大、最全面的模型,被描述为一种“原生多模态大模型”,从设计之初就支持多模态,能够处理语言、视觉、听觉等不同形式的数据。但请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-13