Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

国内大预言模型能力对比

Answer

以下是关于国内大语言模型能力对比的相关信息:

  • 小七姐的测评:
    • 测评机制:以同组提示词下 ChatGPT 4.0 生成的内容做对标参照,对智谱清言、文心一言 4.0、KimiChat 进行测评。
    • 能力考量:包括复杂提示词理解和执行(结构化提示词)、推理能力(CoT 表现)、文本生成能力(写作要求执行)、提示词设计能力(让模型设计提示词)、长文本归纳总结能力(论文阅读)。
    • 测评轮次:共五轮,分别针对上述不同能力进行不同任务和模型的测试。
  • 中文大模型基准测评 2023 年度报告:
    • 国内大模型历月前三甲:在工具使用的测评中,GPT-4 Turbo 取得满分,国内智谱清言排名第一,文心一言 4.0(API)等也有不错表现。
    • 国内外大模型发展趋势:国内外差距依然明显,GPT 4 Turbo 总分遥遥领先,国内最好的文心一言 4.0(API)与 GPT4-Turbo 有一定差距,但过去 1 年国内大模型有长足进步,综合能力超过 GPT 3.5 的模型有多个。在 SuperCLUE 测评中,国外模型平均成绩高于国内模型,但差距在缩小,国内开源模型在中文上表现好于国外开源模型。
Content generated by AI large model, please carefully verify (powered by aily)

References

小七姐:文心一言4.0、智谱清言、KimiChat 小样本测评

测评三家国产大模型,以同组提示词下ChatGPT 4.0生成的内容做对标参照[智谱清言](https://chatglm.cn/main/detail)[文心一言4.0](https://yiyan.baidu.com/)[Kimi Chat](https://kimi.moonshot.cn/chat/)[heading3]二、能力考量[content]复杂提示词理解和执行(结构化提示词)推理能力(CoT表现)文本生成能力(写作要求执行)提示词设计能力(让模型设计提示词)长文本归纳总结能力(论文阅读)[heading3]三、测评轮次[heading4]第一轮:复杂提示词理解和执行[content]1.任务一:Markdown+英文title提示词测试,1个任务4个模型(4次)2.任务二:Markdown+中文title提示词测试,1个任务4个模型(4次)3.任务三:中文title+自然段落提示词测试,1个任务4个模型(4次)[heading4]第二轮:推理能力(CoT表现)[content]逐步推理任务,遍历3个不同类型任务+4个大模型(12次)[heading4]第三轮:文本生成能力(写作要求执行)[content]根据提示词生成文本任务,遍历3个不同类型任务+4个大模型(12次)[heading4]第四轮:提示词设计能力(让模型设计提示词)[content]按提示词要求生成提示词,逐步推理任务,遍历3个不同类型任务+4个大模型(12次)[heading4]第五轮:长文本归纳总结能力(论文阅读)[content]按提供的长文本(上传或在线)进行归纳总结,逐步推理任务,遍历3个不同类型任务+4个大模型(12次)

2023年度中文大模型基准测评报告.pdf

测评分析工具使用,考察模型的能力包括:检索API、调用API、规划API、通用工具使用。在工具使用的测评中,GPT-4 Turbo取得了满分。国内大模型中智谱清言表现不俗,取得了83.78的高分,排名国内模型第一。仅随其后的是文心一言4.0(API)、通义千问2.0、Yi-34B-Chat、AndesGPT均有超过70分的表现。其他国内模型同样有不错的表现,超过GPT3.5的模型有12个。在开源模型中,Baichuan2-13B-Chat、Xverse-13B-2-Caht的表现可圈可点,均超过GPT3.5以及众多闭源模型。总体来看,在工具使用能力上,国内大模型的表现优异,与国内大模型厂商积极落地应用密不可分。

2023年度中文大模型基准测评报告.pdf

国内外差距依然明显。GP T 4 T u r b o总分90.63分遥遥领先,高于其他国内大模型及国外大模型。其中国内最好模型文心一言4.0(API)总分79.02分,距离GPT4-Turbo有11.61分,距离GPT4(网页)有4.9分的差距。必须看到的是,过去1年国内大模型已经有了长足的进步。综合能力超过G P T 3.5和Gemini-Pro的模型有11个,比如百度的文心一言4.0、阿里云的通义千问2.0和Qw e n 72B-Chat、OPPO的AndesGPT、清华&智谱AI的智谱清言、字节跳动的云雀大模型等都有比较好的表现。国外模型平均成绩VS国内模型平均成绩•在SuperCLUE测评中,国外模型的平均成绩为69.42分,国内模型平均成绩为65.95分,差距在4分左右。另外国内开源模型在中文上表现要好于国外开源模型,如百川智能的Baichuan2-13B-Chat、阿里云的Qwen-72B、Yi-34B-Cha t均优于Llama2-13B-Chat。•可以看出,国内外的平均水平差距在缩小,11月差距在10分左右。

Others are asking
整合多家大预言模型的工具
以下为整合多家大语言模型的工具介绍: 1. Poe: 由 Quora 开发,有 APP 版本,支持跨端使用。 集成了 Chat GPT、GPT4、Claude+、Claude、Dragonfly 等模型,同时支持用户自建 Chatbot。 不同语言模型回复效果有差异,适合需要调用多种大语言模型的用户。 Dragonfly 擅长给出较短的回答,并擅长在输入中给出示例时遵循指示。 Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时使用,有时能够给出超越直接使用 Chat GPT 时的体验,但和 Chat GPT 一样,Claude 也时常会给出一些错误回复,一些问题可在两个模型中都问一遍提升信息准确性。 支持分享用户和模型的对话内容,但 GPT4、Claude+产品需要付费订阅使用。 访问地址: Poe 中的提问引导能够启发用户,支持 Explore Chatbot,但丰富度不如后续要介绍的 Character,midjourney prompt 扩写 Chatbot 能力很惊人。 2. Ollama: 支持多种大型语言模型,包括通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 cpu 和 gpu。 提供模型库,用户可从中下载不同模型,这些模型有不同参数和大小,以满足不同需求和硬件条件。模型库可通过 https://ollama.com/library 查找。 用户可通过简单步骤自定义模型,例如修改模型的温度参数来调整创造性和连贯性,或者设置特定的系统消息。 提供 REST API,用于运行和管理模型,以及与其他应用程序的集成选项。 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 下载安装地址:https://ollama.com/download/ ,安装完后,在 mac 上启动 ollama 应用程序,在 linux 上通过 ollama serve 启动,可通过 ollama list 确认,未下载模型时正常显示空,可通过 ollama 命令下载模型。 3. 未来还会不断丰富大模型的外延能力,例如知识库检索、计算工具、WolframAlpha、操作软件等。首先集成了 LangChain 框架,可更方便地基于 Llama2 开发文档检索、问答机器人和智能体应用等。针对 LangChain 框架封装的 Llama2 LLM 类见,简单的调用代码示例如下。
2024-11-15
可以调用不同大预言模型的整合工具推荐
以下是为您推荐的可以调用不同大语言模型的整合工具: 1. Poe:由 Quora 开发,有 APP 版本,支持跨端使用。集成了 Chat GPT、GPT4、Claude+、Claude、Dragonfly 等模型,同时支持用户自建 Chatbot。不同语言模型回复效果有差异,适合需要调用多种大语言模型的用户。访问地址: 。Dragonfly 擅长给出较短的回答,并擅长在输入中给出示例时遵循指示。Claude 更擅长创造性回复,配合 Poe 中的提问引导,非常适合在查阅资料时使用,有时能够给出超越直接使用 Chat GPT 时的体验(但和 Chat GPT 一样,Claude 也时常会给出一些错误回复,一些问题可以尝试在两个模型中都问一遍提升信息准确性)。此外支持分享用户和模型的对话内容,但 GPT4、Claude+产品需要付费订阅使用。 2. 国内的一些模型,如智谱和文心,在文生图方面有一定能力。 另外,大模型工具可根据自身条件准备,推荐顺序为:1. chatGPT 4.0 2. kimichat 3. 智谱清言 4 。
2024-11-12
国内外大预言模型对比
以下是国内外大语言模型的对比情况: 1. 工具使用能力: 在工具使用的测评中,GPT4 Turbo 取得满分。 国内大模型中智谱清言表现不俗,取得 83.78 的高分,排名国内第一。文心一言 4.0、通义千问 2.0、Yi34BChat、AndesGPT 均有超过 70 分的表现。超过 GPT3.5 的国内模型有 12 个。 开源模型中,Baichuan213BChat、Xverse13B2Caht 表现可圈可点,均超过 GPT3.5 以及众多闭源模型。总体来看,国内大模型在工具使用能力上表现优异,这与国内大模型厂商积极落地应用密不可分。 2. 主观和客观对比: 通过对比模型在主观简答题 OPEN 和客观选择题 OPT 上的不同表现,国内大模型多数擅长做选择题,普遍选择题分数高于简答题分数。文心一言 4.0 和智谱清言表现相对稳定。 GPT4 Turbo 的表现最为稳定。 客观题相对主观题更容易通过题库形式进行训练和提升,同时由于客观题中包含中文特性问题,中文模型有一定优势,应综合来看模型的评测效果。 在本次测评中,国外的代表性大模型如 GPT4 的不同版本、Claude2、Llama2 都有很好的稳定性表现,值得国内大模型进一步分析研究。 3. 总体表现: GPT 4 Turbo 总分 90.63 分遥遥领先,高于其他国内大模型及国外大模型。国内最好模型文心一言 4.0有 4.9 分的差距。 过去 1 年国内大模型有长足进步,综合能力超过 GPT 3.5 和 GeminiPro 的模型有 11 个。 在 SuperCLUE 测评中,国外模型的平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右。国内外的平均水平差距在缩小,11 月差距在 10 分左右。 国内开源模型在中文上表现好于国外开源模型,如百川智能的 Baichuan213BChat、阿里云的 Qwen72B、Yi 34BCha t 均优于 Llama213BChat。
2024-11-12
你知道有支持个性化训练的大预言模型么
以下是一些支持个性化训练的大语言模型: 1. Character.ai:更注重人格属性,试图满足社交、情感、陪伴等需求,与 ChatGPT 侧重不同,后者注重提高效率和解放生产力。 2. Midjourney:今天发布了模型个性化 Personalization 或 'p'的早期测试版本。模型个性化会学习用户的喜好,以便更可能用用户的口味来填补空白。其要求包括目前从成对排名中的投票和喜欢的探索页面上的图像中学习,需要大约 200 个成对排名/喜欢才能生效。使用时只需在提示后输入 'p',或使用提示栏中的设置按钮为所有提示启用个性化功能,还可以使用 's 100'控制个性化效果的强度。但需注意个性化目前不是一个稳定的功能,会随着进行更多的成对排名而变化,且可能会在接下来的几周内推出算法更新。
2024-10-18
有哪些优质的法律大模型数据集
以下是一些优质的法律大模型数据集: 1. ChatLaw: 地址: 简介:由北大开源的一系列法律领域的大模型,包括 ChatLaw13B(基于姜子牙 ZiyaLLaMA13Bv1 训练而来),ChatLaw33B(基于 Anima33B 训练而来,逻辑推理能力大幅提升),ChatLawText2Vec,使用 93w 条判决案例做成的数据集基于 BERT 训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配。 2. LaWGPT: 地址: 简介:该系列模型在通用中文基座模型(如 ChineseLLaMA、ChatGLM 等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。在此基础上,构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,提升了模型对法律内容的理解和执行能力。 3. LexiLaw: 地址: 简介:LexiLaw 是一个基于 ChatGLM6B 微调的中文法律大模型,通过在法律领域的数据集上进行微调。该模型旨在为法律从业者、学生和普通用户提供准确、可靠的法律咨询服务,包括具体法律问题的咨询,还是对法律条款、案例解析、法规解读等方面的查询。 4. Lawyer LLaMA: 地址: 简介:开源了一系列法律领域的指令微调数据和基于 LLaMA 训练的中文法律大模型的参数。Lawyer LLaMA 首先在大规模法律语料上进行了 continual pretraining。在此基础上,借助 ChatGPT 收集了一批对中国国家统一法律职业资格考试客观题(以下简称法考)的分析和对法律咨询的回答,利用收集到的数据对模型进行指令微调,让模型习得将法律知识应用到具体场景中的能力。
2025-01-08
免费的学术AI大模型
以下是一些免费的学术 AI 大模型: 1. 国内: 阿里、腾讯对新用户提供免费试用服务器,如腾讯云的。服务器系统配置选择【宝塔】系统。 阿里的接口,创建 API key。 也有免费接口,但大都限制一定免费额度的 Token。 2. 国外: 来操作。 此外,ProductHunt 2023 年度最佳产品榜单中的免费 AI 模型有: 1. GPT4(免费可用)——与人类水平相当的 LLM。 2. Midjourney v5(免费)——令人惊叹的逼真 AI 图像以及五指手。 3. DALL·E 3(免费可用)——轻松将想法转化为极其精准的图像。 4. Mistral 7B(免费)——迄今为止最优秀的 70 亿参数模型,Apache 2.0。 智谱·AI 开源模型列表可参考。Token 数代表了模型支持的总 Token 数量,包括输入和输出的所有 token,且一个 token 约等于 1.8 个汉字。
2025-01-08
跑本地大模型有哪些用处?
跑本地大模型具有以下用处: 1. 支持多种大型语言模型:如通义千问、Llama 2、Mistral 和 Gemma 等,可应用于不同场景。 2. 易于使用:适用于 macOS、Windows 和 Linux 系统,支持 CPU 和 GPU,方便在本地环境中启动和运行。 3. 丰富的模型库:提供多种不同参数和大小的模型,满足不同需求和硬件条件,可通过 https://ollama.com/library 查找。 4. 自定义模型:能通过简单步骤修改模型的温度参数等以调整创造性和连贯性,或设置特定系统消息。 5. API 和集成:提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 6. 社区贡献丰富:包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 Ollama 是一个开源框架,旨在简化本地运行大型语言模型的过程。它是轻量级、可扩展的,提供简单 API 创建、运行和管理模型,还有预构建模型库,降低使用门槛,适合初学者和非技术人员,适用于自然语言处理研究和产品开发。安装可通过官方下载地址 https://ollama.com/download ,安装后可通过相关链接判断是否成功。运行时在命令行输入相应命令,选择模型如 llama2 ,Ollama 会自动下载模型到本地。
2025-01-08
是不是可以跟任何大模型进行对话
一般来说,可以跟很多大模型进行对话。以下是一些常见的方式: 1. 对于 Llama3 大模型: 下载大模型主要是为了与之对话,或者称为使用其进行推理。 有两种对话方式,可使用 API 或部署简单界面。面向小白,这里主要介绍部署界面的方式。 例如,在 /root/autodltmp 路径下新建 chatBot.py 文件并输入相关内容,然后启动 Webdemo 服务,按照指示映射端口,在浏览器中打开相应链接即可看到聊天界面。 2. 对于 Llama 大模型: 首先编译,为利用 Metal 的 GPU 可用特定命令编译。 去指定网址下载模型。 llama.cpp 还提供了 WebUI 供用户使用,启动 server 后默认监听 8080 端口,打开浏览器就可以对话。 3. 对于通过 Open WebUI 使用大模型: 访问指定网址,使用邮箱注册账号。 登陆成功后,Open WebUI 一般有聊天对话和 RAG 能力(让模型根据文档内容回答问题)两种使用方式。如果要求不高,已实现通过 Web UI 与本地大模型对话的功能。 需要注意的是,不同大模型的访问速度和回答效果可能存在差异,例如 ChatGPT 访问速度快是因为其服务器配置高,回答效果好是因为训练参数多、数据更优以及训练算法更好。
2025-01-07
我想在dify里按照一个reranker模型,推荐哪个
在 Dify 中安装 reranker 模型,推荐使用中转服务商。Dify 的部署版本中,模型需自行配置,官方和中转的都支持,但中转服务商从性价比角度更优,充点小钱就能用上各种模型,价格通常有较大折扣,20 刀普通用户能用很久,还能在不同地方使用。若没有合适的中转服务商,可使用我自用的,点击原文即可。模型设置方面,在 Dify 右上角点击设置模型供应商,填入中转服务商提供的信息(一般包括 API base 或 Base URL 以及 key)并保存。若保存成功,回到主页面创建一个 Agent 测试,正常则大功告成。比如我填的 API base 是‘https://one.glbai.com’。
2025-01-07
文生图有哪些大模型
以下是一些常见的文生图大模型: 1. SD(StableDiffusion):如 majicmixRealistic_v6.safetensors 模型,可通过设置相关提示词、参数等生成图像。 2. 快手 Kolors:这是一个基于潜在扩散的大规模文本生成图像模型,在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面有显著优势,支持中文和英文输入。其相关资源包括工作流与模型地址、文档说明、项目地址等。 开源代码:https://github.com/KwaiKolors/Kolors 模型权重:https://huggingface.co/KwaiKolors/Kolors 官方页面:https://kwaikolors.github.io/ 企业页面:https://kolors.kuaishou.com/
2025-01-07
哪款AI的图片识别能力最强
目前在图像识别能力方面,OpenAI 的 GPT4 表现较为出色。例如,左边的图片展示了 1 万亿参数的 GPT4 在图像识别方面的能力,其回应比许多人类所能想出的更加清晰和准确。但需要注意的是,图像识别能力的评估会受到多种因素的影响,不同的应用场景和需求可能会导致不同的结果。同时,像 MiniMax 视频模型在图像识别和处理方面也有一定的特点,它不仅可以准确识别用户上传的图片,还能在光影、色调等方面实现完美嵌入新场景的设定。
2025-01-07
哪个AI图形处理能力强?
以下是一些在图形处理方面表现较强的 AI 工具: Photoshop 2023 Beta:具有创成式填充功能,能帮助快速生成素材,有良好的图层管理系统和后期处理能力,但生成的图形质量在某些方面可能不如其他专门的 AI 绘图工具,且需要更多的尝试和后期处理来达到满意效果。 Pika:对奇幻感较强的画面把控较好,自然,但真实环境画面易糊,唇形同步功能便捷。 Pixverse:在高清化方面有优势,对偏风景和纪录、有特定物体移动的画面友好,但生成的视频可能有帧率问题。 Runway:在真实影像质感方面表现出色,战争片全景镜头处理好,控件体验感较好,但光影不稳定,易变色。 需要注意的是,不同的 AI 工具在图形处理方面各有优劣,具体的选择应根据您的具体需求和使用场景来决定。
2025-01-03
帮我查一下这四家主流大模型的应用能力评测报告吧,通用能力和单项能力都可,数据需要权威一些文心一言 文心一格 通义千问 通义万相 讯飞星火 ai小科 智谱
以下是为您找到的关于主流大模型应用能力评测的相关报告: 小七姐的测评: 测评机制:以同组提示词下 ChatGPT 4.0 生成的内容做对标参照,对智谱清言、文心一言 4.0、Kimi Chat 进行测评。 能力考量:包括复杂提示词理解和执行(结构化提示词)、推理能力(CoT 表现)、文本生成能力(写作要求执行)、提示词设计能力(让模型设计提示词)、长文本归纳总结能力(论文阅读)。 测评轮次:共分为五轮,分别针对不同的任务和模型进行多次测试。 中文大模型基准测评 2023 年度报告: 优秀模型:文心一言 4.0 API(百度)。 模型特点:在计算、逻辑推理、生成与创作、传统安全这 4 大基础能力上排名国内第一,在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三,各项能力表现均衡且水平较高。 适合应用:能力栈广泛,可应用于查询搜索知识应用、任务拆解规划 Agent、文案写作、代码编写及纠错等方面,在逻辑推理方面表现不俗,可关注在科学研究、教育、工业方面的落地能力。 观点文章中的测评: 目前体验效果比较好的有科大星火模型、清华 ChatGLM、百度文心一言。 星火目前感觉最接近 GPT3.5(0301 版本)的 80%90%,但 GPT3.5 进化到 6 月版本效果更强。 对大模型的评估可从基础能力、职场能力、探索对话三个方面判断,基础能力包括语言(文本)生成和语言理解,如常识类问题和分词类问题。
2024-12-27
AI能力到达AGI了吗
目前 AI 能力尚未达到 AGI(通用人工智能)。汪华老师认为此次 AI 的变革量级,100%能够抵达与移动互联网处于同一级别的第一个阶段,50%有可能发展至与蒸汽机的出现同量级的第二个阶段,但能否到达 AGI 的第三个阶段尚不明确。同时,学习笔记中也提到 AI 分为 ANI(弱人工智能)和 AGI,ANI 得到巨大发展但 AGI 还没有取得巨大进展。
2024-12-26
可灵和即梦哪个生成视频的能力更强
目前难以直接明确可灵和即梦哪个生成视频的能力更强。 Google DeepMind 和 OpenAI 展示了强大的文本到视频扩散模型预览,但访问受限且技术细节披露不多。Meta 更进一步,将音频加入其 Movie Gen 模型。 在 2024 年,国内涌现出一系列 AI 生成视频工具,如可灵、即梦、智谱清影等,生成结果甚至远超国外。 即梦是剪映旗下的,生成 3 秒视频,动作幅度有很大升级,有最新的 S 模型和 P 模型。可灵支持运动笔刷,1.5 模型可以直出 1080P30 帧视频。 在图生视频方面,市面上主要的工具包括可灵、即梦、Luma,核心方法是穷举和不断调整 prompt 来设计人物动作、辅助镜头运镜等。
2024-12-21
如何通过提示词提高模型数据对比和筛选能力
以下是一些通过提示词提高模型数据对比和筛选能力的方法: 1. 选择自定义提示词或预定义话题,在网站上使用如 Llama3.1 8B Instruct 模型时,输入对话内容等待内容生成,若右边分析未刷新可在相关按钮间切换。由于归因聚类使用大模型,需稍作等待,最终结果可能因模型使用的温度等因素而不同。 2. 在写提示词时不能依赖直觉和偷懒,要实话实说,补充详细信息以避免模型在边缘情况上犯错,这样也能提高数据质量。 3. 在分类问题中,提示中的每个输入应分类到预定义类别之一。在提示末尾使用分隔符如“\n\n\n\n”,选择映射到单个 token 的类,推理时指定 max_tokens=1,确保提示加完成不超过 2048 个 token,每班至少有 100 个例子,可指定 logprobs=5 获得类日志概率,用于微调的数据集应在结构和任务类型上与模型使用的数据集相似。例如在确保网站广告文字正确的案例中,可微调分类器,使用合适的分隔符和模型。
2024-12-20
国内免费的生图平台
以下是一些国内免费的生图平台及相关简易上手教程: Tusiart 简易上手教程: 生图入口 1:网页顶部的右方有生图按钮,点击进入生图界面。 生图入口 2:点进首页任意一个模型(checkpoint 或 lora),有运行按钮。 生图入口 3:点进任意一个模型下面的返图区(相关帖子),点开一张喜欢的图片,右侧有做同款的按钮。点开之后可以选择自动复制所有设置,尝试复现图片,体验设置效果。但需注意,这个生图是直接复现大佬操作,但肯定不会复现大佬的图,好在大概率能出与大佬同水平同要素的图。 Liblibai 简易上手教程: 生图入口 1:网页顶部的右方有生图按钮,点击进入生图界面。 生图入口 2:点进模型广场上任意一个模型(checkpoint 或 lora),有立即生图按钮。 生图入口 3:点进任意一个模型下面的返图区,点开一张喜欢的图片,右侧有在线生成的按钮。点开之后可以选择自动复制所有设置,尝试复现图片,体验设置效果。但需注意,这个生图是直接复现大佬操作,但肯定不会复现大佬的图,好在大概率能出与大佬同水平同要素的图。 此外,目前比较成熟的通过输入图片生成类似图片的 AI 产品主要有: Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。请注意内容由 AI 大模型生成,请仔细甄别。
2025-01-08
国内的免费文生图AI
以下是一些国内的免费文生图 AI 工具: Hidreamai:https://hidreamai.com//AiVideo ,支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持多种控制,可生成 5s 和 15s 的视频。 ETNA:https://etna.7volcanoes.com/ ,由七火山科技开发,能根据简短文本描述生成 8 15 秒、画质达 4K 的视频,支持中文。 Dreamina:https://jimeng.jianying.com/aitool/video/generate ,在内测中,有免费额度,支持多种生成方式和控制,默认生成 3s 的视频。 可灵:https://klingai.kuaishou.com/ ,支持文生视频、图生视频,提示词可使用中文,默认生成 5s 的视频。 更多相关工具可查看:https://www.waytoagi.com/category/38 。请注意内容由 AI 大模型生成,请仔细甄别。
2025-01-07
superclue 在国内的评测里面什么地位,国外对标的评测是什么
在国内的评测中,SuperCLUE 是大模型时代 CLUE 基准的发展和延续,聚焦于通用大模型的综合性测评。在 SuperCLUE 测评中,国外模型的平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右。国内外的平均水平差距在缩小,11 月差距在 10 分左右。 SuperCLUE 是中文语言理解测评基准 CLUE 的发展,发起于 2019 年,陆续推出了多种广为引用的测评基准。它根据多年的测评经验,构建了多层次、多维度的综合性测评基准。SuperCLUE 始终秉持中立、客观的第三方测评理念,采用自动化方式的客观评估,降低评测过程中的人为评估的不确定性。 国外对标的评测没有明确提及。
2025-01-07
我想用AI制作一个帮助自己及时获得某细分工业领域国内外信息的工具,应该如何开始?
以下是使用 AI 制作帮助自己及时获得某细分工业领域国内外信息工具的步骤: 1. 让 AI 阅读学习一篇您认为优秀的行业调研报告,总结其中的方法论,输出一份“行业调研报告”的研究方法和操作框架。 2. 询问 AI 该文章在收集行业数据时使用了哪些一手数据和二手数据,并请其推荐一些靠谱的行业资料收集网站。 3. 要求 AI 参考上述内容,为您写一份“XXX 行业调研报告”,并请其作为“行业调研报告撰写专家”,推荐 10 个“XXX 行业”信息网站和 5 个“XXX 行业”研究微信公众号,然后输出一份“XXX 行业调研报告”框架。 4. 要求 AI 针对上述“XXX 行业调研报告”框架,丰富每一章节内容,每章内容字数大于 200 字。 5. 完成以上 4 个步骤后,AI 会为您写出一个“XXX 行业调研报告”的初稿。接下来,您可以根据自己的需求,让 AI 进一步完善每一个章节的内容。然后结合您自己的独特经验和知识,对文章内容进行润色和调整。 需要注意的是,要使调研报告有深度,可以通过以下两个路径: 1. 自己对行业比较了解,整理深度洞察和见解。 2. 一步一步深度咨询 AI,借助 AI 的海量知识,一边学习、一边研究、一边洞察总结。(通过借助 AI,可以加速我们的学习和研究能力) 操作示例如下:获取“kimi 对话原文”链接: 欢迎与 JessieZTalk 交流,在 AIGC 的路上共同进步!
2025-01-07
最近国内外 有什么新出的AI产品
以下是国内外新出的一些 AI 产品: 图像类产品: 国内: 可灵:由快手团队开发,用于生成高质量的图像和视频,图像质量高,最初采用内测邀请制,现向所有用户开放,价格相对较高,重度用户年费可达几千元,平均每月使用成本在 400 到 600 元,也有临时或轻度使用的免费点数和较便宜包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,生成图像质量高、细节丰富,操作界面简洁直观、用户友好度高,能与阿里其他产品和服务无缝整合,重点是现在免费,每天签到获取灵感值即可,但存在某些类型图像无法生成、处理非中文语言或国际化内容不够出色、处理多元文化内容可能存在偏差等局限性。 搜索类产品: 国内:大模型厂商推出的 ChatBot 产品(智谱清言、Kimi Chat、百小应、海螺 AI 等),搜索厂商或创业团队推出的 AI 搜索产品(360 AI 搜索、秘塔、博查 AI、Miku 等)。 海外:Perplexity、You、Phind 等。 中国公司和团队的出海产品:ThinkAny、GenSpark、Devv 等。 PPT 类产品: 国内:爱设计 PPT,背后有实力强大的团队,对市场需求有敏锐洞察力,把握住了 AI 与 PPT 结合的市场机遇,已确立市场领先地位,代表了当前国内 AI 辅助 PPT 制作的最高水平,能提高制作效率并保证高质量输出。
2025-01-06
国内有什么生成视频的AI应用么
以下是国内一些生成视频的 AI 应用: 1. 可灵:在 AI 视频生成领域表现出色,具有卓越的视频生成质量,生成的视频在画面清晰度、连贯性和内容丰富性上可与国际顶级模型媲美。生成速度快,处理效率高,且对国内用户的可访问性强,提供了便捷、稳定的使用体验。 2. Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 3. Hidreamai:有免费额度,支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持多种控制,可生成不同时长和尺寸的视频。 4. ETNA:由七火山科技开发的文生视频 AI 模型,能根据简短文本描述生成相应视频内容,视频长度 8 15 秒,画质可达 4K,支持中文,时空理解。 更多的文生视频网站可以查看: 需注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-06