Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

国外比较主流的大模型有哪些

Answer

国外比较主流的大模型有:

  1. GPT4-Turbo:OpenAI 于 2023 年 11 月 7 日发布的 GPT4 的升级版本。
  2. GPT4(网页版):OpenAI GPT4 官方网页版本,支持联网功能。
  3. GPT4(API):OpenAI GPT4 官方 API 版本,不支持联网功能。
  4. Claude2:Anthropic 官方发布的模型。
  5. Gemini-pro:Google 官方发布的模型。
  6. GPT3.5-Turbo:OpenAI 的模型。
  7. Llama_2_13B_Chat:Meta 发布的模型。
Content generated by AI large model, please carefully verify (powered by aily)

References

2023年度中文大模型基准测评报告.pdf

1.SuperC本次测评数据选取了SuperCLUE-12月测评结果,模型选取了国内外有代表性的26个大模型在12月份的版本。模型机构简介1.GPT4-TurboOpenAI 2023年11月7日发布的GPT4的升级版本14.通义千问2.02.GPT4(网页版)OpenAI GPT4官方网页版本,支持联网功能15.Claude23.GPT4(API)OpenAI GPT4官方API版本,不支持联网功能16.云雀大模型(豆包)4.文心一言4.0(API)百度官方付费使用的文心一言V4.0的API版本17.Gemini-pro官方文心一言网页4.0版本5.文心一言4.0(网页版)百度18.GPT3.5-Turbo6.智谱清言清华&智谱AI官方网页版产品【智谱清言】19.Qwen-14B-ChatOPPO小范围内测API版本7.AndesGPT OPPO20.Baichuan2-13B-Chat百川智能8.Moonshot(KimiChat)月之暗面搭载Moonshot的网页版本【KimiChat】21.XVERSE-13B-2-Chat元象科技9.Qwen-72B-Chat阿里巴巴开源的72B的Chat版本22.讯飞星火V3.0出门问问官方发布的API版本

2023年度中文大模型基准测评报告.pdf

1.SuperC10.序列猴子23.Minimax(应事)11.Yi-34B-Chat零一万物开源的34B的Chat版本24.ChatGLM3-6B12.PCI-TransGPT佳都科技小范围内测API版本360智脑的API升级版本Pro模型25.Chinese-Alpaca2-13B26.Llama_2_13B_Chat Meta机构简介阿里巴巴官方公开发布的API版本:qwen-max-longcontextAnthropic官方发布的API 2.0版本字节跳动官方网页版产品【豆包】Google官方发布的API版本Gemini-proGPT3.5官方API版本OpenAI阿里巴巴开源的14B的Chat版本开源的第二代13B的Chat版本开源的第二代13B的Chat版本科大讯飞官方发布的V3.0版本的API稀宇科技官方网页版产品【应事】清华&智谱AI开源的第三代6B版本yiming cui(个人开发者)个人开源的基于Llama2的汉化版中文模型官方开源的2代13B的Chat版本13.360GPT_Pro 360

2023年度中文大模型基准测评报告.pdf

注:计算分值为模型的OPEN分与OPT分值的差值,用以观察模型在主观题和客观题上的不同表现。通过对比模型在主观简答题OPEN和客观选择题OPT上的不同表现,可以发现,国内大模型多数擅长做选择题。普遍选择题的分数会高于简答题的分数。其中,文心一言4.0和智谱清言表现相对稳定,分别为(13.38)和(-14.01)。GPT-4 Turbo的表现最为稳定,差值仅有0.86。SuperCLUE认为,客观题相对主观题更容易通过题库形式进行训练和提升;同时也由于客观题中包含中文特性问题,中文模型自然有一定的优势,所以应该综合来看模型的评测效果。值得关注的是,在本次测评中,国外的代表性大模型如GPT4的不同版本、Claude2、Llama2都很好的稳定性表现,值得国内大模型进一步分析研究。[heading3]开源竞争格局

Others are asking
什么ai好用,目前主流ai有什么特点
目前主流的 AI 工具各有特点和用途: 邮件写作方面: Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能,易于使用,支持多种平台和语言,网站是 https://www.grammarly.com/ 。 Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句,界面简洁,重点突出,网站是 http://www.hemingwayapp.com/ 。 ProWritingAid:全面的语法和风格检查,提供详细的写作报告和建议,功能强大,支持多种平台和集成,网站是 https://prowritingaid.com/ 。 Writesonic:基于 AI 生成各种类型的文本,包括电子邮件、博客文章、广告文案等,生成速度快,网站是 https://writesonic.com/ 。 Lavender:专注于邮件写作优化,提供个性化建议和模板,帮助提高邮件打开率和回复率。 大语言模型方面: OpenAI 系统:包括 3.5 和 4.0 版本,3.5 模型在 11 月启动了当前的 AI 热潮,4.0 模型功能更强大。新的变种使用插件连接到互联网和其他应用程序,Code Interpreter 是一个强大的 ChatGPT 版本,可以运行 Python 程序。未为 OpenAI 付费只能使用 3.5 版本。微软的 Bing 使用 4 和 3.5 的混合,通常是 GPT4 家族中首个推出新功能的模型,连接到互联网。 谷歌:一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是 PaLM 2 模型。 Anthropic:发布了 Claude 2,其有一个非常大的上下文窗口,不太可能恶意行事。 对于刚入坑 AI 的学习路径: 第一步是带着好奇心去尝试,记住“生成”两个字。现在大部分人说的 AI 本质上是“生成式人工智能”Generative AI。可以随便找一个国产 AI 聊聊,比如小学奥数题、写演讲稿、对 996 的看法等,看看其擅长和不擅长的地方,有没有能帮助到自己的地方,哪些地方做得不够好。如果条件允许,也可以直接使用 ChatGPT 或者 Claude 处理复杂任务。
2025-01-24
目前在各个应用领域,主流的AI工具有哪些,请分别介绍.
以下是一些主流的 AI 工具及其应用领域的介绍: 1. AI 菜谱口味调整工具:如“下厨房口味调整功能”,使用自然语言处理和数据分析技术,市场规模达数亿美元。它能根据用户反馈调整菜谱口味,例如增加甜度、减少辣味等。 2. AI 语言学习纠错平台:像“英语流利说纠错功能”,运用自然语言处理和机器学习,市场规模达数十亿美元。可帮助语言学习者纠正发音、语法等错误,并提供纠正建议和练习。 3. AI 电影剧情分析系统:例如“豆瓣电影剧情分析工具”,借助数据分析和自然语言处理,市场规模达数亿美元。能够分析电影剧情,为用户提供深度解读。 4. AI 办公文件分类系统:比如“腾讯文档分类功能”,采用数据分析和机器学习,市场规模达数亿美元。可自动分类办公文件,方便管理。 5. AI 美容护肤方案定制平台:“美丽修行定制方案功能”,利用图像识别和数据分析,市场规模达数亿美元。能根据用户肤质定制护肤方案,包括产品推荐和使用顺序。 6. AI 游戏道具推荐系统:在一些游戏中的“游戏内商城推荐功能”,通过数据分析和机器学习,市场规模达数亿美元。可根据玩家需求推荐游戏道具,如武器、装备等。 7. AI 天气预报分时服务:“彩云天气分时预报”,运用数据分析和机器学习,市场规模达数亿美元。提供精准的分时天气预报,帮助用户更好地安排出行和活动。 8. AI 医疗病历分析平台:“医渡云病历分析系统”,借助数据分析和自然语言处理,市场规模达数十亿美元。可分析医疗病历,为医生提供辅助诊断建议。 9. AI 会议发言总结工具:“讯飞听见会议总结功能”,使用自然语言处理和机器学习,市场规模达数亿美元。能够自动总结会议发言内容,方便回顾和整理。 10. AI 书法作品临摹辅助工具:“书法临摹软件”,利用图像识别和数据分析,市场规模达数亿美元。帮助书法爱好者进行临摹,提供临摹指导和评价。 11. 超级简历优化助手:“AI 简历优化工具”,运用自然语言处理,市场规模达数亿美元。帮助用户优化简历,提高求职成功率。 12. 酷家乐等设计软件:“AI 室内设计方案生成”,借助图像生成和机器学习,市场规模达数十亿美元。能快速生成个性化室内设计方案。 13. Amper Music:“AI 音乐创作辅助工具”,采用机器学习和音频处理,市场规模达数亿美元。协助音乐创作者进行创作,可根据用户需求生成旋律和编曲。 14. 松果倾诉智能助手:“AI 情感咨询助手”,通过自然语言处理和情感分析,市场规模达数亿美元。为用户提供情感支持和建议,通过文字或语音交流。 15. 小佩宠物智能设备:“AI 宠物健康监测设备”,利用传感器数据处理和机器学习,市场规模达数十亿美元。可实时监测宠物健康状况,提供健康预警。 16. 马蜂窝智能行程规划:“AI 旅游行程规划器”,借助数据分析和自然语言处理,市场规模达数十亿美元。能根据用户需求生成个性化旅游行程。
2025-01-20
目前主流的AI大模型有哪些
目前主流的 AI 大模型主要有以下几种: 1. OpenAI 系列:包括 GPT3.5 和 GPT4 等。GPT3.5 在 11 月启动了当前的 AI 热潮,GPT4 功能更强大。ChatGPT 也属于 OpenAI 系列。 2. 微软 Bing:使用 GPT4 和 GPT3.5 的混合,通常是 GPT4 家族中首个推出新功能的模型,能创建和查看图像,还能在网页浏览器中阅读文档,并连接到互联网。 3. 谷歌 Bard:由各种基础模型驱动,最近是 PaLM 2 模型。 4. Anthropic Claude 2:其特点是有非常大的上下文窗口,不太可能恶意行事。 此外,大模型的架构也有所不同,如 encoderonly 模型(代表模型是 BERT)、encoderdecoder 模型(代表是 google 的 T5)、decoderonly 模型(适用于自然语言生成任务,如故事写作和博客生成,众多 AI 助手包括 ChatGPT 都属于此类)。大模型的“大”体现在预训练数据量大(往往来自互联网,包括论文、代码、公开网页等,一般用 TB 级别的数据进行预训练)和参数多(如 OpenAI 在 2020 年发布的 GPT3 就已达到 170B 的参数)。
2025-01-07
主流TTS-语音合成技术
语音合成(Speech Synthesis)是将文本转换为可听的声音信息,赋予了像人一样说话的能力,是人机交互的重要接口。一般而言,语音合成的概念比文语转换(TexttoSpeech,TTS)涵盖范围更广,包括 TTS、歌唱合成等领域,但多数情况下可混用。提供了一些端到端语音合成模型的样例,可感受目前语音合成的发展。 人类通过一整套发音器官合成语音,肺相当于动力源,喉相当于调制器,声道相当于滤波器,口唇相当于扩音器。研究人员提出以源滤波器(sourcefilter)模型为代表的多种模型建模该过程,语音中有清音和浊音,分别由声带周期性振动对应的周期声源和声带不振动时紊乱气流对应的非周期声源产生。 当代工业界主流语音合成系统包含文本前端和声学后端两部分。文本前端将输入文本转换为层次化的语音学表征,主要有文本规范化、韵律分析和文本转音素等模块。声学后端基于文本前端给出的层次化语言学表征生成语音,主要技术路线包括单元挑选波形拼接、统计参数和端到端语音合成方法,当代主要采用端到端声学后端。端到端声学后端通常包括声学模型和声码器两部分,也出现了直接从音素映射为波形的完全端到端语音合成系统。声学模型负责将语言学特征转换为中间声学特征(如梅尔频谱),直接决定合成语音的韵律;声码器将中间声学特征转换为语音波形,直接决定合成语音的音质。
2025-01-07
主流TTS-语音合成技术
语音合成(Speech Synthesis)是将文本转换为可听的声音信息,赋予了像人一样说话的能力,是人机交互的重要接口。一般而言,语音合成的概念比文语转换(TexttoSpeech,TTS)涵盖范围更广,包括 TTS、歌唱合成等领域,但多数情况下可混用。提供了一些端到端语音合成模型的样例,可感受目前语音合成的发展。 人类通过一整套发音器官合成语音,肺相当于动力源,喉相当于调制器,声道相当于滤波器,口唇相当于扩音器。研究人员提出以源滤波器(sourcefilter)模型为代表的多种模型建模该过程,语音中有清音和浊音,分别由声带周期性振动对应的周期声源和声带不振动时紊乱气流对应的非周期声源产生。 当代工业界主流语音合成系统包含文本前端和声学后端两部分。文本前端把输入文本转换为层次化的语音学表征,主要有文本规范化、韵律分析和文本转音素等模块。声学后端基于文本前端给出的层次化语言学表征(linguistics feature)生成语音,主要技术路线包括单元挑选波形拼接、统计参数和端到端语音合成方法,当代主要采用端到端声学后端。端到端声学后端通常包括声学模型和声码器两部分,也出现了直接从音素映射为波形的完全端到端语音合成系统。声学模型负责将语言学特征转换为中间声学特征(如梅尔频谱),直接决定合成语音的韵律;声码器将中间声学特征转换为语音波形,直接决定合成语音的音质。
2025-01-07
ai换装,目前主流工具有哪些
目前主流的 AI 换装工具包括:InterAlia(https://interalia.vcflab.org/)。需要注意的是,虽然底层都是大模型,但 AI 工具各有侧重,不同公司也会进行各自的优化。关于每一种工具的详细入门、讲解和应用,WayToAIG 已经分好了类目。
2025-01-02
以图生图有什么好用的模型
以下是一些好用的以图生图模型和相关产品: 1. Tusiart: 首页包含模型、帖子、排行榜,可查看不同模型的详细信息,如checkpoint、lora等。 checkpoint是生图必需的基础模型,lora是低阶自适应模型,可有可无,常用于控制细节。 还有ControlNet用于控制特定图像,VAE类似于滤镜可调整饱和度,以及Prompt提示词和负向提示词。 图生图功能可根据上传图片和所选模型等信息重绘。 2. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 3. Retrato:AI工具,可将图片转换为非凡肖像,有500多种风格选择,适合制作个性头像。 4. Stable Diffusion Reimagine:新型AI工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 5. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的AI工具,能将上传的照片转换为芭比风格。 需要注意的是,这些AI模型可能存在性能不稳定、生成内容不当等局限,使用时需仔细甄别。
2025-02-05
什么是AI大模型?
AI 大模型是一个复杂且涉及众多技术概念的领域。以下为您详细介绍: 1. 概念:生成式 AI 生成的内容称为 AIGC。 2. 相关技术名词及关系: AI 即人工智能。 机器学习是电脑找规律学习,包括监督学习(有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归)、无监督学习(学习的数据没有标签,算法自主发现规律,经典任务如聚类)、强化学习(从反馈里学习,最大化奖励或最小化损失,类似训小狗)。 深度学习是一种参照人脑有神经网络和神经元的方法(因有很多层所以叫深度),神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 是大语言模型。对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的 BERT 模型,可用于语义理解(如上下文理解、情感分析、文本分类),但不擅长文本生成。 3. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制(SelfAttention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。Transformer 比 RNN 更适合处理文本的长距离依赖性。
2025-02-05
大模型在数据分析上的应用
大模型在数据分析上有广泛的应用。 首先,了解一下大模型的基本概念。数字化便于计算机处理,为让计算机理解 Token 之间的联系,需将 Token 表示成稠密矩阵向量,即 embedding,常见算法有基于统计的 Word2Vec、GloVe,基于深度网络的 CNN、RNN/LSTM,基于神经网络的 BERT、Doc2Vec 等。以 Transform 为代表的大模型采用自注意力机制来学习不同 token 之间的依赖关系,生成高质量 embedding。大模型的“大”在于用于表达 token 之间关系的参数多,如 GPT3 拥有 1750 亿参数。 大模型因其强大能力,在多个领域有热门应用场景: 1. 文本生成和内容创作:撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手:进行自然对话,提供客户服务、日常任务提醒和信息咨询等。 3. 编程和代码辅助:自动补全、修复 bug 和解释代码,提高编程效率。 4. 翻译和跨语言通信:理解和翻译多种语言,促进不同语言背景用户的沟通和信息共享。 5. 情感分析和意见挖掘:分析社交媒体等中的文本,为市场研究和产品改进提供支持。 6. 教育和学习辅助:创建个性化学习材料、回答学生问题和提供语言学习支持。 7. 图像和视频生成:如 DALLE 等模型可根据文本描述生成相应图像,未来可能扩展到视频。 8. 游戏开发和互动体验:创建游戏角色对话、生成故事情节和增强玩家沉浸式体验。 9. 医疗和健康咨询:回答医疗相关问题,提供初步健康建议和医疗信息查询服务。 10. 法律和合规咨询:解读法律文件,提供合规建议,降低法律服务门槛。 大型模型主要分为两类:大型语言模型专注于处理和生成文本信息;大型多模态模型能处理包括文本、图片、音频等多种类型信息。二者在处理信息类型、应用场景和数据需求方面有所不同。大型语言模型主要用于自然语言处理任务,依赖大量文本数据训练;大型多模态模型能处理多种信息类型,应用更广泛,需要多种类型数据训练。 相对大模型,也有所谓的“小模型”,它们通常是为完成特定任务而设计。
2025-02-05
flux1-depth-dev模型存放路径
flux1depthdev 模型的存放路径如下: 1. 下载 flux1depthdev 模型放到 ComfyUI/models/diffusion_models/文件夹中。 夸克网盘:链接:https://pan.quark.cn/s/571d174ec17f 百度网盘:见前文 2. 也可以将 depth lora 模型存放到 ComfyUI/models/loras 文件夹中。 depth lora 模型:https://huggingface.co/blackforestlabs/FLUX.1Depthdevlora 3. 百度网盘中也有相关模型: 链接:https://pan.baidu.com/s/10BmYtY3sU1VQzwUy2gpNlw?pwd=qflr 提取码:qflr
2025-02-05
你目前使用的是哪个模型
以下是一些关于模型的信息: 在 Cursor Chat、Ctrl/⌘K 和终端 Ctrl/⌘K 中,您可以在 AI 输入框下方的下拉列表中选择要使用的模型。默认情况下,Cursor 已准备好使用的模型包括:、cursorsmall。您还可以在 Cursor Settings>Models>Model Names 下添加其他模型。cursorsmall 是 Cursor 的自定义模型,不如 GPT4 智能,但速度更快,用户可无限制访问。 在 Morph Studio 中,支持以下模型生成视频: TexttoVideoMorph0.1:内部文本到视频生成模型,默认具有逼真色调,可通过描述性形容词修改拍摄风格和外观。 ImagetoVideoMorph0.1:内部图像到视频生成模型,用文本提示引导效果更好,使用时可不输入文本,在角色特写和对象动画方面表现较好。 VideotoVideoMorph0.1:内部风格转换模型,支持在文本提示下进行视频到视频的渲染,可将视频风格更改为预设,同时保留原始视频的字符和布局。 ImagetoVideoSVD1.1:由 Stability.ai 提供支持的图像到视频模型,适用于构图中有清晰层次的镜头(风景镜头、B 卷等)。 文本到视频形态0.1 被设置为新创建射击卡的默认模型,型号选择会根据是否上传图像或视频而更改,每个模型有自己的一组参数可供调整,如相机运动(支持静态、放大、缩小、向左平移、向右平移、向上平移、向下平移、顺时针旋转和逆时针旋转,未来将支持一次选择多个相机移动选项)、时间(支持最多 10 秒的视频生成,默认持续时间为 3 秒)。 ComfyUI instantID 目前只支持 sdxl。主要的模型需下载后放在 ComfyUI/models/instantid 文件夹(若没有则新建),地址为:https://huggingface.co/InstantX/InstantID/resolve/main/ipadapter.bin?download=true 。InsightFace 模型是 antelopev2(不是经典的 buffalo_l),下载解压后放在 ComfyUI/models/insightface/models/antelopev2 目录中,地址为:https://huggingface.co/MonsterMMORPG/tools/tree/main 。还需要一个 ControlNet 模型,放在 ComfyUI/models/controlnet 目录下,地址为:https://huggingface.co/InstantX/InstantID/resolve/main/ControlNetModel/diffusion_pytorch_model.safetensors?download=true 。上述模型网络环境不好的,可在网盘 https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy 下载。
2025-02-05
图生图美食模型
以下是关于图生图美食模型的相关知识: 概念与功能说明: 首页模型、帖子、排行榜:展示其他用户生成的模型、图片。不同模型有 checkpoint 和 lora 两种标签,部分还有 SDXL 标签。点击可查看模型详情,下方有返图区。 基础模型(checkpoint):生图必需,任何生图操作都要先选定。 lora:低阶自适应模型,类似 checkpoint 的小插件,可控制细节,权重可调整。 ControlNet:控制图片中特定图像,如人物姿态、特定文字等,高阶技能。 VAE:编码器,类似滤镜,调整生图饱和度,可无脑选 840000。 Prompt 提示词:描述想要 AI 生成的内容。 负向提示词(Negative Prompt):描述想要 AI 避免产生的内容。 图生图:上传图片后,SD 会根据图片、所选模型、输入的 prompt 等信息重绘,重绘幅度越大,输出图与输入图差别越大。 简明操作流程(文生图): 定主题:确定生成图片的主题、风格和表达信息。 选择基础模型(checkpoint):按主题找贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora 控制图片效果和质量。 ControlNet:高阶技能,可控制特定图像。 局部重绘:下篇再教。 设置 VAE:选 840000。 Prompt 提示词:用英文写需求,单词、短语组合,用英文半角逗号隔开。 负向提示词(Negative Prompt):用英文写避免的内容,单词、短语组合,用英文半角逗号隔开。 采样算法:如选 DPM++2M Karras,留意 checkpoint 详情页作者推荐的采样器。 采样次数:根据采样器特征,选 DPM++2M Karras 时,采样次数在 30 40 之间。 尺寸:根据个人喜好和需求选择。
2025-02-04
国外用户数最多的ai工具
根据所提供的内容,国外访问量最大的 AI 工具中,ChatGPT 独占 140 亿流量,占总流量的 60%。Writerbuddy AI 分析了 3000 多种 AI 工具,选出访问量最大的 50 个工具,共产生超过 240 亿次访问量,且 AI 行业每月增长 2.363 亿访问量,这 50 个工具增长率达 10.7 倍。在分析的前 50 名 AI 工具的地理行为方面,中国排名第 47 位。美国在顶级 AI 公司数量方面领先,欧洲以及澳大利亚和加拿大在 AI 投资和采用方面落后,所有欧盟国家合计产生了 39 亿流量,占总量的 16.21%。
2025-01-29
现在国内国外与cursor和windsurf自动补全代码的ai比肩的产品有哪些,而且可以免费使用
以下是一些与 Cursor 和 Windsurf 自动补全代码功能比肩的产品,且部分可以免费使用: 1. Deepseek:网址为 https://www.deepseek.com/zh ,国内能访问,网页登录方便,目前完全免费。 2. 通义灵码:在 Pytharm 中通过“文件”“设置”“插件”搜索安装(目前免费)。 3. JetBrains 自身的助手插件:在 Pytharm 中通过“文件”“设置”“插件”搜索安装(收费,目前有 7 天免费试用)。 4. Wing Python IDE Pro:https://wingware.com/ ,是一款专为 Python 编程设计的开发环境,年度许可证起价 179 美元/月。 5. Smol Developer:https://github.com/smolai/de ,是一个开源的 AI 开发助手,遵循 MIT 许可证。 6. Cody:https://about.sourcegraph ,个人使用免费。
2025-01-16
superclue 在国内的评测里面什么地位,国外对标的评测是什么
在国内的评测中,SuperCLUE 是大模型时代 CLUE 基准的发展和延续,聚焦于通用大模型的综合性测评。在 SuperCLUE 测评中,国外模型的平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右。国内外的平均水平差距在缩小,11 月差距在 10 分左右。 SuperCLUE 是中文语言理解测评基准 CLUE 的发展,发起于 2019 年,陆续推出了多种广为引用的测评基准。它根据多年的测评经验,构建了多层次、多维度的综合性测评基准。SuperCLUE 始终秉持中立、客观的第三方测评理念,采用自动化方式的客观评估,降低评测过程中的人为评估的不确定性。 国外对标的评测没有明确提及。
2025-01-07
你是国产的大模型还是国外的
目前国内外大模型的发展情况如下: 国内外差距依然明显,GPT 4 Turbo 总分 90.63 分遥遥领先,国内最好模型文心一言 4.0(API)总分 79.02 分,与 GPT 4Turbo 有 11.61 分差距,与 GPT 4(网页)有 4.9 分差距。但过去 1 年国内大模型有长足进步,综合能力超过 GPT 3.5 和 GeminiPro 的模型有 11 个,如百度的文心一言 4.0、阿里云的通义千问 2.0 等。 在 SuperCLUE 测评中,国外模型平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距在 4 分左右,不过平均水平差距在缩小,11 月差距在 10 分左右。 国内开源模型在中文上表现好于国外开源模型,如百川智能的 Baichuan213BChat 等。 在语言与知识的测评中,GPT4 Turbo 依然领先,是唯一超过 90 分的大模型。国内大模型也表现相对较好,OPPO 的 AndesGPT、阿里云的通义千问 2.0 等较为接近 GPT4。 国内大模型在中文语言与知识能力上已基本追赶上国外头部大模型。 此外,新用户可在阿里、腾讯官网获取免费试用服务器,如腾讯云的轻量应用服务器、阿里云的服务器 ECS,服务器系统配置选择宝塔系统。免费大模型接口方面,国内有阿里的通义千问大模型、智谱 AI(ChatGLM)、科大讯飞(SparkDesk)等,均有限制一定免费额度的 Token。国外有谷歌的 Gemini 大模型、海外版 Coze 的 GPT4 模型,免费且能图片识别,但需要给服务器挂梯子,具体操作可参考相关教程。
2025-01-04
国外最著名的10个AI,可免费使用的
以下是国外 10 个可免费使用的著名 AI: 1. Langfuse:大模型应用的开源追踪和分析工具,提供开源可观测性和分析功能,可在可视化界面中探索和调试复杂的日志和追踪,使用直观的仪表板改善成本、降低成本、减少延迟,提高响应质量。 2. Eden AI:将顶尖 AI API 融合为一,能为每项 AI 任务选择正确的 AI API 来提高准确性和降低成本,集中管理使用限制和成本监测,并不断探索市场上新兴的 AI 能力。 3. Langdock:能在几分钟内创建、部署、测试和监控 ChatGPT 插件,将 API 连接到 Langdock,并将其作为插件部署到所有大模型应用中,然后使用内置的测试功能来确保一切按预期工作,并在插件扩展时进行监控。 4. LLM Spark:用于构建生产就绪大模型应用的开发平台。 5. Civitai:开源生成式人工智能的家园,提供模型托管、图像/视频生成和模型训练服务,已发展成为一个拥有 650 万月活跃成员的社区。 6. KLING AI:下一代一站式人工智能创作平台,拥有强大的人工智能图像和视频生成能力,通过提示和图像激发创造力,制作出完美模拟现实世界的图像和视频,具有先进的文本理解能力、精细的细节处理和多种风格。 7. Viggle:允许用户通过 3D 视频基础模型 JST 指定角色的动作,创作者、品牌和电影制作人可以轻松地替换角色、复制动作并将他们的想法变为现实。 8. Hailuo Video by MiniMax:强大的人工智能驱动的视频生成引擎,能将简单文本转换为生动、专业品质的视频,将静态图像转换为动态视觉故事。 9. Hedra:开创性的视频基础模型公司,正在构建一个能够实现控制、情感和创造性智能的全栈创作工作室。 10. Bing:在写东西方面是最佳免费选项之一。 11. Claude 2:在写东西方面是免费选项之一。
2024-12-31
国外最著名的5个AI
国外著名的 AI 包括以下几个: 1. OpenAI 开发的 ChatGPT,具备强大的推理能力,能够根据上下文和文件提供详细分析和意见。 2. Stability AI 发布的 Stable Video Diffusion,是第一个能够从文本提示生成高质量、真实视频的模型之一,在定制化方面有显著进步。 3. OpenAI 的 Sora,能够生成长达一分钟的视频,同时保持三维一致性、物体持久性和高分辨率。 4. Google DeepMind 的 Veo,能将文本和可选图像提示与嘈杂压缩视频输入相结合,创建独特的压缩视频表示。 5. Rockset,刚被 OpenAI 收购,提供实时搜索和分析数据库服务。
2024-12-31
比较好用的PPT制作AI
以下是一些比较好用的 PPT 制作 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 在体验方面,有人认为 gamma 最好用,只要提供了内容框架,生成的 PPT/网页审美水平最高。此外,WPS AI 也表现出色,能帮助生成 PPT 大纲并进行优化,还能根据用户要求修改主题配色和字体。
2025-02-05
AI画图工具哪些比较好
以下是一些比较好的 AI 画图工具: 1. Lucidchart:流行的在线绘图工具,支持多种视图的创建,包括逻辑视图、功能视图和部署视图,具有拖放界面、支持团队协作和实时编辑、丰富的模板库和自动布局功能,官网:https://www.lucidchart.com/ 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,包括逻辑视图、功能视图和部署视图。 3. ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图的创建,可与 Archi 工具配合使用,该工具提供图形化界面创建模型。 4. Enterprise Architect:强大的建模、设计和生成代码的工具,支持创建多种架构视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现在称为 diagrams.net):免费的在线图表软件,允许创建各种类型的图表,包括逻辑视图和部署视图等,支持本地和云存储,多种图形和模板,易于创建和分享图表,可与多种第三方工具集成,官网:https://www.diagrams.net/ 7. PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 9. Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 此外,以下是一些用于绘制示意图的 AI 工具: 1. Lucidchart:集成 AI 功能,可自动化绘制流程图、思维导图、网络拓扑图等多种示意图,具有拖放界面,易于使用,支持团队协作和实时编辑,丰富的模板库和自动布局功能,官网:https://www.lucidchart.com/ 2. Microsoft Visio:专业的图表绘制工具,适用于复杂的流程图、组织结构图和网络图,其 AI 功能可帮助自动化布局和优化图表设计,集成 Office 365,方便与其他 Office 应用程序协同工作,丰富的图表类型和模板,支持自动化和数据驱动的图表更新,官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware 3. Creately:在线绘图和协作平台,利用 AI 功能简化图表创建过程,适合绘制流程图、组织图、思维导图等,具有智能绘图功能,可自动连接和排列图形,丰富的模板库和预定义形状,实时协作功能,适合团队使用,官网:https://creately.com/ 4. Whimsical:专注于用户体验和快速绘图的工具,适合创建线框图、流程图、思维导图等,具有直观的用户界面,易于上手,支持拖放操作,快速绘制和修改图表,提供多种协作功能,适合团队工作,官网:https://whimsical.com/ 5. Miro:在线白板平台,结合 AI 功能,适用于团队协作和各种示意图绘制,如思维导图、用户流程图等,具有无缝协作,支持远程团队实时编辑,丰富的图表模板和工具,支持与其他项目管理工具(如 Jira、Trello)集成,官网:https://miro.com/ 使用 AI 绘制示意图的步骤: 1. 选择工具:根据具体需求选择合适的 AI 绘图工具。 2. 创建账户:注册并登录该平台。 3. 选择模板:利用平台提供的模板库,选择适合需求的模板。 4. 添加内容:根据需求添加并编辑图形和文字,利用 AI 自动布局功能优化图表布局。 5. 协作和分享:如果需要团队协作,可以邀请团队成员一起编辑。完成后导出并分享图表。
2025-02-04
我想找一款合适的ai视频剪辑模型,请帮我推荐一下,并比较各自的优劣
以下为您推荐几款 AI 视频剪辑模型,并比较它们的优劣: 1. Pika: 优点:对奇幻感较强的画面把控出色,自然度高;更新的唇形同步功能集成到平台上便捷。 缺点:真实环境画面容易糊。 2. Pixverse: 优点:在高清化方面有优势,对偏风景和纪录、有特定物体移动的画面友好。 缺点:生成的视频存在帧率问题,处理人物时易有慢速播放的感觉。 3. Runway: 优点:在真实影像方面质感好,战争片全景镜头处理出色,控件体验感较好。 缺点:特别爱变色,光影不稳定。 4. MiniMax 海螺 AI: 优点:文生视频制作便捷高效,能提供多元创作思路。 缺点:较难保证主体/画面风格的稳定性,实际使用场景多为空镜头/非叙事性镜头/大场面特效镜头的制作。 在实际使用中,您可以根据不同工具对画面的处理能力进行组合使用。例如,需要奇幻感强、人物表情自然的画面可用 Pika 生成;物体滑行运动可用 Pixverse 生成;有手部特殊运动的画面可用 Runway 辅助完成。
2025-02-03
国内有什么写代码比较好用的模型吗(除了deepseek)
国内写代码比较好用的模型除了 DeepSeek 外,还有零一万物、知谱 AI 和阿里巴巴开发的模型,它们在 LMSYS 排行榜上取得了优异成绩,尤其在数学和编程方面表现出色。此外,国产开源模型 DeepSeekV3 也具备出色的性能,其性能接近顶尖闭源模型 Claude 3.5Sonnet,在知识、长文本和数学任务上均有显著提升,生成速度可达每秒 60 个令牌。
2025-02-02
我是个小白,我如何开始学习比较好
对于小白来说,开始学习 AI 可以参考以下步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库查看大家实践后的作品、文章分享,并分享自己实践后的成果。 5. 体验 AI 产品: 与现有的 AI 产品(如 ChatGPT、Kimi Chat、智谱、文心一言等)进行互动,了解其工作原理和交互方式。 此外,根据电脑的硬件情况和自身财力选择合适的开始方式: 1. 本地部署:如果电脑是 M 芯片的 Mac 电脑(Intel 芯片出图速度非常慢,因此不建议)或者 2060Ti 及以上显卡的 Windows 电脑,可以选择本地部署。强烈建议在配有 N 卡的 Windows 电脑上进行。 2. 在线平台:对于电脑不符合要求的小伙伴可以直接使用在线工具,在线工具分为在线出图和云电脑两种,前者功能可能会受限、后者需要自己手动部署,大家根据实际情况选择即可。 不建议一上来就配主机,玩几个月后还对 AI 有兴趣的话再考虑配个主机。主机硬盘要大,显卡预算之内买最好,其他的随意。 先验经验方面,需要熟练使用文生图、图生图;需要有一定的逻辑思考能力以及推理能力;适合炼丹新人、小白。课程大约 70 80%是理论和方法论的内容,大部分练习会在课外跟大家沟通、练习。只有少部分必要内容会在课上演示。 必学、必看内容是基础课,主要是为了解决环境问题和软件安装不上的问题;建炉是针对不同炼丹方式提供了不同的炼丹工具的安装教程;正式的内容部分分为了数据集预处理、模型训练以及模型调试及优化三个部分。 小白的第一课是读文档,若没看懂,可使用提示词让 GPT 换种说法解释或举例。可以点击链接查看对话原文,顶部的问题可以复制,然后作为 prompt 自己去提问来自测是否真的读懂。下一节会带来 prompt 小白系列课程(二)如何开始练习有效提问。
2025-02-02
现在AI编程始终不能编写一些比较大的项目
目前 AI 编程在处理较大项目时存在一些限制,主要原因包括: 1. 上下文窗口限制:复杂项目需要全局理解,AI 难以设计架构和模块化。 2. 自然语言描述不精确:项目需求常需反复讨论才能明确,AI 难以完全掌握。 3. 无法感知环境和直接执行:编译、部署、调试等复杂任务 AI 难以独立完成。 4. 幻觉问题:AI 可能编造不存在的 API 或错误代码,需人工严格审查。 在实际应用中,对于一些简单需求,我们可以给 AI 下达明确命令来完成一次性任务,如制作简单的 Chrome 插件、编写脚本或创建 Python 爬虫。但当期待提高,希望从繁琐日常任务中解脱时,需要了解 AI 编程的边界和限制。 在选择解决方案时,应遵循一定的准则: 1. 优先找线上工具,例如制作白底图等功能,若线上有现成工具最好。 2. 其次找插件,基于现有系统找合适的插件。 3. 最后是本地应用,当线上工具和插件都不满足需求时,再考虑本地应用。 对于 API 功能,先找现成的开源工具,GitHub 上有很多。然后考虑付费服务。只有在都找不到现成方案时,才考虑自己编程,且编程时要以终为始,抛开技术障碍,聚焦于目标。
2025-01-25