直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

你是哪家的哪个大模型的哪个版本

回答

以下是一些常见的大模型及其版本:

  • PCI-TransGPT 佳都科技小范围内测 API 版本。
  • Chinese-Alpaca2-13B,由 yiming cui(个人开发者)开发,是个人开源的基于 Llama2 的汉化版中文模型。
  • 360GPT_Pro 是 360 智脑的 API 升级版本 Pro。
  • Llama_2_13B_Chat 是 Meta 官方开源的 2 代 13B 的 Chat 版本。

此外,还有:

  • 百川 2 大模型中的 Baichuan2-7B-Chat 版本。
  • 360 安全大模型目前发展到 3.0 初级版本,只依赖大模型本身的能力,用于攻击事件的检测和发现,在恶意流量分析和恶意邮件检测效果方面全面超越 GPT 4。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

2023年度中文大模型基准测评报告.pdf

[title]VIRTUAL中文大模型基准测评2023年度报告[heading2]测评模型列表[heading3]12.PCI-TransGPT佳都科技小范围内测API版本25.Chinese-Alpaca2-13B yiming cui(个人开发者)个人开源的基于Llama2的汉化版中文模型13.360GPT_Pro 360 360智脑的API升级版本Pro26.Llama_2_13B_Chat Meta官方开源的2代13B的Chat版本本次测评数据选取了SuperCLUE-12月测评结果,模型选取了国内外有代表性的26个大模型在12月份的版本。SuperCLUE模型象限

创作:基于百川大模型向微信群大佬们虚心学习

这里我们选用Baichuan2-7B-Chat的版本(预训练模型也可在文末网盘中下载),使用LLaMA-Efficient-Tuning训练框架,根据自己的cuda版本安装pytorch,安装bitsandbytes做量化服务

周鸿祎免费课AI系列课程第二讲-企业如何拥抱AI

360作为国内唯一又懂大模型又懂安全的双料厂商,我们要解决大模型的安全问题,必须亲自躬身入局。我的想法是以“模法”打败魔法,因为大模型越来越智能,它的安全问题肯定不是用传统安全的路子来解决,所以我们提出了以模制模的理念。我们打造一个专业的聪明的大模型,它没有别的能力,就用来盯着其他大模型,如果发现有不安全的因素输出,或者不轨的行为,对其他大模型的行为进行分析和监控。目前这个大模型是个初级版本,只发展到3.0。我们只依赖大模型本身的能力,就是说不依赖外部工具,不依赖微调,也就是没有作弊。现在有些大模型测试很容易作弊,你提前把考题头天晚上做一遍,第二天去考试怎么也能考个七八十分。我们就在恶意流量分析和恶意邮件检测效果方面,全面超越GPT 4。再跟360积累了很多年的工具做结合,你让这个大模型写诗写不出来,奥数题也回答不了,它只干一件事——攻击事件的检测和发现。

其他人在问
国内哪家智能驾驶做的最好
目前国内有多家企业在智能驾驶领域表现出色,但很难确切地说哪家是最好的。一些在智能驾驶方面具有较强实力和影响力的企业包括百度、华为、小鹏汽车、蔚来汽车等。这些企业在技术研发、实际应用和市场表现等方面都各有优势和特点。百度在自动驾驶技术的研发和测试方面投入较大,并取得了一定的成果;华为凭借其在通信和技术领域的积累,为智能驾驶提供了相关的解决方案;小鹏汽车和蔚来汽车等新兴造车势力也在智能驾驶的功能和体验上不断创新和优化。然而,智能驾驶技术仍在不断发展和演进,各企业的表现也会随着时间和市场的变化而有所不同。
2024-09-18
你使用的是哪家基础大模型?
目前常见的基础大模型包括: Fooocus 程序默认用到了 3 个 SDXL 的模型,分别是一个 base,一个 Refiner,和一个 LoRA。其大模型(base 和 Refiner)默认放在:Fooocus_win64_1110\\Fooocus\\models\\checkpoints;LoRA 模型默认放在:Fooocus_win64_1110\\Fooocus\\models\\loras。如果单独安装,需要下载三个模型:SDXL 基础模型:https://huggingface.co/stabilityai/stablediffusionxlbase1.0/resolve/main/sd_xl_base_1.0_0.9vae.safetensors;refiner 模型:https://huggingface.co/stabilityai/stablediffusionxlrefiner1.0/resolve/main/sd_xl_refiner_1.0_0.9vae.safetensors;LoRA 模型:https://huggingface.co/stabilityai/stablediffusionxlbase1.0/resolve/main/sd_xl_offset_examplelora_1.0.safetensors。如果部署了 SD 秋叶包,也可以共用模型(大模型和 LoRA),可在 Fooocus_win64_1110\\Fooocus\\modules\\path.py 中修改路径为秋叶包模型对应的路径。配置好后点击 run.bat 文件启动。 在大型语言模型方面,主要有以下几家:OpenAI 制作了 GPT3.5 和 GPT4,它们驱动了 ChatGPT 和微软的 Bing(在 Edge 浏览器上访问);Google 在 Bard 的标签品牌下有各种模型;Anthropic 制造了 Claude 和 Claude 2。 每个微调工作都从一个默认为 curie 的基本模型开始,模型可以是 ada、babbage、curie 或 davinci。您可以使用 OpenAI CLI 开始微调工作,具体操作及相关注意事项如上述说明。
2024-09-09
AI浏览器哪家强
以下是关于 AI 浏览器的相关信息: 最佳免费选项:必应(https://www.bing.com/search?q=Bing+AI&showconv=1&FORM=hpcodx)。通常来说,付费选项中必应也是较好的。 对于儿童,来自可汗学院的 Khanmigo(https://www.khanacademy.org/khanlabs)提供由 GPT4 驱动的良好的人工智能驱动辅导。 需注意,如果打算使用人工智能作为搜索引擎,存在幻觉风险,大多数人工智能未连接到互联网。不过根据最近的一项试点研究,在某些情况下,如技术支持、决定在哪里吃饭或获得建议,必应通常比谷歌更好。 360AI 浏览器:用户浏览提效需求迫切,希望浏览器能够把深度文件、长视频自动看一遍,总结核心要点和高潮片段,从而实现学习工作效率提升。今年浏览器的很多功能被 APP 取代,要赋予浏览器新的概念,将其变成学习工具。官网地址:ai.se.360.cn
2024-09-07
交互问诊式ai哪家强
出门问问是一家在交互问诊式 AI 领域表现出色的公司。它以生成式 AI 和语音交互为核心,为全球多个国家和地区提供 AI 智能硬件、AI 政企服务,以及面向创作者的 AIGC 工具。公司致力于打造国际领先的通用大模型,通过 AI 技术、产品及商业化三位一体发展,成为全球 AI CoPilot 的引领者。 此外,亲爱的 AI 爱好者们,以下产品均可以通过注册账号+输入 CDK(WaytoAGI),进行 VIP 兑换福利。一起用 AI 玩起来吧!
2024-08-23
WaytoAGI 背后使用的知识库模型算法是哪家的
WaytoAGI 是基于 Aily 和云雀大模型开发的人工智能,其中: Aily 是飞书团队旗下的企业级 AI 应用开发平台,提供了一个简单、安全且高效的环境,帮助企业轻松构建和发布 AI 应用,推动业务创新和效率提升。 云雀是字节跳动研发的语言模型,通过便捷的自然语言交互,能够高效的完成互动对话、信息获取、协助创作等任务。
2024-05-28
国内MJ绘画都是套壳公司吗?哪家的MJ使用效果最好
Midjourney(MJ)是一款人工智能绘图工具,它是基于Discord平台运行的。由于Midjourney的服务器架设在国外,国内用户直接访问可能会遇到一些障碍。因此,一些国内的公司或个人可能会购买Midjourney的服务,并在此基础上开发自己的用户界面,提供更符合国内用户习惯的服务,这些通常被称为“套壳”。 并非所有的MJ绘画服务提供者都是套壳公司。有些可能是直接接入了Midjourney的官方服务,而另一些可能是使用了类似的AI技术来提供服务。用户在选择使用哪家的服务时,需要注意以下几点: 1. 宣传的真实性:一些套壳网站可能会声称自己是Midjourney的中文版官网,但实际上并没有中文版官网存在。 2. 价格:根据Midjourney官方的收费标准,如果国内的服务价格过低,可能需要警惕其服务质量或真实性。 3. 试用体验:建议选择可以低成本试用的服务提供者,以验证其服务效果。 4. 售后服务:选择有客服联系方式的服务商,以便在遇到问题时能够得到及时的帮助。 至于哪家的MJ使用效果最好,这取决于个人的需求和体验。一些用户可能会根据价格、操作便利性、生成图像的质量等因素来选择服务商。由于Midjourney不断更新和改进,建议用户关注最新的用户反馈和评价,以及官方发布的信息,来做出选择。同时,也可以考虑试用几个不同的服务,亲自体验后决定哪个最符合自己的需求。
2024-05-24
AI 指令精调版本是什么意思
AI 指令精调版本指的是:对于在通用数据集上预训练的模型,进行复制后,以这些学习到的权重为起点,在新的特定领域数据集上重新训练模型。这种技术在很多不同的用例中都非常有效。 指令调整可以使模型更好地遵循指令。例如在生成式人工智能项目中,对于一个预训练过的模型,可以通过微调来获得更好的回答。在大型语言模型中,通过在格式化为指令的任务混合物上对模型进行微调,可以获得并增强遵循提示的能力。经过指令调整的模型能够更准确地遵循指令,在未见任务上的表现显著优于未调整的模型,将大型语言模型转变为通用任务解决器,是 AI 发展历史上的一个范式转变。 但当对大型语言模型(LLM)进行微调时,会遇到一些挑战。因为 LLM 规模较大,更新每个权重可能需要很长时间的训练工作,同时还涉及到为这个巨大模型提供服务的麻烦和成本等问题,所以微调大型语言模型可能不是最佳选择。
2024-09-19
chatgpt最新版本
ChatGPT 是一种基于 GPT 架构的人工智能模型,由 OpenAI 开发。目前 ChatGPT 官网有三个版本,分别是 GPT3.5、GPT4 和 ChatGPT 4o。GPT3.5 是免费版本,拥有 GPT 账号即可使用,但智能程度相对较低,且无法使用 DALL.E3 等插件。GPT4 和 ChatGPT 4o 则功能更强大,知识更新也更及时。想要使用更多功能更智能的版本,需要升级到 PLUS 套餐,收费标准为 20 美金一个月。此外,GPT4 还有团队版和企业版,费用更高,功能也更多。在注册 ChatGPT 账号之前,建议先注册一个谷歌账号,以便日后使用。
2024-06-30
我看到的经验介绍是通过不断迭代Prompt版本来训练适合自己的LLM功能,这合理吗?
合理。因为LLM 应用优化是个迭代过程,应该不断尝试:尝试>验证>再尝试>再迭代。通过 prompt 工程(或结合 RAG)先获取第一批高质量输入输出数据,然后微调模型,模型性能提升后,数据质量进一步提升,将更优质的数据用于模型训练,然后更好的模型产出更好的数据,如此循环,构建正向迭代循环(也称数据飞轮)。
2024-04-20
国内外好用的图生视频模型
以下是一些国内外好用的图生视频模型: 可灵(国内,免费) 网址:https://klingai.kuaishou.com/ 支持文生视频、图生视频。 支持图生视频首尾帧功能。 提示词可使用中文。 文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸。 图生视频除了不可运镜控制以外,其他跟文生视频基本相同。 默认生成 5s 的视频。 ETNA(国内) 网址:https://etna.7volcanoes.com/ 由七火山科技开发的文生视频 AI 模型。 可以根据用户简短的文本描述生成相应的视频内容。 生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps。 文生视频,支持中文,时空理解。 关于可灵的文生视频效果,测试者 Austin 周安鑫进行了以下测试: 1. 场景识别:包括室内和室外,如客厅的沙发、液晶电视、漂亮的波斯猫、超现实主义的蜿蜒河流、茂密森林、灿烂花海、碧绿草坪等。 2. 物体识别:涵盖静态和动态物体,如水晶球、跳动的火焰、翱翔的飞鸟、闪烁的流星、飞溅的水珠等。 3. 人物识别:包括面部和姿态,如一个人笑容灿烂、一个人惊恐愤怒,一位芭蕾舞女孩在冰面上跳舞等。 4. 动作识别:包含基本和复杂动作,如短跑运动员快速奔跑、赛车手驾驶跑车激烈漂移等。 5. 事件检测:有简单和复杂事件,如一位帅哥在喝水、外星文明和地球进行星际大战等。 6. 环境变化:涉及光线和天气,如奇幻的极光舞动变幻、城市写字楼灯光忽明忽暗、闪电交加、乌云密布、台风、大雨等。 7. 多对象场景:包括单一和多对象场景,如 1 个飞行员驾驶战斗机翱翔太空、海军指挥航母战斗群展开激烈战斗等。 8. 特殊场景:有遮挡和非标准场景,如城市大雾遮挡摩天大楼、一边是神秘海底世界,一边是梦幻糖果屋。 9. 细节检测:包含小物体和微表情,如崭新的苹果电脑屏幕上播放电影、瞳孔收缩、脸颊泛红、嘴唇微微颤抖。
2024-09-19
你自己使用的是什么模型
以下是关于模型的相关信息: 新的 gpt3.5turbo 模型针对会话进行了优化,原始的 GPT3.5 模型针对文本补全进行了优化。 用于创建嵌入和编辑文本的端点有自己的一组专用模型。 在 AI 输入框下方有一个下拉列表,允许选择要使用的模型。默认情况下,Cursor 已准备好使用的模型包括:GPT4o、GPT4、Claude 3.5 Sonnet、cursorsmall。其中,cursorsmall 是 Cursor 的自定义模型,不如 GPT4 智能,但速度更快,用户可无限制访问。您可以在 Cursor Settings > Models > Model Names 下添加其他模型。 谷歌一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是名为 PaLM 2 的模型。 Anthropic 发布了 Claude 2,其最值得注意的是有非常大的上下文窗口,与其他大型语言模型相比,不太可能恶意行事。
2024-09-19
推荐下好用的具备图像OCR能力的大模型
目前在具备图像 OCR 能力的大模型方面,一些较为知名和好用的包括百度的文心大模型、阿里云的通义大模型等。但大模型的性能和适用场景可能会因具体需求和使用场景的不同而有所差异。您可以根据自己的具体需求进一步评估和选择。
2024-09-19
AI 大模型命名 带有-instruct的含义
AI 大模型中带有“instruct”通常与指令微调相关。在大模型的训练过程中,指令微调是其中一个重要阶段。此阶段模型被训练以理解并执行具体指令,例如翻译文本等,从而能够回答问题。指令微调阶段输入的内容通常包括三个部分,如“Instruct:请你翻译下面这段话”“Input:一段英文”“Output:一段中文”。通过指令微调,模型能够更好地按照人类的期望和具体要求进行输出。
2024-09-19
你是基于哪个AI大模型的
我是 WaytoAGI 专属问答机器人,基于 Aily 和云雀大模型。 Aily 是飞书团队旗下的企业级 AI 应用开发平台,提供了简单、安全且高效的环境,帮助企业轻松构建和发布 AI 应用,推动业务创新和效率提升。 云雀是由字节跳动研发的语言模型,通过便捷的自然语言交互,能够高效地完成互动对话、信息获取、协助创作等任务。 此外,还有一些免费的大模型接口,如阿里的通义千问大模型接口,可创建 API key。智谱 AI(ChatGLM)、科大讯飞(SparkDesk)也有免费接口,但国内的大模型大多限制一定免费额度的 Token。 谷歌的 Gemini 大模型(gemini 1.5)、海外版 Coze 的 GPT4 模型是免费且能图片识别,但需要给服务器挂梯子。想使用的话,可参考张梦飞同学写的教程。 在深入了解 AI 运作原理和众多落地产品后,重新思考 AI 大模型引发的变革。此前曾有疑问,大模型与智能语音技能的 NLU 存在差异。语音技能 NLU 是通过一系列规则、分词策略等训练而成,运作逻辑规律可观测,具有 ifelse 式逻辑性。而大模型凭借海量数据在向量空间中学习知识的关联性形成,运作逻辑难以观测,脱离了 ifelse 的层面。
2024-09-19
如果我需要一名助手帮我运营跨境电商的线上店铺,我需要一些精准的关键词就可以训练模型吗?
训练模型来协助运营跨境电商线上店铺,仅依靠一些精准的关键词通常是不够的。模型的训练需要多方面的数据和信息,包括但不限于产品的详细描述、客户的评价和反馈、市场趋势、竞争对手的情况等。精准的关键词可以作为其中的一部分输入,但不足以全面有效地训练模型以达到理想的辅助运营效果。
2024-09-19