Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

国内有什么写代码比较好用的模型吗(除了deepseek)

Answer

国内写代码比较好用的模型除了 DeepSeek 外,还有零一万物、知谱 AI 和阿里巴巴开发的模型,它们在 LMSYS 排行榜上取得了优异成绩,尤其在数学和编程方面表现出色。此外,国产开源模型 DeepSeek-V3 也具备出色的性能,其性能接近顶尖闭源模型 Claude 3.5-Sonnet,在知识、长文本和数学任务上均有显著提升,生成速度可达每秒 60 个令牌。

Content generated by AI large model, please carefully verify (powered by aily)

References

2024人工智能报告|一文迅速了解今年的AI界都发生了什么?

Llama 3.1是迄今为止最大版本,其在推理、数学、多语言和长上下文任务中能够与GPT-4相抗衡。这标志首次开放模型缩小与专有前沿的差距。上图为人们关于Llama 3.1 405B与GPT,Claude的评估,win:胜Tie:平Loss:输借助AlphaGeometry,符号推理引擎得以拯救谷歌DeepMind与纽约大学团队使用符号引擎生成了数百万条合成定理和证明,利用这些数据从零开始训练了一个语言模型。AlphaGeometry在语言模型提出新构造,与符号引擎执行推理交替进行,直至找到解决方案。令人印象深刻的是,AlphaGeometry在奥林匹克级几何问题基准测试中解决了30题中的25题,接近人类国际数学奥林匹克金牌得主的表现。第二好的AI表现仅得10分。它还展示了泛化能力——例如,发现2004年国际数学奥林匹克问题中的一个具体细节对于证明并非必要“尽管受到制裁,中国LLMs在排行榜上风头正劲”由DeepSeek、零一万物、知谱AI和阿里巴巴开发的模型在LMSYS排行榜上取得了优异的成绩,尤其在数学和编程方面表现尤为出色。中国的最强模型与美国生产的第二强前沿模型竞争,同时在某些子任务上挑战了SOTA。中国模型更能优先考虑计算效率,以弥补GPU访问的限制,并学会比美国同行更有效地利用资源。中国模型各有优势。例如,DeepSeek在推理过程中通过多头隐式注意力减少内存需求,并且改进了MoE架构。同时,零一万物更加关注数据集的建设而不是建筑创新。由于在像Common Crawl这样的流行存储库中相对缺乏数据,因此它更加关注建立强大的中文数据集来弥补不足。

DeepSeek 的秘方是硅谷味儿的

聪明的年轻AI研究人员+研究机构的氛围(配上大厂的package)+开源社区的分享和交流,提高了DeepSeek在全球AI领域影响力和声望。对一家以产生AI研究成果而非发布商业化产品为主要目标的机构而言,Hugging Face和Reddit就是最好的发布会会场,数据集和代码库就是最好的demo,论文就是最好的新闻稿。DeepSeek基本就是这么做的,而且做得很讲究。所以即便DeepSeek的研究人员和CEO鲜少接受媒体采访,也几乎从不在论坛和活动上分享技术经验和洞察,但你不能说它没做营销。反之,以证明中国AI原创研究可以引领全球趋势、招聘最聪明的研究人员的目的来说,DeepSeek的“营销”是极其精准和有效的。这里值得提一句,过去的一年中国的开源大模型主要玩家确实在全球AI研究和产品方面赢得了不少尊敬。一个越来越普遍的看法是:比起美国和欧洲的一些开源模型,中国的开源大模型在开源程度上更为彻底,更容易被研究人员和开发者直接拿过来上手研究或优化自己的模型。DeepSeek就是一个典型代表,除了DeepSeek,阿里巴巴的通义(Qwen)也被AI研究领域普遍认为开源态度较为真诚,面壁智能的小模型Mini-CPM-Llama3-V 2.5因为被斯坦福本科生团队直接套壳也意外走红了一把。所以很有意思:国际AI界特别是硅谷认为中国大模型的代表玩家是DeepSeek和阿里巴巴,而我们自己觉得是豆包、可灵和所谓的AI六小龙。客观地说,就国际AI界特别是硅谷能公正、积极地看待中国AI创新能力和对全球社区的贡献方面,DeepSeek和阿里巴巴们做得更多。开源在任何时候都是一件正确的事。

2024 年历史更新(归档)

《[码观|共识与非共识:从模型到应用,2024 AI趋势回首与展望](https://waytoagi.feishu.cn/wiki/DgUZwz4a9imlUhkcyC1c21XVnPd)》《[DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力](https://mp.weixin.qq.com/s/xERMU0rR4IvSUerO9oAjkw)》DeepMind最新研究表明,逆向思维训练可以显著提升大语言模型(LLM)的推理能力。研究通过构建逆向推理数据集,并利用知识蒸馏方法指导模型训练,验证了逆向思维在多种推理任务中的有效性。文章指出,结合正向和逆向问题能够提高模型性能,尤其在中等难度问题上表现最佳。这一发现为未来LLM研究提供了新的思路。《[国产开源模型,代码能力比肩Claude,DeepSeek-V3正式发布](https://mp.weixin.qq.com/s/w8pUvP21WE2iDnKIqMBDjQ)》DeepSeek发布了其开源模型DeepSeek-V3,具备671B参数,性能接近顶尖闭源模型Claude 3.5-Sonnet。相比前代,DeepSeek-V3在知识、长文本和数学任务上均有显著提升,并且生成速度提升至每秒60个令牌。API服务定价调整为每百万输入tokens 0.5元,优惠期内维持0.1元。模型支持FP8训练并已开源权重,旨在缩小开源与闭源模型之间的能力差距,未来将继续扩展功能。

Others are asking
deepseek
DeepSeek 是一家具有独特特点的公司。 首先,DeepSeek 不是“中国式创新”的产物,将其比喻成“AI 界的拼多多”是偏颇的,认为其秘方是多快好省也不全面。早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,其论文也在 AI 研究界被广泛分享和讨论。当时在国内舆论场,DeepSeek 被描摹成“大模型价格战的发起者”,形成平行时空的感觉。这表明 DeepSeek 的秘方是硅谷味儿的。 其次,如果 V3 是 DeepSeek 的 GPT3 时刻,接下来的发展无人知晓,但有趣的事还在后头。DeepSeek 应会为全人类的人工智能事业做出更大贡献,且它已是中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷味儿的。 此外,DeepSeek 在输出结果方面有一些神来之笔,如在独白文本中“自作主张”地加入括号中的场景描述,增强画面感,还能预判用户需求。例如对于“玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?”的提示词,能给出符合预期且具有文学性的输出。但值得商榷的是,根据史实,魏征是在玄武门之变之后才见到李世民。
2025-02-05
如何下载deepseek
以下是关于 DeepSeek 的相关信息: 下载途径:DeepSeek 可通过其网址 https://www.deepseek.com/zh 进行访问,目前国内能访问,网页登录方便且完全免费。您可以点击开始对话,左边选择代码助手直接使用。 特点优势: 可能是国运级别的科技成果,由没有海外经历甚至没有资深从业经验的本土团队开发完成。 同时做到了强大(比肩 O1 的推理能力)、便宜(参数少,训练开销与使用费用小了一个数量级)、开源(任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的 mini 模型)、免费(官方目前提供的服务完全免费,任何人随时随地可用)、联网(暂时唯一支持联网搜索的推理模型)、本土这六条。 使用方法: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 DeepSeek,认真阅读开场白之后,正式开始对话。 相关测试及设计思路: 用 Coze 做了效果对比测试。 设计思路包括将 Agent 封装成 Prompt 并储存在文件,通过提示词文件让 DeepSeek 实现同时使用联网功能和深度思考功能,在模型默认能力基础上优化输出质量等。 特别鸣谢:李继刚的【思考的七把武器】在前期提供了很多思考方向,Thinking Claude 是设计 HiDeepSeek 的灵感来源,Claude 3.5 Sonnet 是最得力的助手。
2025-02-05
如何本地部署deepseek
要本地部署 DeepSeek,您可以参考以下步骤: 1. 访问网页链接:www.deepseek.com,点击“开始对话”。 2. 将装有提示词的代码发给 DeepSeek。 3. 认真阅读开场白之后,正式开始对话。 需要注意的是,DeepSeek 是一个非常强大且具有创新性的推理模型,它具有比肩 O1 的推理能力、参数少、训练开销与使用费用小、开源、免费、联网、本土开发等诸多优势。如果您在部署过程中遇到问题,建议您仔细检查每一个步骤是否正确操作。
2025-02-05
如何在服务器上部署deepseek r1
以下是在服务器上部署 DeepSeek R1 的步骤: 1. 环境配置: 访问 DeepSeek 的官网(https://www.deepseek.com/)。 进入右上角的 API 开放平台。 若没有赠送的余额,可以选择充值,支持美元和人民币两种结算方式以及各种个性化的充值方式。 创建一个 API key,注意 API key 只会出现一次,请及时保存下来。 2. 设置代码编辑器: 下载 Cursor(https://www.cursor.com/)或 VSCode(https://code.visualstudio.com/),只要代码编辑器可以下载插件即可。 以 Cursor 作为代码编辑器为例,下载安装后,在插件页面搜索并安装 Roocline。 安装完后,打开三角箭头,就可以看到 RooCline。 选中 RooCline,并点击齿轮,进入设置,依次设置: API Provider:选择 DeepSeek。 API Key:填入已创建的 key。 模型:选择 DeepSeekreasoner。 语言偏好设置。 记得把 HighRisk 选项都打开,这样 AI 才能帮你自动生成文件。最后做完所有不要忘记点击 Done 保存修改。 3. 在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。
2025-02-05
deepseek怎么使用
以下是 DeepSeek 的使用方法: 1. 访问网址:搜索 www.deepseek.com,点击“开始对话”。 2. 发送装有提示词的代码给 DeepSeek。 3. 认真阅读开场白之后,正式开始对话。 此外,DeepSeek 具有以下特点和相关知识: 核心原理认知: AI 特性定位:支持多模态理解,包括文本/代码/数学公式混合输入;具有动态上下文,对话式连续记忆约 4K tokens 上下文窗口;可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别+内容生成双通道处理,自动检测 prompt 中的任务类型/输出格式/知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架: 四要素模板。 格式控制语法,包括强制结构(使用```包裹格式要求)、占位符标记(用{{}}标注需填充内容)、优先级符号(>表示关键要求,!表示禁止项)。 进阶控制技巧: 思维链引导,如分步标记法、苏格拉底式追问。 知识库调用,包括领域限定指令、文献引用模式。 支持多模态输出。
2025-02-05
deepseek怎么学习
以下是关于学习 DeepSeek 的一些内容: 相关讨论和研究:包括 DeepSeek 在全球 AI 社区的意义、技术突破、资源分配策略、长上下文能力、量化商业模式以及对 AI 生态系统的影响,还有其在架构和工程上的创新,如 MoE、MLA、MTP 和 FP8 混合精度训练等。您可以通过以下链接获取详细信息: 核心原理认知: 多模态理解:支持文本/代码/数学公式混合输入。 动态上下文:对话式连续记忆(约 4K tokens 上下文窗口)。 任务适应性:可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别+内容生成双通道处理,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架: 不知道如何表达时可套用框架指令,包括四要素模板、格式控制语法(强制结构、占位符标记、优先级符号)。 进阶控制技巧: 思维链引导:分步标记法、苏格拉底式追问。 知识库调用:领域限定指令、文献引用模式。 多模态输出。 提示词使用: 效果对比:可通过 Coze 做小测试对比。 使用方法:搜索 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 Deepseek,认真阅读开场白后正式开始对话。 设计思路:将 Agent 封装成 Prompt 并储存在文件,实现同时使用联网和深度思考功能,优化输出质量,设计阈值系统,用 XML 进行规范设定。 完整提示词:v 1.3 特别鸣谢:李继刚、Thinking Claude、Claude 3.5 Sonnet 等为相关工作提供了帮助和灵感。
2025-02-05
比较好用的PPT制作AI
以下是一些比较好用的 PPT 制作 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 在体验方面,有人认为 gamma 最好用,只要提供了内容框架,生成的 PPT/网页审美水平最高。此外,WPS AI 也表现出色,能帮助生成 PPT 大纲并进行优化,还能根据用户要求修改主题配色和字体。
2025-02-05
AnythingLLM 怎么用,好用吗
AnythingLLM 是一款功能强大的软件,具有以下特点和使用方法: 功能:包含了所有 Open WebUI 的能力,并且额外支持选择文本嵌入模型和向量数据库。 安装和配置:安装地址为 https://useanything.com/download 。安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 构建本地知识库:其中有 Workspace 的概念,可以创建自己独有的 Workspace 与其他项目数据隔离。首先创建工作空间,然后上传文档并进行文本嵌入,接着选择对话模式,提供了 Chat 模式(大模型根据训练数据和上传文档数据综合给出答案)和 Query 模式(大模型仅依靠文档中的数据给出答案),最后进行测试对话。 相关评价:被认为是一个可打造成企业内部知识库的私人专属 GPT,能将任何文档、资源或内容转换为大语言模型(LLM)知识库,支持多用户使用,可设权限,兼容多种 LLM 和数据库。 总的来说,AnythingLLM 的使用效果因人而异,需要您亲自实践和体验来判断其是否好用。
2025-02-04
好用的ppt制作ai
以下是一些好用的制作 PPT 的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 此外,在体验 AI 生成 PPT 的产品中,gamma 被认为是最好用的。虽然还没有特别自动化,但从审美上来看,只要提供了内容框架,gamma 生成的 PPT/网页的审美水平最高。 另外,WPS AI 也能辅助制作 PPT,例如优化 PPT 大纲、快速生成 PPT 并进行主题配色和字体修改等。
2025-02-04
目前最好用的AI是那款
目前,在 AI 领域没有绝对意义上“最好用”的单一产品,不同的 AI 模型和工具在不同方面各有优势。 像 GPT4 这样的高级模型功能全面,还具备代码解释器等特色功能。Anthropic 公司开发的 Claude 3 Opus 在写作和深度洞察方面备受好评。Google 的 Gemini Advanced 擅长提供清晰的解释。 此外,国产的 Kimi 智能助手也是一个不错的选择,它不用科学上网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,对长文理解表现出色。 在笔记本电脑方面,截止 2024 年 5 月,主流的 AI 笔记本电脑主要是一些专门为人工智能和深度学习设计的高性能移动工作站。一些知名品牌包括微软第 11 代 Surface Pro、微星 Creator/Workstation 系列、技嘉 Aero/Aorus 系列、戴尔 Precision 移动工作站、惠普 ZBook 移动工作站、联想 ThinkPad P 系列等。这些笔记本通常配备强大的 GPU(如 NVIDIA RTX 系列)、大容量内存和高速固态硬盘,还预装了相关深度学习框架和开发工具,但价格相对较高,通常在 2000 美元以上,用户可根据自身需求和预算选择合适型号,并关注散热、续航等实际使用体验。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-03
哪款智能简历好用
以下是一些好用的智能简历工具: 1. ResumeMatcher:这是一款 AI 驱动的开源简历优化工具。它能提供智能关键词匹配、深入分析见解,提升简历通过 ATS 筛选的几率。采用 FastEmbed 计算简历与职位匹配度,结合 textacy 提取核心术语,精准优化简历内容。相关链接: 2. Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,能为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 3. Rezi:是一个受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的每个方面,包括写作、编辑、格式化和优化。 4. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 您可以根据自己的需要选择最适合您的工具。
2025-02-03
除了ollama外还有什么好用
除了 Ollama 外,以下是一些好用的本地部署或相关的工具和框架: 1. Google Gemma:Google 发布的家用版小模型,分别有 2b(20 亿参数)和 7b(70 亿参数)版本。相对千亿参数的大模型,这种小模型可能不适合解决特别复杂的任务,但从趋势上看是模型本地化提升基础操作效率的模板。小型的 llama 也支持本地部署。 2. Langchain:支持多种大型语言模型,包括通义千问、Llama 2、Mistral 和 Gemma 等,易于使用,适用于多种操作系统,同时支持 cpu 和 gpu。提供模型库,用户可从中下载不同模型,还支持自定义模型、API 和集成,社区贡献丰富。 如果您想了解更多关于这些工具和框架的详细信息,建议您进一步查阅相关资料。
2025-02-03
我想学习AI,但是不想学习代码之类的,我是做抖音运营的
如果您是做抖音运营且不想学习代码来学习 AI,以下是一些建议: 1. 您可以从 AI agent 领域的 coze 开始学和练习。因为您从事互联网运营工作,coze 能让您短时间接触大量应用场景练习和 prompt 练习,而且不需要代码基础和图文审美,只要能发现智能体的需求,就可以用工作流来实现。 2. 如果您希望更系统地了解 AI 知识,即使不想学习代码,也可以尝试了解以下内容作为基础: AI 背景知识,包括基础理论(人工智能、机器学习、深度学习的定义及其关系)、历史发展(回顾 AI 的发展历程和重要里程碑)。 数学基础,如统计学基础(熟悉均值、中位数、方差等统计概念)、线性代数(了解向量、矩阵等基本概念)、概率论(基础的概率论知识,如条件概率、贝叶斯定理)。 算法和模型,包括监督学习(了解常用算法,如线性回归、决策树、支持向量机)、无监督学习(熟悉聚类、降维等算法)、强化学习(简介强化学习的基本概念)。 评估和调优,如性能评估(了解如何评估模型性能,包括交叉验证、精确度、召回率等)、模型调优(学习如何使用网格搜索等技术优化模型参数)。 神经网络基础,包括网络结构(理解神经网络的基本结构,如前馈网络、卷积神经网络、循环神经网络)、激活函数(了解常用的激活函数,如 ReLU、Sigmoid、Tanh)。 不过,如果您想在 20 分钟内快速上手 Python 和 AI 的相互调用,可以循序渐进地完成以下任务: 1. 完成一个简单程序。 2. 完成一个爬虫应用,抓取公众号文章。 3. 完成一个 AI 应用,为公众号文章生成概述。
2025-02-03
ai能实现自动生成增删改查的后端代码吗?
AI 能够实现自动生成增删改查的后端代码。例如,使用编程工具 Cursor,输入 command+i 唤起 composer,基于用户故事生成代码结构,点击回车。建议使用 claude3.5sonnet 模型,其目前代码生成能力较强。自动生成代码后,需点击 Accept all 才会生效,且最好先阅读输出结果,查看是否理解意图,避免频繁修改。若发现遗漏文件,可让 AI 自行检查并补充。此外,像 Coze 工作流也能在一定程度上辅助生成代码,其代码节点自带 IDE 里的 AI 功能生成代码后,除了直接在节点的试运行功能测试外,还可用「测试代码」功能进行测试。但需要注意的是,生成的代码可能存在不完善之处,需要仔细检查和优化。
2025-01-26
请 输出:Hello Word的C语言代码
以下是一个简单的 C 语言程序,用于输出“Hello World”: ```c include <stdio.h> int main { printf; return 0; } ```
2025-01-25
怎么描述能让gpt写出可靠的代码
要让 GPT 写出可靠的代码,可以参考以下方法: 1. 当需要进行复杂计算时,不要完全依赖 GPT 模型自身,而是指导模型编写并运行代码。 2. 特别地,指示模型将要运行的代码放入指定格式,例如使用三个反引号(backticks)。 3. 对于程序开发人员,可利用 GPT 生成代码,例如在求 1000 以内的所有质数时,先让 GPT 编写代码,然后开启新对话输入代码,再让模型充当代码执行器运行代码。 4. 编写代码时,GPT4 写复杂代码的能力更强。 5. 代码执行的另一个好用例是调用外部 API,可通过向模型提供说明如何使用 API 的文档和/或代码示例来指导模型。 6. 但需注意,执行模型生成的代码本身并不安全,任何试图执行此操作的应用程序都应采取预防措施,特别是需要一个沙盒代码执行环境来限制不受信任的代码可能造成的危害。
2025-01-22
有没有什么AI软件有可视化代码功能
以下是一些具有可视化代码功能的 AI 软件: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,用户可通过拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,如逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图创建,可与 Archi 工具配合使用,该工具提供图形化界面创建模型。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现称为 diagrams.net):免费的在线图表软件,允许创建各种类型图表,包括软件架构图,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 9. Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 以下是一些写代码或辅助编程的 AI 产品: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出的 AI 编程助手,支持多种语言和 IDE,能为程序员快速提供代码建议。 2. 通义灵码:阿里巴巴团队推出的智能编程辅助工具,提供多种能力。 3. CodeWhisperer:亚马逊 AWS 团队推出的 AI 编程软件,由机器学习技术驱动,为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,可快速生成代码。 5. Cody:代码搜索平台 Sourcegraph 推出的 AI 代码编写助手,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供智能研发服务的免费 AI 代码助手,基于自研的基础大模型微调的代码大模型。 7. Codeium:由 AI 驱动的编程助手工具,通过提供代码建议、重构提示和代码解释帮助软件开发人员提高效率和准确性。 更多辅助编程 AI 产品,还可以查看:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可以根据需求选择最适合的工具。 此外,还有一些相关的工具和资源: 1. Screenshot to Code:利用 GPT4 Vision 视觉能力将屏幕截图转换为代码,支持 HTML/Tailwind CSS、React 等,集成 DALLE 3。 2. 交互创意体验网址:http://reboot.studio ,提供丰富的交互创意体验,鼓励加入更多 AI 元素。 3. 沃顿商学院发布的教学提示词库:https://www.moreusefulthings.com/prompts ,包含多用途学习和教育提示词,适合学生、教师和家长收藏。
2025-01-20
找一个可以设计复杂代码的AI
以下是一些可以设计复杂代码的 AI 工具及相关信息: 1. 在独立游戏开发中,如果让 AI 写小功能,可把不方便配表而又需要撰写的简单、模板化、多是调用 API 且只牵涉小部分特殊逻辑的代码交给 AI。以 Buff 系统为例,用 Cursor 让它仿照代码写一些 Buff,生成结果有时可以直接用,但目前 Cursor 生成复杂代码还需要复杂的前期调教,用多了之后 ChatGPT 会更方便。教 AI 时要像哄小孩,有正确的需要及时肯定,指出错误时要克制。 2. OpenAI o1:推理能力强,适合作为架构师或算法顾问,用于复杂算法与架构设计。 3. Claude 3.5/Cursor:Claude 擅长长上下文任务,Cursor 适合上下文控制较好的 IDE 开发,可快速生成代码与网页设计。 4. v0.dev:是网页设计的利器,支持设计稿生成网页。 5. Gemini:长上下文支持(2M Tokens),适合代码反编译与混淆代码分析。 同时需要注意,AI 目前在完成复杂项目方面存在一些限制,如上下文窗口限制、自然语言描述不精确、无法感知环境和直接执行、幻觉问题等。复杂项目需要全局理解,AI 难以设计架构和模块化,项目需求常需反复讨论才能明确,AI 难以完全掌握,编译、部署、调试等复杂任务 AI 难以独立完成,且 AI 可能编造不存在的 API 或错误代码,需人工严格审查。
2025-01-20
大模型在数据分析上的应用
大模型在数据分析上有广泛的应用。 首先,了解一下大模型的基本概念。数字化便于计算机处理,为让计算机理解 Token 之间的联系,需将 Token 表示成稠密矩阵向量,即 embedding,常见算法有基于统计的 Word2Vec、GloVe,基于深度网络的 CNN、RNN/LSTM,基于神经网络的 BERT、Doc2Vec 等。以 Transform 为代表的大模型采用自注意力机制来学习不同 token 之间的依赖关系,生成高质量 embedding。大模型的“大”在于用于表达 token 之间关系的参数多,如 GPT3 拥有 1750 亿参数。 大模型因其强大能力,在多个领域有热门应用场景: 1. 文本生成和内容创作:撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手:进行自然对话,提供客户服务、日常任务提醒和信息咨询等。 3. 编程和代码辅助:自动补全、修复 bug 和解释代码,提高编程效率。 4. 翻译和跨语言通信:理解和翻译多种语言,促进不同语言背景用户的沟通和信息共享。 5. 情感分析和意见挖掘:分析社交媒体等中的文本,为市场研究和产品改进提供支持。 6. 教育和学习辅助:创建个性化学习材料、回答学生问题和提供语言学习支持。 7. 图像和视频生成:如 DALLE 等模型可根据文本描述生成相应图像,未来可能扩展到视频。 8. 游戏开发和互动体验:创建游戏角色对话、生成故事情节和增强玩家沉浸式体验。 9. 医疗和健康咨询:回答医疗相关问题,提供初步健康建议和医疗信息查询服务。 10. 法律和合规咨询:解读法律文件,提供合规建议,降低法律服务门槛。 大型模型主要分为两类:大型语言模型专注于处理和生成文本信息;大型多模态模型能处理包括文本、图片、音频等多种类型信息。二者在处理信息类型、应用场景和数据需求方面有所不同。大型语言模型主要用于自然语言处理任务,依赖大量文本数据训练;大型多模态模型能处理多种信息类型,应用更广泛,需要多种类型数据训练。 相对大模型,也有所谓的“小模型”,它们通常是为完成特定任务而设计。
2025-02-05
flux1-depth-dev模型存放路径
flux1depthdev 模型的存放路径如下: 1. 下载 flux1depthdev 模型放到 ComfyUI/models/diffusion_models/文件夹中。 夸克网盘:链接:https://pan.quark.cn/s/571d174ec17f 百度网盘:见前文 2. 也可以将 depth lora 模型存放到 ComfyUI/models/loras 文件夹中。 depth lora 模型:https://huggingface.co/blackforestlabs/FLUX.1Depthdevlora 3. 百度网盘中也有相关模型: 链接:https://pan.baidu.com/s/10BmYtY3sU1VQzwUy2gpNlw?pwd=qflr 提取码:qflr
2025-02-05
你目前使用的是哪个模型
以下是一些关于模型的信息: 在 Cursor Chat、Ctrl/⌘K 和终端 Ctrl/⌘K 中,您可以在 AI 输入框下方的下拉列表中选择要使用的模型。默认情况下,Cursor 已准备好使用的模型包括:、cursorsmall。您还可以在 Cursor Settings>Models>Model Names 下添加其他模型。cursorsmall 是 Cursor 的自定义模型,不如 GPT4 智能,但速度更快,用户可无限制访问。 在 Morph Studio 中,支持以下模型生成视频: TexttoVideoMorph0.1:内部文本到视频生成模型,默认具有逼真色调,可通过描述性形容词修改拍摄风格和外观。 ImagetoVideoMorph0.1:内部图像到视频生成模型,用文本提示引导效果更好,使用时可不输入文本,在角色特写和对象动画方面表现较好。 VideotoVideoMorph0.1:内部风格转换模型,支持在文本提示下进行视频到视频的渲染,可将视频风格更改为预设,同时保留原始视频的字符和布局。 ImagetoVideoSVD1.1:由 Stability.ai 提供支持的图像到视频模型,适用于构图中有清晰层次的镜头(风景镜头、B 卷等)。 文本到视频形态0.1 被设置为新创建射击卡的默认模型,型号选择会根据是否上传图像或视频而更改,每个模型有自己的一组参数可供调整,如相机运动(支持静态、放大、缩小、向左平移、向右平移、向上平移、向下平移、顺时针旋转和逆时针旋转,未来将支持一次选择多个相机移动选项)、时间(支持最多 10 秒的视频生成,默认持续时间为 3 秒)。 ComfyUI instantID 目前只支持 sdxl。主要的模型需下载后放在 ComfyUI/models/instantid 文件夹(若没有则新建),地址为:https://huggingface.co/InstantX/InstantID/resolve/main/ipadapter.bin?download=true 。InsightFace 模型是 antelopev2(不是经典的 buffalo_l),下载解压后放在 ComfyUI/models/insightface/models/antelopev2 目录中,地址为:https://huggingface.co/MonsterMMORPG/tools/tree/main 。还需要一个 ControlNet 模型,放在 ComfyUI/models/controlnet 目录下,地址为:https://huggingface.co/InstantX/InstantID/resolve/main/ControlNetModel/diffusion_pytorch_model.safetensors?download=true 。上述模型网络环境不好的,可在网盘 https://pan.baidu.com/s/1FkGTXLmM0Ofynz04NfCaQ?pwd=cycy 下载。
2025-02-05
图生图美食模型
以下是关于图生图美食模型的相关知识: 概念与功能说明: 首页模型、帖子、排行榜:展示其他用户生成的模型、图片。不同模型有 checkpoint 和 lora 两种标签,部分还有 SDXL 标签。点击可查看模型详情,下方有返图区。 基础模型(checkpoint):生图必需,任何生图操作都要先选定。 lora:低阶自适应模型,类似 checkpoint 的小插件,可控制细节,权重可调整。 ControlNet:控制图片中特定图像,如人物姿态、特定文字等,高阶技能。 VAE:编码器,类似滤镜,调整生图饱和度,可无脑选 840000。 Prompt 提示词:描述想要 AI 生成的内容。 负向提示词(Negative Prompt):描述想要 AI 避免产生的内容。 图生图:上传图片后,SD 会根据图片、所选模型、输入的 prompt 等信息重绘,重绘幅度越大,输出图与输入图差别越大。 简明操作流程(文生图): 定主题:确定生成图片的主题、风格和表达信息。 选择基础模型(checkpoint):按主题找贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora 控制图片效果和质量。 ControlNet:高阶技能,可控制特定图像。 局部重绘:下篇再教。 设置 VAE:选 840000。 Prompt 提示词:用英文写需求,单词、短语组合,用英文半角逗号隔开。 负向提示词(Negative Prompt):用英文写避免的内容,单词、短语组合,用英文半角逗号隔开。 采样算法:如选 DPM++2M Karras,留意 checkpoint 详情页作者推荐的采样器。 采样次数:根据采样器特征,选 DPM++2M Karras 时,采样次数在 30 40 之间。 尺寸:根据个人喜好和需求选择。
2025-02-04
请问你的大模型底座用的是什么
大模型的底座相关知识如下: 大模型像一个多功能的基础平台(有时也被称为“基座模型”),可以处理多种不同的任务,应用范围广泛,拥有更多通识知识。 大模型的知识来源于训练过程中接触到的数据,这些数据是有限的,其知识库不会自动更新,只能回答在训练过程中见过或类似的问题,在某些特定或专业领域的知识可能不够全面。 从整体分层的角度来看,大模型整体架构的基础层为大模型提供硬件支撑和数据支持,例如 A100、数据服务器等。数据层包括企业根据自身特性维护的垂域数据,分为静态的知识库和动态的三方数据集。模型层有 LLm(大语言模型)或多模态模型,如 GPT 一般使用 transformer 算法实现,多模态模型训练所用数据与 llm 不同,用的是图文或声音等多模态的数据集。平台层是模型与应用间的部分,如大模型的评测体系或 langchain 平台等。表现层即应用层,是用户实际看到的地方。 零跑汽车基于百炼实现大模型落地零跑座舱,阿里云通过百炼平台实现大模型落地零跑座舱,为用户的多种互动提供支持,零跑汽车构建了开放、可扩展的大模型应用架构,基于统一的大模型底座,实现了零跑座舱大模型应用场景的快速扩展与迭代。
2025-02-04
各个ai大模型的优势
以下是一些常见的 AI 大模型的优势: OpenAI 的 GPT4: 是大型多模态模型,接受图像和文本输入,输出文本。 在各种专业和学术基准测试中表现出与人类相当的水平。 Midjourney v5: 具有极高的一致性。 擅长以更高分辨率解释自然语言 prompt。 支持像使用 tile 这样的重复图案等高级功能。 DALL·E 3: 能轻松将想法转化为极其精准的图像。 代表了生成完全符合文本的图像能力的一大飞跃。 Mistral 7B: 在所有基准测试上超越了 Llama 2 13B。 在许多基准测试上超越了 Llama 1 34B。 在代码任务上接近 CodeLlama 7B 的性能,同时在英语任务上表现良好。 OpenAI 的 o3 及 o3mini: o3 在编码、数学和科学等领域表现出色,在多个衡量基准上远超 o1。 在 ARCAGI 公共基准得分高。 在 EpochAI 的 Frontier Math 创下新纪录。 在 SWEBench Verified 上表现突出。 在 Codeforces 上得分高。 在 AIME 2024 上得分高。 在 GPQA Diamond 上表现远高于人类专家。 o3mini 具有 3 个推理级别,最低级别将比肩 o1,在许多编码任务上性能优于 o1,且成本大幅降低。 大模型的优势还包括: 像一个多功能的基础平台,能处理多种不同的任务,应用范围广泛,拥有更多的通识知识。 但大模型并非拥有无限知识,其知识来源于有限的训练数据,且知识库不会自动更新,在某些特定或专业领域的知识可能不够全面。
2025-02-04