Grok 3 具有以下特点:
在评测方面,Grok 3 在基准测试中领先,但与竞争模型差距不大,整体表现比其他模型高出约 1 - 2%。Andrej Karpathy 认为 Grok 3 + Thinking 比 DeepSeek - R1 强一些,接近 OpenAI 顶级模型,在测试中成功解决了多个复杂问题,但“DeepSearch”能进行高质量的检索类问题回答,尚需改进。
地址:https://huggingface.co/smirki/UIGEN-T1-Qwen-7b
今天,xAI正式举行Grok 3发布会,Grok3包含两个模型版本Grok3和Grok3-miniGrok 3 AIME和GPQA在内的基准测试中显著优于其他模型,在数学推理,代码处理,科学问题方面都有较为优秀的表现。马斯克团队希望Grok 3能够解决实际的问题,同时模型每天都在变强。Grok3具备推理能力,在提供更多测试计算时间的情况下,优于o1和R1。⏰何时用的上Grok 3今天将向所有Premium+订阅者推出(IOS,网页版都有),完整版在网页版,APP上的Grok 3有一定的削弱(还有单独会员叫:SuperGrok)今天所有该类用户都能用上新增“Deep Search”能力AI将深入了解用户的目的,访问并交叉验证多个信息源,确保研究内容更为准确,并公开其执行搜索所采取的步骤(让整个搜索更加透明、结果更加可信)。可以调用Big Brain功能,加强计算来解决问题现场演示中,Grok3可以生成游戏设计方案.Grok 3语音模式在大约一周内推出Grok 3 API几周后推出,Grok 2将在Grok 3正式可用后开源,xAI计划也会开源Grok 3🌟地址:[https://huggingface.co/smirki/UIGEN-T1-Qwen-7b](https://t.co/8el4FBlOtb)OpenAI真的要Open了,Sam Altman表示将开放一个开源项目,让大家投票选择是小型的o3-mini还是手机上可跑的新模型。
🫧宝玉日报「2月18日」✨✨✨✨✨✨✨✨1⃣️👁️Grok 3的评测:Grok 3在基准测试中领先,但与竞争模型差距不大。整体表现比其他模型高出约1-2%。没有分享更具挑战性的基准数据。🔗[https://x.com/dotey/status/1891877456857935999](https://x.com/dotey/status/1891877456857935999)2⃣️🤖Andrej Karpathy对Grok 3的评价:Grok 3+Thinking比DeepSeek-R1强一些,接近OpenAI顶级模型。在测试中成功解决了多个复杂问题。"DeepSearch"能进行高质量的检索类问题回答,尚需改进。🔗[https://x.com/dotey/status/1891722781135429734](https://x.com/dotey/status/1891722781135429734)3⃣️🧠自监督提示词优化方法(SPO):AI自动优化提示词,并通过生成结果进行迭代。该方法实现了自动化的优化过程,生成结果逐步提高。🔗[https://x.com/dotey/status/1891700710305149122](https://x.com/dotey/status/1891700710305149122)4⃣️🧑💻思维链可视化项目:
[@宝玉(@dotey)](https://x.com/dotey)日报1⃣️👁️Grok 3的评测在基准测试中领先,但与竞争模型差距不大,整体表现高出1-2%。🔗[评测详情](https://x.com/dotey/status/1891877456857935999)2⃣️🤖Andrej Karpathy对Grok 3的评价Grok 3+Thinking比DeepSeek-R1强,接近OpenAI顶级模型,解决多个复杂问题。🔗[评价详情](https://x.com/dotey/status/1891722781135429734)3⃣️🧠自监督提示词优化方法(SPO)AI自动优化提示词,并通过生成结果进行迭代,逐步提高。🔗[了解更多](https://x.com/dotey/status/1891700710305149122)4⃣️🧑💻思维链可视化项目将DeepSeek R1的思考过程转化为可视化动画,展示跳跃与稳定阶段。🔗[项目链接](https://github.com/dhealy05/frames_of_mind)丨🔗[可视化详情](https://x.com/dotey/status/1891663134542397870)5⃣️🐞Cursor Debug提示词使用“思考可能原因”并逐步验证假设来修复问题。🔗[提示词详情](https://x.com/dotey/status/1891570972756500988)丨🔗[Git调试指南](https://git-tower.com/learn/git/faq/git-bisect/)>>更多详细内容查看[宝玉日报](https://waytoagi.feishu.cn/wiki/RleQwkybeiZ2jfkaQdgcIrrdnRd)