Chat with Wiki - grok3 有什么特点

Answer

Grok 3 具有以下特点：

包含两个模型版本：Grok 3 和 Grok 3-mini。
在 AIME 和 GPQA 在内的基准测试中显著优于其他模型，在数学推理、代码处理、科学问题方面表现优秀。
具备推理能力，在提供更多测试计算时间的情况下，优于 o1 和 R1。
新增“Deep Search”能力，能深入了解用户目的，访问并交叉验证多个信息源，确保研究内容更准确，并公开执行搜索所采取的步骤。
可以调用 Big Brain 功能，加强计算来解决问题。
现场演示中能生成游戏设计方案。
语音模式在大约一周内推出。
API 几周后推出。
今天向所有 Premium+订阅者推出（IOS、网页版都有），完整版在网页版，APP 上的 Grok 3 有一定削弱。（还有单独会员叫：SuperGrok）今天所有该类用户都能用上。
Grok 2 将在 Grok 3 正式可用后开源，xAI 计划也会开源 Grok 3 。

在评测方面，Grok 3 在基准测试中领先，但与竞争模型差距不大，整体表现比其他模型高出约 1 - 2%。Andrej Karpathy 认为 Grok 3 + Thinking 比 DeepSeek - R1 强一些，接近 OpenAI 顶级模型，在测试中成功解决了多个复杂问题，但“DeepSearch”能进行高质量的检索类问题回答，尚需改进。

地址：https://huggingface.co/smirki/UIGEN-T1-Qwen-7b

Content generated by AI large model, please carefully verify (powered by aily)

References

2月18日 AI资讯汇总

今天，xAI正式举行Grok 3发布会，Grok3包含两个模型版本Grok3和Grok3-miniGrok 3 AIME和GPQA在内的基准测试中显著优于其他模型，在数学推理，代码处理，科学问题方面都有较为优秀的表现。马斯克团队希望Grok 3能够解决实际的问题，同时模型每天都在变强。Grok3具备推理能力，在提供更多测试计算时间的情况下，优于o1和R1。⏰何时用的上Grok 3今天将向所有Premium+订阅者推出（IOS，网页版都有），完整版在网页版，APP上的Grok 3有一定的削弱（还有单独会员叫：SuperGrok）今天所有该类用户都能用上新增“Deep Search”能力AI将深入了解用户的目的，访问并交叉验证多个信息源，确保研究内容更为准确，并公开其执行搜索所采取的步骤（让整个搜索更加透明、结果更加可信）。可以调用Big Brain功能，加强计算来解决问题现场演示中，Grok3可以生成游戏设计方案.Grok 3语音模式在大约一周内推出Grok 3 API几周后推出，Grok 2将在Grok 3正式可用后开源，xAI计划也会开源Grok 3🌟地址：[https://huggingface.co/smirki/UIGEN-T1-Qwen-7b](https://t.co/8el4FBlOtb)OpenAI真的要Open了，Sam Altman表示将开放一个开源项目，让大家投票选择是小型的o3-mini还是手机上可跑的新模型。

宝玉日报

🫧宝玉日报「2月18日」✨✨✨✨✨✨✨✨1⃣️👁️Grok 3的评测：Grok 3在基准测试中领先，但与竞争模型差距不大。整体表现比其他模型高出约1-2%。没有分享更具挑战性的基准数据。🔗[https://x.com/dotey/status/1891877456857935999](https://x.com/dotey/status/1891877456857935999)2⃣️🤖Andrej Karpathy对Grok 3的评价：Grok 3+Thinking比DeepSeek-R1强一些，接近OpenAI顶级模型。在测试中成功解决了多个复杂问题。"DeepSearch"能进行高质量的检索类问题回答，尚需改进。🔗[https://x.com/dotey/status/1891722781135429734](https://x.com/dotey/status/1891722781135429734)3⃣️🧠自监督提示词优化方法（SPO）：AI自动优化提示词，并通过生成结果进行迭代。该方法实现了自动化的优化过程，生成结果逐步提高。🔗[https://x.com/dotey/status/1891700710305149122](https://x.com/dotey/status/1891700710305149122)4⃣️🧑‍💻思维链可视化项目：

2月19日社区动态速览

[@宝玉（@dotey）](https://x.com/dotey)日报1⃣️👁️Grok 3的评测在基准测试中领先，但与竞争模型差距不大，整体表现高出1-2%。🔗[评测详情](https://x.com/dotey/status/1891877456857935999)2⃣️🤖Andrej Karpathy对Grok 3的评价Grok 3+Thinking比DeepSeek-R1强，接近OpenAI顶级模型，解决多个复杂问题。🔗[评价详情](https://x.com/dotey/status/1891722781135429734)3⃣️🧠自监督提示词优化方法（SPO）AI自动优化提示词，并通过生成结果进行迭代，逐步提高。🔗[了解更多](https://x.com/dotey/status/1891700710305149122)4⃣️🧑‍💻思维链可视化项目将DeepSeek R1的思考过程转化为可视化动画，展示跳跃与稳定阶段。🔗[项目链接](https://github.com/dhealy05/frames_of_mind)丨🔗[可视化详情](https://x.com/dotey/status/1891663134542397870)5⃣️🐞Cursor Debug提示词使用“思考可能原因”并逐步验证假设来修复问题。🔗[提示词详情](https://x.com/dotey/status/1891570972756500988)丨🔗[Git调试指南](https://git-tower.com/learn/git/faq/git-bisect/)>>更多详细内容查看[宝玉日报](https://waytoagi.feishu.cn/wiki/RleQwkybeiZ2jfkaQdgcIrrdnRd)