设为首页加入收藏
  • 首页
  • 热点
  • 知识
  • 时尚
  • 探索
  • 综合
  • 娱乐
  • 当前位置:首页 >风台视 >反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

    反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

    发布时间:2025-07-13 12:32:15 来源:视角吃瓜网- 每天追踪文化视角,乐享丰富时光 作者:风趣追

    2 月 16 号,反超马斯克在 X 上发布了一条自家 Grok 3 模型的克钞发布预告。

    并配文“地球上最聪明的砸出k终 AI”要来了。

    北京时间 2025 年 2 月 18 日中午,于上马斯克如约带领着 xAI 的反超工程师和研究团队开启了 Grok 3 的首发实况。

    这次发布会主要分为三个部分,克钞快手大V情感爆料合集介绍了 Grok 3 在训练上比 Grok 2 多投入了 10 倍的砸出k终计算资源,解锁了更强大的于上计算能力,展示了基于 Grok 3 的反超 AI Agent,展现了 xAI 团队在自主智能体领域的克钞最新进展。

    反超 DeepSeek?砸出k终马斯克「钞能力」砸出来的 Grok 3 终于上线了

    各项能力一骑绝尘

    “我们非常高兴能够推出 Grok3,我们认为,于上越南外籍技师整套流出在很短的反超时间内,它的克钞功能比 Grok2 强大一个数量级。这要归功于一支不可思议的砸出k终团队的辛勤工作,我很荣幸能与这样一支优秀的团队合作。”马斯克在发布会上说道。

    马斯克还透露,Grok 3 由 Colossus 超级计算机训练完成,这台计算机是在短短八个月内建成的,搭载了 10 万颗英伟达 H100 GPU,提供了超过 2 亿 GPU 小时的计算资源——是 Grok 2 的10倍。

    据 xAI 团队介绍,xAI 最开始搭建这个 10 万 GPU 集群用了 122 天,后续拓展到 20 万  GPU 集群仅用了 92 天。显著的算力提升让 Grok 3 能够更高效地处理庞大信息集,缩短训练时间。随即他们便晒出了一组和 ChatGPT 的信息对比图,并表示虽然 Grok 起步较晚,但在 MMLU 得分上以超快地速度追上了 ChatGPT。

    反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

    并且 Grok3 在 LMSYS(大模型竞技场)中的排名也是一骑绝尘。

    反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

    其中 Grok-3 和 Grok-3 mini 在多方面性能上都超过或媲美 Gemini、DeepSeek 和 ChatGPT 等对手。

    发布会列出的信息显示,Grok-3 和 Grok-3 mini 在数学、科学和编程的基准测试中,表现超越了所有主流模型,包括 GPT-4、Claude 3.5 Sonnet、DeepSeek-V3 和 Gemini-2 Pro等。

    而 Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 这两个版本,则凭借强大的推理能力,超越了像 DeepSeek-R1 和 OpenAI o3 mini 等推理模型。

    反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

    此外,xAI团队还现场演示了一个任务,要求Grok-3在现场生成一段关于太空发射的3D动画代码。在大约两分钟的思考后,Grok 3生成了可直接运行的Python代码,成功展示了可以运行的3D动画。

    除此之外团队还要求 Gork-3 制作一款类似于俄罗斯方块和宝石迷阵的游戏。在Grok-3 思考了数分钟后,给出了答案。

    最后,xAI 团队演示了一个全新的产物,基于 Grok 3 的搜索引擎 —— DeepSearch 。

    它不仅能够搜索网页并查找现有资料,还能“推测客户的真实意图”并进行思考。通过交叉对比多个信息源,它能够确保“返回最准确的答案”。

    Grok 3 搅动 AI 大模型格局

    实况结束后,不少网友纷纷发声。

    AI 大牛卡帕西总结了一下自己的“先行版”使用体验:

    首先 Grok 3 的“思考”功能非常先进,能够出色地解决复杂问题,如创建《卡坦岛》风格的棋盘游戏网页。相比之下,其他顶级模型(如 DeepSeek-R1、Gemini 2.0 Flash Thinking、Claude)未能解决相同问题。除此之外,Grok 3 也能尝试解决如黎曼假设等难题。

    其次 Grok 3还具备类似“深度研究”的搜索功能,能够提供高质量的研究问题答案。例如,它能够回答 Apple 新品发布、Palantir 股价上涨等问题。但在某些情况下,它会错误地产生幻觉(如错误的URL或不准确的事实)。

    最后在测试一些简单的“陷阱”问题时,Grok 3 表现良好,能够正确回答一些逻辑谜题。但在幽默和道德问题方面,它仍然存在一些问题,如生成重复笑话和对复杂伦理问题过于敏感等。

    但总的来说 Grok 3 整体表现接近 OpenAI 的 o1-pro 模型,并略优于 DeepSeek-R1 和 Gemini 2.0 Flash Thinking。

    反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

    Imarena.ai 官方更是在经过测试后发文称:

    Grok-3 是首个突破 1400 分的模型,在所有类别中排名第一,这是一个越来越难以实现的里程碑。

    反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

    更有网友直呼:Grok 3 可能是现实世界中在物理层面处理得最好的基础大语言模型了!当然也有网友在测试之后,认为 Grok 3 在编程方面并不是很擅长。

    值得一提的是,Grok 3 第一批获得访问权限的人将首先从 X 上的 Premium+ 订阅者开始,而普通客户何时能用上,他们也并不清楚。

    但基于网友们对 Grok 3 褒贬不一的评价,雷峰网(公众号:雷峰网)不禁猜测,这被 “钞能力” 风风火火砸出来的的 “no.1” 在权限全面放开之后会不会口碑两极反转,亦或是依旧好评如潮,稳坐 AI 大模型王座?

    时间还早,让子弹再飞一会。

    参考链接:https://x.com/i/broadcasts/1gqGvjeBljOGB?t=SX_aTsBoXc07lfSR_Aw8AQ&s=09

    雷峰网原创文章,未经授权禁止转载。详情见转载须知。

    反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

    • 上一篇:「焦虑」的体育教育,「救场」的AI体育
    • 下一篇:黑客大会遇上元宇宙:极客精神的又一次狂欢

      相关文章

      • 美考虑再向乌提供一套“爱国者”导弹系统
      • Hammerspace携手驿心科技,为中国打造超大规模AI存储解决方案
      • 舞台艺术生涯五十周年 名家新秀锦上添花 京剧名家张克将上演“看家好戏”
      • 外卖大战彻底疯狂!“一天三顿不超过10元”
      • 上半年我国汽车产销量均超1500万辆 新能源汽车表现亮眼
      • 4K镜头聚焦文物传奇,《博物馆之城》第三季圆满收官
      • 第三届北京网络视听艺术大会开幕 80部网络视听精品力作发布
      • 破解创作密码,解码市场趋势,这场研讨共探精品创作新路径
      • 事故现场“警车”司机被抓?“辽O”车牌露馅了
      • 北大卢宗青:现阶段世界模型和 VLA 都不触及本质​|具身先锋十人谈

        随便看看

      • 英国航空高管:为提振客运需求,希望英国加入中国的30天免签入境计划
      • 上合组织国家电影节闭幕,《三大队》获最佳影片
      • 全国首个官方Cosplay大赛——上海市民文化节妆造大赛启动
      • 24小时两见特朗普 以色列总理只为一件事
      • “丹娜丝”进一步减弱 中央气象台对其停止编号
      • 《最美中轴线》沉浸式探秘游!
      • 外卖大战彻底疯狂!“一天三顿不超过10元”
      • RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理
      • 阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍
      • 从《毛雪汪》看哇唧唧哇如何用“真实感”打造爆款内容
      • Copyright © 2025 Powered by 反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了,视角吃瓜网- 每天追踪文化视角,乐享丰富时光  sitemap