Home
News
Cloud charts
BTC/ETH Trend
Home
>
Latest
>
Body
OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性
2025-02-23 10:23:53
近日
openai
一名员
工公开
指责埃隆
马斯克旗
xai
公司
desk3
cryptocurrency
desktop
Crypto News
近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。
Web3 Desktop Trading Tool
Stay ahead of the game in the cryptocurrency space.
Previous article:
昨日今晨重要新闻汇总(2月23日)
Next article:
OpenAI employees have publicly accused xAI of misleading benchmark results for its latest AI model, Grok3
7x24 Newsflash
Hot News
Vitalik: "DAO" means "project", "official" means "scam"
Backpack Exchange已面向英国用户开放其服务
派盾:NIBI同名代币发生Rug Pull,损失约31.39万美元
香港金管局推出稳定币发行人沙盒
CIAN与Lido合作,在Base上推出wstETH Hyper-Staking Vault
Gate.io 3月储备金总额突破60亿美元,额外储备金超8亿美元
Polyhedra Network已于3月12日16时完成ZK空投快照
英FCA:不会反对加密资产相关ETN上市请求
BTC流通市值突破1.4万亿美元,续创新高
Space Nation将于3月底启动OIK代币空投
Related Recommendations
Backpack Exchange已面向英国用户开放其服务
派盾:NIBI同名代币发生Rug Pull,损失约31.39万美元
香港金管局推出稳定币发行人沙盒
CIAN与Lido合作,在Base上推出wstETH Hyper-Staking Vault
Gate.io 3月储备金总额突破60亿美元,额外储备金超8亿美元
Polyhedra Network已于3月12日16时完成ZK空投快照
英FCA:不会反对加密资产相关ETN上市请求
BTC流通市值突破1.4万亿美元,续创新高
Space Nation将于3月底启动OIK代币空投
About DESK3
About Us
Terms of Service
Privacy protection
Disclaimer
Products
News
Swap
Bridge
Cloud charts
Inscription
Wallet
Service
Help center
Announcement
Business support
Sociality