马斯克发布的Grok-3,各种评测上都很强。考虑到Grok的起步晚,开始的时候各种差,还得是马斯克,v3版本就赶上来了!
1. 首个在lmarena.ai突破 1400 分的模型!
2. 编程、数学、指令遵从、创意写作、长查询、多轮查询……等都是第一
3. 在各种测试中,它的表现优于其他顶级 AI 模型,如 Gemini-2 Pro、GPT-4o、Claude 3.5 Sonnet和 Deepseek v3。
4. 数学和科学表现智能:它在美国邀请数学考试(AIME)中取得了令人印象深刻的96分,在研究生水平的问题解答(GPQA)中取得了85分,与完整的o3模型的表现相匹配。
以上就是马斯克发布的Grok-3,各种评测上都很强的详细内容,更多请关注全栈开发网其它相关文章!