Grok-2와 Grok-2 mini가 MathVista 테스트에서 AI 모델들 중 최고 성능 달성했습니다 출처: mathvista.github.io Grok-2와 그 경량화 버전인 Grok-2 mini는 MathVista의 testmini 서브셋에서 각각 69.0%와 68.1%의 정확도를 기록하며 1위와 2위를 차지했습니다. 이는 인간 성능(60.3%)을 크게 능가하는 결과입니다. 3위를 기록한 Claude 3.5 Sonnet(67.7%) 역시 우수한 성능을 보였지만, Grok-2 모델들의 성능에는 미치지 못했습니다. 이러한 결과는 Grok-2 모델이 수학적 시각 추론 능력에서 현존하는 최고 수준임을 시사합니다. 이런 상황에서 많은 사람들이 AI 기술 발전의 다음 단계로 주목받고 있는 OpenAI의 GPT-5 공개를 기대하고 있습니다.