본문 바로가기
IT

o1-preview, 수능국어에서 97점으로 1등급 기록

by 황금반달곰 2024. 11. 22.

 드디어 AI의 추론능력이 수능 국어 영역 1등급을 받는 수준까지 올라섰다. 거대언어모델(LLM, Large Language Model)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면, Open AI의 Chat GPT o1-preview 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급 권에 도달했다.

 

올해 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 것으로, 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다. 복잡한 추론이 필요한 수능 국어에서 기존 AI는 3~9등급 사이 점수를 받으며 고전해 왔는데, 최근 AI의 추론 능력이 비약적으로 발전하면서 고득점 획득에 성공한 것이다. 챗GPT 기존 모델인 GPT-4o (2024년 5월 출시)모델는 지난해와 올해 수능에서 모두 중위권 학생 수준인 4등급을 기록했다.

GPT 수능 국어영역 점수 변천

 

유일하게 틀린 문제는 8번 비문학 지문이었다. 이 문제는 2025수험생들이 가장 높은 오답율을 기록한 문제이기도 하다.
이 결과는 o1-프리뷰가 상위 4%의 언어 수준과 논리력을 갖췄다고 볼 수 있으며, 리더보드는 깃허브에서 과정과 세부 사항를 자세하게 확인할 수 있다.

깃허브 내용