o1-preview, 수능국어에서 97점으로 1등급 기록

드디어 AI의 추론능력이 수능 국어 영역 1등급을 받는 수준까지 올라섰다. 거대언어모델(LLM, Large Language Model)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면, Open AI의 Chat GPT o1-preview 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급 권에 도달했다.

올해 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 것으로, 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다. 복잡한 추론이 필요한 수능 국어에서 기존 AI는 3~9등급 사이 점수를 받으며 고전해 왔는데, 최근 AI의 추론 능력이 비약적으로 발전하면서 고득점 획득에 성공한 것이다. 챗GPT 기존 모델인 GPT-4o (2024년 5월 출시)모델는 지난해와 올해 수능에서 모두 중위권 학생 수준인 4등급을 기록했다.

유일하게 틀린 문제는 8번 비문학 지문이었다. 이 문제는 2025수험생들이 가장 높은 오답율을 기록한 문제이기도 하다.
이 결과는 o1-프리뷰가 상위 4%의 언어 수준과 논리력을 갖췄다고 볼 수 있으며, 리더보드는 깃허브에서 과정과 세부 사항를 자세하게 확인할 수 있다.

저작자표시 비영리 변경금지

'IT' 카테고리의 다른 글

인공지능 기술 위험 막는다‥'AI 안전연구소' 출범 (43)	2024.11.27
MS 사티아 나델라, '기술을 위한 기술을 넘어, 실제 성과로 전환하는 것이 중요' (43)	2024.11.24
로코드(Low-Code)/노코드(No-Code)의 환상 (58)	2024.11.21
KAIST의 4족 보행로봇 '라이보', 세계 최초 마라톤 풀코스 완주 (61)	2024.11.19
내년 ICT 산업 키워드는 'AI'…산업 생산 규모 575조 (60)	2024.11.18

보름달

o1-preview, 수능국어에서 97점으로 1등급 기록

'IT' 카테고리의 다른 글

티스토리툴바

o1-preview, 수능국어에서 97점으로 1등급 기록

'IT' 카테고리의 다른 글

관련글

티스토리툴바