드디어 AI의 추론능력이 수능 국어 영역 1등급을 받는 수준까지 올라섰다. 거대언어모델(LLM, Large Language Model)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면, Open AI의 Chat GPT o1-preview 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급 권에 도달했다.
올해 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 것으로, 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다. 복잡한 추론이 필요한 수능 국어에서 기존 AI는 3~9등급 사이 점수를 받으며 고전해 왔는데, 최근 AI의 추론 능력이 비약적으로 발전하면서 고득점 획득에 성공한 것이다. 챗GPT 기존 모델인 GPT-4o (2024년 5월 출시)모델는 지난해와 올해 수능에서 모두 중위권 학생 수준인 4등급을 기록했다.
유일하게 틀린 문제는 8번 비문학 지문이었다. 이 문제는 2025수험생들이 가장 높은 오답율을 기록한 문제이기도 하다.
이 결과는 o1-프리뷰가 상위 4%의 언어 수준과 논리력을 갖췄다고 볼 수 있으며, 리더보드는 깃허브에서 과정과 세부 사항를 자세하게 확인할 수 있다.
'IT' 카테고리의 다른 글
인공지능 기술 위험 막는다‥'AI 안전연구소' 출범 (43) | 2024.11.27 |
---|---|
MS 사티아 나델라, '기술을 위한 기술을 넘어, 실제 성과로 전환하는 것이 중요' (43) | 2024.11.24 |
로코드(Low-Code)/노코드(No-Code)의 환상 (58) | 2024.11.21 |
KAIST의 4족 보행로봇 '라이보', 세계 최초 마라톤 풀코스 완주 (61) | 2024.11.19 |
내년 ICT 산업 키워드는 'AI'…산업 생산 규모 575조 (60) | 2024.11.18 |