AI Perception Gap: 사람들이 모르는 AI의 실제 능력

AI 벤치마크 점수는 급상승하고 있지만, 대부분의 사람들은 이 변화를 체감하지 못하고 있습니다. METR의 공식 벤치마크 데이터를 기반으로, AI의 실제 능력과 대중의 인식 사이의 격차를 인터랙티브 차트로 시각화했습니다.

전체 화면으로 보기 >>

주요 발견

1. METR 벤치마크에서 AI가 보여주는 급격한 성장

METR(Model Evaluation & Threat Research)의 TH1.1 벤치마크는 실제 소프트웨어 엔지니어링 작업을 기준으로 AI 능력을 측정합니다. 최신 모델들은 4시간 제한 기준으로 50%에 가까운 작업 성공률을 보여주고 있으며, 이는 1년 전과 비교하면 극적인 상승입니다.

2. 인식과 현실의 격차

대부분의 사람들은 AI를 여전히 "챗봇" 수준으로 인식합니다. 하지만 실제로는 복잡한 코딩 작업, 연구 수행, 다단계 문제 해결 등을 수행할 수 있는 수준에 도달했습니다. 이 격차는 시간이 지날수록 더 벌어지고 있습니다.

3. 기하급수적 성장 추세

AI 능력의 성장 곡선은 선형이 아닌 지수적입니다. 대부분의 사람들이 선형적 발전을 기대하는 반면, 실제 발전 속도는 그 예상을 크게 초과하고 있습니다.

데이터 출처

METR TH1.1 공식 벤치마크
GPT-5.3-Codex: OpenAI 공식 발표 수치
Opus 4.6: Anthropic 공식 발표 수치

기술 구현

이 인터랙티브 시각화는 단일 HTML 파일로 구현되었습니다:

Chart.js 4.x - 4개의 인터랙티브 차트 (METR 바, 모델 비교, 트렌드 산점도, 격차 라인)
5개 언어 지원 - 영어, 한국어, 중국어, 스페인어, 힌디어
i18n 시스템 - data-i18n 속성 기반 ~93개 번역 키
외부 의존성 없음 - CDN만 사용, 빌드 도구 불필요

소스 코드: GitHub