

세계 4대 AI 석학 중 한 명인 **얀 르쿤(Yann LeCun)**은 메타(Meta)를 떠나며 그 답변을 행동으로 보여주었습니다. 그가 제시하는 미래, 그리고 그 핵심에 있는 LeJEPA와 **월드 모델(World Model)**의 개념을 정리해 드립니다.
최근 AI 업계의 가장 뜨거운 논쟁 중 하나는 **”현재의 LLM(거대언어모델) 방식이 과연 인간 수준의 지능(AGI)에 도달할 수 있는가?”**입니다.
1. LLM의 결정적 한계: ‘말’은 잘하지만 ‘세상’은 모른다
얀 르쿤은 현재의 GPT와 같은 LLM 방식을 **”자동 완성의 고도화”**일 뿐이라고 비판합니다.
- 텍스트의 한계: 인간이 평생 읽는 텍스트 양보다 훨씬 많은 데이터를 학습해도, LLM은 “고양이가 식탁에서 떨어지면 어떻게 될까?”라는 물리적 상황을 완벽히 이해하지 못합니다.
- 확률적 추론: LLM은 다음에 올 ‘가장 그럴듯한 단어’를 예측할 뿐, 실제 세상의 인과관계나 물리 법칙을 계산하지 않습니다.
- AGI로의 불가능성: 르쿤은 텍스트 데이터만으로는 현실 세계의 복잡한 메커니즘을 배울 수 없으며, 따라서 LLM 전략만으로는 진정한 지능에 도달할 수 없다고 단언합니다.
2. 얀 르쿤의 대안: 월드 모델 (World Model)
르쿤이 메타의 단기적 성과(LLM 고도화)를 뒤로하고 선택한 길은 월드 모델 연구입니다. 이는 아이가 세상을 배우는 방식과 흡사합니다.
- 직관적 물리 이해: 아이는 “중력”이라는 단어를 배우기 전에, 물건을 놓으면 아래로 떨어진다는 사실을 눈으로 보고 ‘예측’합니다.
- 상황의 예측: 단순히 문장을 이어가는 것이 아니라, 특정 행동을 했을 때 주변 환경이 어떻게 변할지 시뮬레이션하는 능력을 말합니다.
- 확장의식(Expanded Consciousness)과의 연결: 이는 단순히 정보를 처리하는 단계를 넘어, 외부 세계와 상호작용하며 그 구조를 내면에 구축하는 과정입니다.
3. 새로운 패러다임: V-JEPA (LeJEPA)
얀 르쿤의 철학이 투영된 구체적인 아키텍처가 바로 **V-JEPA(Video Joint-Embedding Predictive Architecture)**입니다. (시놉시스에서 언급된 LeJEPA는 르쿤의 JEPA 방법론을 통칭합니다.)
JEPA의 작동 원리
| 구분 | 기존 LLM (Generative) | JEPA (Predictive) |
| 학습 대상 | 사라진 픽셀이나 단어를 ‘복원’ | 추상적인 공간에서 다음 ‘상황’을 ‘예측’ |
| 핵심 목표 | 모든 세부 사항을 다 맞추려 함 | 불필요한 정보는 버리고 핵심 구조만 파악 |
| 효율성 | 계산 리소스가 엄청나게 소요됨 | 훨씬 적은 데이터로 세계의 법칙을 학습 |
JEPA는 영상의 다음 장면에서 어떤 일이 벌어질지를 **잠재 공간(Latent Space)**에서 예측합니다. 예를 들어, 나뭇잎이 흔들리는 세세한 움직임을 계산하는 대신 ‘바람이 불고 있다’는 상황의 본질을 이해하는 방식입니다.
4. 갈라진 두 길: 승자는 누가 될 것인가?
현재 AI 업계는 거대한 갈림길에 서 있습니다.
- OpenAI / Google: “더 많은 데이터와 더 큰 컴퓨팅 파워(Scale)가 결국 지능을 만들 것이다.”
- 얀 르쿤: “근본적인 설계(Architecture)가 틀렸다. 세상을 관찰하고 이해하는 월드 모델이 필요하다.”
메타가 단기적인 서비스 성과를 위해 LLM에 집중하는 사이, 르쿤은 향후 10년을 내다보는 **’인간다운 AI’**를 향해 독자적인 길을 걷기 시작했습니다. 그가 말하는 대로 “말만 번지르르한 AI”가 아닌 “세상을 아는 AI”가 등장할 때, 우리는 비로소 진정한 AGI를 목격하게 될지도 모릅니다.
