오픈AI의 'o3', AGI 논쟁의 중심에 서다: 프로그램 합성 vs 단순 강화 학습 결과
본문 바로가기
AI Insight News

오픈AI의 'o3', AGI 논쟁의 중심에 서다: 프로그램 합성 vs 단순 강화 학습 결과

by AI.PixelMind 2024. 12. 27.
반응형

최근 오픈AI가 공개한 새로운 AI 모델 'o3'가 인공일반지능(AGI) 달성 가능성을 두고 뜨거운 논쟁을 불러일으키고 있습니다. AGI는 인간처럼 새로운 문제에 적응하고 다양한 작업을 수행할 수 있는 AI의 궁극적 목표로 여겨지며, o3가 이 목표에 얼마나 가까이 다가갔는지가 핵심 쟁점입니다.


o3 모델과 ARC-AGI 벤치마크

오픈AI는 ARC-AGI 벤치마크를 기반으로 o3 모델의 성능을 발표했습니다. 이 벤치마크는 AI 시스템이 새로운 패턴을 얼마나 적은 정보로 학습하고 적용할 수 있는지를 평가하는 방식으로, 인간의 IQ 테스트와 유사한 패턴 예측 과제를 포함합니다.

o3는 기존 모델 대비 큰 발전을 보였으며, 특히 다음과 같은 결과를 기록했습니다:

  • 기존 모델 o1: 최고 점수 32점
  • o3 기본 점수: 75.7점
  • 추론 시간을 늘린 경우: 87.5점

이는 인간의 평균 점수인 85점을 넘는 성과로, AGI 가능성을 암시하는 중요한 이정표로 평가받았습니다.


이미지를 누르면 확대됩니다.

논쟁의 핵심: 프로그램 합성 vs 강화학습

프로그램 합성 접근

일부 전문가들은 o3의 성과를 프로그램 합성(program synthesis)에 기반한 것으로 추정합니다.

  • AI가 문제를 해결하기 위해 작은 프로그램을 생성하고 이를 조합하여 더 복잡한 문제를 해결하는 방식.
  • 이 접근은 기존 AI 모델의 한계였던 구성성 부족을 극복하는 중요한 기술로 주목받고 있습니다.

강화학습 기반 모델의 확장

반면, o3가 기존 강화학습(RL) 방식을 단순히 확장한 모델이라는 주장도 있습니다.

  • 오픈AI 연구원 냇 매칼리스는 "o3는 기존 o1 모델의 RL 방식을 더욱 정교화한 결과일 뿐"이라고 밝혔습니다.
  • 구글 딥마인드 연구원 데니 저우는 "o3는 본질적으로 생성 공간에서의 검색(MCTS)에 의존한 방식으로, 인간과 같은 진정한 추론이 아니다"고 비판했습니다.

AGI 논쟁의 쟁점

  1. AGI로의 진화 여부
    • ARC의 공동 창립자 프랑수아 콜레는 "o3가 AGI라고 보기는 어렵다"며 "여전히 인간 수준의 지능과는 근본적인 차이가 있다"고 언급했습니다.
    • o3는 특정 데이터셋(ARC-AGI)에 최적화되어 있어, 진정한 AGI로 간주되기 위해서는 보다 다양한 테스트가 필요하다는 의견이 많습니다.
  2. 투명성 부족
    • 오픈AI가 o3의 내부 구조와 작동 방식에 대한 세부 정보를 공개하지 않아, 연구자들이 이를 검증하거나 개선 방안을 논의하기 어려운 상황입니다.
  3. 새로운 벤치마크 필요성
    • 전문가들은 ARC와 유사하지만 더 폭넓은 과제를 포함한 벤치마크 테스트가 필요하다고 주장합니다.

AGI 논쟁의 미래

현재 o3는 기존 AI 모델에서 전례 없는 수준의 성능을 보여준 것은 확실하지만, 인간 지능을 완전히 뛰어넘는 AGI로 평가하기에는 이른 단계입니다.
오픈AI가 내년 1월 예정된 비공개 테스트와 이후의 정보를 추가 공개할 경우, o3에 대한 평가가 보다 명확해질 전망입니다.


 

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

 

출처

반응형