5
위협 시나리오
350+
안전 성명 서명자
EU AI Act
2024-08 발효
2025-02
파리 AI Summit
한눈에 보기 (TL;DR)
- 2023-05 AI Safety 성명 — 힌튼·벤지오·하사비스·알트만 등 350+ 명 서명.
- 5대 위협: 오용, 경주, 정렬 실패, 권력 집중, 자율 추구.
- 경고파(힌튼·벤지오) vs 완화파(르쿤·응)의 두 진영 논쟁.
- 정책: EU AI Act, 영국 AI Safety Institute, Anthropic Constitutional AI.
- 2025-02 파리 AI Action Summit — 글로벌 거버넌스 분기점.
Key Facts — AI 인류 위협
| 항목 | 내용 |
|---|---|
| CAIS 성명(2023-05) | 350+ 서명, “멸종 위험” 명시 |
| 주요 경고파 | 힌튼, 벤지오, 러셀, 보스트롬 |
| 주요 완화파 | 르쿤, 앤드류 응 |
| EU AI Act | 2024-08 발효, 위험 등급별 규제 |
| 영국 AISI | 2023-11 설립, 모델 사전 평가 |
| 2025-02 정상회의 | 파리 AI Action Summit |
출처: Center for AI Safety, EU AI Act 2024, UK AI Safety Institute, Anthropic/OpenAI Research
핵심 인사이트
AI 위협 논쟁의 진짜 쟁점은 “위험의 크기”가 아니라 “불확실성 하에서 우리는 어디까지 대비해야 하는가”다.
2023년 5월 “AI Safety”라는 단어가 갑자기 글로벌 주류 의제가 됐다. AI 안전센터(CAIS)가 발표한 한 문장 성명에 제프리 힌튼, 요슈아 벤지오, 데미스 하사비스, 샘 알트만 등 350명 이상의 AI 연구자·CEO가 서명했다 — “AI에 의한 멸종 위험을 완화하는 것은 핵전쟁·팬데믹과 동일한 수준의 글로벌 우선과제여야 한다.”
위협의 5가지 시나리오
- 오용(misuse): 악의적 행위자의 화학·생물·사이버 공격
- 경주(race): 안전 검증 없이 출시하는 경쟁 압력
- 정렬 실패(misalignment): AI 목표가 인간 가치와 어긋남
- 권력 집중: 소수 기업·국가의 AGI 독점
- 자율 추구(unaligned autonomy): AI가 자기 보존을 목표로 삼음
두 진영의 논쟁
경고파(doomer): 힌튼·벤지오·러셀. AGI는 통제 어렵고 멸종 위험을 무시할 수 없다. 완화파(accelerationist): 르쿤·앤드류 응. 현재 AI는 멸종 위험과 거리가 멀고, 규제가 혁신을 막을 수 있다. 두 진영 모두 AI 안전 연구의 필요성에는 동의하나, 시급성과 규모에 큰 차이.
대응 — 정책과 연구
(1) EU AI Act(2024-08 발효): 위험 등급별 차등 규제, 범용 AI 의무. (2) 미국 행정명령(2023-10) → 트럼프 행정부 2025-01 일부 폐기, 신정책 재구축 중. (3) 영국 AI Safety Institute(2023-11): 첨단 모델 사전 평가. (4) Anthropic·OpenAI·DeepMind: Constitutional AI, Superalignment(축소), 정렬 연구.
최신 동향 (2024-2025)
2024년 11월 한국 서울에서 “AI Seoul Summit” 후속 회의가 개최됐고, 2025년 2월 파리 AI Action Summit에서는 글로벌 AI 안전 협력이 핵심 의제였다. 한편 OpenAI Superalignment 팀의 이탈(2024-05), 트럼프 행정부의 AI 행정명령 폐기(2025-01) 등 규제 후퇴 흐름도 동시 진행되며, 2025-2026년이 AI 안전 거버넌스의 분기점이 될 가능성이 높다.
주요 타임라인
- 2014Bostrom Superintelligence
- 2023-05CAIS 성명 — 350+ 서명
- 2023-11Bletchley AI Safety Summit
- 2024-05OpenAI Superalignment 해체
- 2025-02파리 AI Action Summit
마무리 — 핵심 정리
- AI 안전은 “규제 vs 혁신”의 양자택일이 아니라 설계 단계의 안전 통합 문제다.
- EU AI Act + UK AISI + 한국·일본 협력이 미국 규제 후퇴를 보완하는 구도.
- 다음 2-3년의 핵심: 국제 AI 안전 평가 표준의 합의.
자주 묻는 질문
최종 업데이트: 2025-04 · 파리 AI Summit, 트럼프 행정명령 폐기 반영