지난 18일 저녁 챗GPT와 X, 중국·유럽의 주요 AI 서비스, 글로벌 쇼핑·게임 플랫폼까지 곳곳에서 접속 장애가 발생해 소비자 불편을 초래했다.
AI 기반 서비스가 금융·쇼핑·검색·번역 등 일상 영역으로 깊숙이 들어온 가운데 이 같은 장애는 단순 불편을 넘어 사회적 위험으로 번질 수 있음을 경고한 사례로 받아들여지고 있다.
19일 연합뉴스에 따르면 웹 인프라 기업 클라우드플레어는 전날 오후 8시 48분(한국시간) 내부 서비스의 성능 저하가 발생하기 시작했다고 밝혔고, 주요 웹사이트의 장애를 모니터링하는 '다운디텍터'도 같은 날 오후 8시30분께부터 클라우드플레어를 비롯해 대다수 사이트에서 장애 보고가 급증했다는 모니터링 결과를 게시했다.
클라우드플레어는 웹사이트가 원활하게 운영되도록 지원하고 온라인 위협에서 보호하는 인프라를 제공하는 기업으로, 전 세계 인터넷 트래픽의 약 5분의 1이 거치는 클라우드플레어의 네트워크에 문제가 생기면서 대규모 인터넷 장애가 발생한 것이다.
클라우드플레어 관계자는 "협정세계시 기준 11시20분(한국 시간 18일 오후 8시20분)부터 한 서비스로 유입되는 비정상 트래픽이 급증하는 것을 확인했다"며 "이로 인해 클라우드플레어 네트워크를 통과하는 일부 트래픽에 오류가 발생했다"고 블룸버그 통신에 설명했다. 다만 이번 사태의 원인인 트래픽 급증이 왜 일어났는지는 아직 파악되지 않았다고 덧붙였다.
다운디텍터는 같은 시간 오픈AI의 챗GPT와 X, 구글, 유튜브, 페이스북, 아마존 등과 온라인게임 리그오브레전드, 클라우드 서비스인 아마존웹서비스(AWS), 마이크로소프트 애저 등도 장애를 일으켰다고 전했다.
가상화폐 거래소 코인베이스와 무디스 신용평가 서비스, 미국 뉴저지 교통국의 일부 디지털 서비스도 중단 또는 지연된 것으로 알려졌다.
클라우드 플레어는 오후 11시30분 이후부터 대시보드 서비스를 복구하는 수정사항을 배포했으며 약 10분 뒤인 오후 11시42분께 "수정사항이 적용됐고 사고가 현재 해결된 것으로 판단한다"고 공지했다. 다만 이후에도 일부 문제가 남아 19일 0시 40분에도 서비스 복구에 계속 집중하고 있으며 배포 후 남은 문제를 해결하고 있다고 밝혔다.
다운디텍터도 클라우드플레어 관련 장애 보고가 18일 오후 11시 14분 1만1000여 건으로 정점을 찍은 이후 19일 오전 1시 현재는 1700건대로 줄어들었다고 표시했다.
이번 장애의 근본 원인은 글로벌 CDN(콘텐츠전송망) 사업자인 클라우드플레어의 네트워크 라우팅 오류로 추정됐다.
먼 거리의 서버에서 생성된 데이터를 가까운 지역 이용자에게 신속히 전달하는 인터넷의 핵심 기반인 CDN이 사실상 'AI 응답 속도와 안정성'을 좌우하는 병목 구간으로 작동하면서 오류 발생으로 AI 서비스 다수가 연쇄적으로 마비되며 글로벌 장애로 확산했다는 것이다.
전 세계 AI·빅테크 서비스가 소수 글로벌 CDN·클라우드 사업자에 과도하게 의존하고 있다는 구조적 현실
때문에 어느 한 곳에서 사고가 발생했어도 동시다발적으로 여러 서비스가 마비됐다.
챗GPT, X 등 글로벌 트래픽이 많은 서비스는 속도와 안정성을 위해 클라우드플레어, 아카마이, AWS 클라우드프론트 등 상위 3대 업체를 비롯해 특정 CDN을 필수적으로 사용하는데 한 CDN에서 문제가 발생하면 이를 이용하는 서비스 모두에 영향을 미치는 것이다.
클라우드 백엔드는 AI 학습 및 API 서비스 운영의 핵심 컴퓨팅 자원으로 상위 3대 업체가 전 세계 시장의 60% 이상을 점유하여 의존도가 매우 높은데 이 글로벌 백본망은 해저 케이블과 ISP(인터넷 서비스 제공사)들의 초고속 광통신 네트워크로 물리적 인프라의 지역 편중 리스크를 안고 있다.
효율성과 비용 절감을 추구하는 과정에서 이러한 집중 구조가 자연스럽게 형성됐지만, 장애 발생 시 파급력을 키우는 부작용도 함께 커졌다는 지적이다. AI 교사 플랫폼이 동시에 멈출 경우 교육의 연속성이 흔들리고, 금융 분야의 AI 기반 자동 거래 시스템이 장애를 겪으면 금융 서비스 중단으로 이어질 수 있는 것이다.
AI 기반 사회로의 전환 속도가 빨라질수록 장애 한 번의 여파가 재난 수준으로 확대될 수 있다며, AI 인프라를 전력·통신과 같은 국가 사회기반시설로 인식해야 한다는 목소리가 커지고 있다.
재난을 예방하기 위해서는 멀티-CDN과 멀티클라우드 구조로 장애 시 서로 다른 인프라로 자동 우회하도록 설계해 위험을 분산해야 하는데 운영 복잡성, 데이터 동기화, 비용 증가로 기업들이 쉽게 채택하기 어려운 상황이다. 게다가 국가별 데이터 주권 규제가 더해지면서 여러 클라우드에 데이터를 분산하는 과정 자체가 까다롭다고 한다.
때문에 정부 차원의 AI 인프라 안정성 기준 마련, 공공 백업 인프라 구축 등 국가적 차원의 위험 관리 전략의 필요성이 커지고 있다.
AI와 인터넷은 이미 하나의 생태계로 움직이고 있는 가운데 이번 장애는 단순한 기술 사고가 아니라, AI 시대의 인프라를 근본적으로 재설계해야 한다는 신호로서 앞으로는 AI 모델의 성능 경쟁만큼이나 인프라 분산 경쟁이 중요하다는 점을 환기시키는 계기로 받아들여지고 있다.
[출처 : 금융소비자뉴스]
'보안뉴스' 카테고리의 다른 글
| 중국, 양자기술 실용화 속도 높이며 산업 생태계 확장 본격화 (1) | 2025.11.27 |
|---|---|
| 세계는 지금 양자전쟁 중: 2025 국가경쟁력 판도 (0) | 2025.11.27 |
| 보안·로봇·통신 총망라…삼성전자, AI 미래 기술 40여 건 대거 공개 (0) | 2025.11.21 |
| 초고속 자동 AI 해킹 확산...보안업계 대응 분주 (1) | 2025.11.21 |
| "군화 마모까지 데이터화"…'국방 AI' 플랫폼 만든 서울대 (0) | 2025.11.14 |