Kakao 카카오톡 사태에 대한 정리, 현재상황 왜 오랜시간 원인은? [ issue:Tracker]

2022. 10. 17. 01:07[§ Issue:Tracker]/¶News(세상을 듣는 귀)

반응형

"드디어" 카카오톡,티스토리,다음 뉴스등 , 장애 10시간만에 일부 정상화

[카톡 대란]

오전 2시 즈음 부터 카톡 메시지 수발신 기능 일부 복구 PC카톡·이미지 전송 등 기능은 아직 동작안함
다음 뉴스 서비스 일부 정상화 카카오T·카카오페이 등은 여전히 서비스 복구 중

ㅇ용어설명 

IDC : 대량의 서버가 (컴퓨터 전산장비등) 밀집해 있는 전문적인 건물 (Internet Data Center)

 
화재로 인해 멈췄던 카카오톡이 10시간 만에 다시 울렸다. 텍스트 메시지는 주고받을 수 있는 상태지만, PC 카카오톡 접속이나 이미지 전송 등 대부분 기능은 복구되지 않았다. 카카오페이지·카카오T 등 다른 카카오 서비스도 여전히 멈춘 상태다. 포털 다음의 경우 뉴스페이지만 일부 복구됐다.

카카오는 16일 오전 2시16분 자사 공식 트위터에 "현재 카카오톡 메시지 수발신 기능이 일부 복구됐다"며 "아직 완전하지 않지만 오랜 시간 기다려주신 사용자분들께 중간 공유 드린다"고 공지했다. 데이터센터 화재로 지난 15일 오후 3시30분부터 중단됐던 카카오톡 서비스는 이날 오전 1시30분께부터 일부 전송되기 시작했다. 이미지 전송이나 PC 카카오톡 접속 등 다른 기능은 아직 복구 중이다.

카카오는 이어 "카톡 로그인을 포함한 기타 오류 현상 또한 빠르게 정상화될 수 있도록 조치 중에 있다"며 "최선을 다해 작업하며, 계속해서 소식 전해드리겠다"고 했다.

카카오톡 장애는 지난 15일 오후 카카오가 임대해 사용하는 경기도 성남시 분당구 판교 SK C&C 데이터센터에서 발생한 화재로 시작됐다. 과학기술정보통신부에 따르면 화재는 15일 오후 3시19분께 전기실에서 발생했으며, 3시22분부터 서비스 전원이 차단됐다. 해당 데이터센터에는 카카오를 비롯해 네이버·SK텔레콤 등이 입주해 있다.

이번 화재로 카카오 서비스 다수가 중단됐다. 다음 홈페이지도 열리지 않았다. 이후 서비스 재개를 위한 복구 작업이 진행됐다. 장애 발생 약 8시간 만에 다음 뉴스 일부 서비스가, 약 10시간 만에 카카오톡 수발신 기능이 복구됐다. 그러나 카카오T·카카오페이지·카카오맵·멜론 등 카카오톡 계정과 연동된 카카오 서비스 일부는 아직 작동하지 않고 있다.

주무 부처인 과학기술정보통신부는 방송통신재난대응상황실을 구성해 행정안전부·소방 당국 등 관계기관과 SK C&C·카카오·네이버 등 사업자와 밤샘 복구 작업을 진행 중이다.
"당신 옆에 그 여자 누구야?"…카톡 멀티프로필 뚫렸다

카톡 복구 과정에서 무작위 노출
이용자는 개인정보 노출 여부 알 수 없는 구조
"삭제도 안 됐다"


한 전자제품 제조업체에 다니는 직장인 박 모씨는 16일 아침 사내 동기에게 전화를 받고 아연실색했다. '카카오톡 프로필에 사생활 사진이 노출된 것 같으니 조치를 해야 할 것 같다'는 연락이었다. 박 씨는 지난 여름 휴가 당시 여자친구와 함께 친밀한 포즈로 찍은 사진을 친구들 일부만 볼 수 있게 설정해놨는데, 이 사진이 직장 동료 등도 열람할 수 있도록 공개된 것이다.

16일 오전 카카오톡 기능 복구 중 일부 이용자들이 설정한 멀티프로필이 설정 범위 밖으로도 보이는 사례가 잇따라 나왔다.

멀티프로필은 카카오톡 친구별로 이용자의 프로필(개인정보)를 다르게 보여주는 기능이다. 회사 사람들에게는 회사용 프로필을, 거래처엔 거래처용 프로필을, 학교 동문들에겐 사적인 내용 프로필을 작성하는 식이다.

이날 SNS 등에 따르면 이같은 현상은 무작위로 발생했다. 일부 이용자들은 이전에 설정했던 멀티프로필이 현재 시점 프로필로 잘못 표출됐다. 다른 일부는 설정 범위 밖인 친구들이 멀티프로필을 열람할 수 있었다. 이용자가 본인만 볼 수 있도록 '나만보기' 설정을 해둔 옛 프로필 사진이 외부에 공개되기도 했다.

지난 15일 데이터센터 화재로 카카오톡 서비스가 '먹통'이 되자 이를 복구하는 과정에서 일부 데이터 오류가 발생한 것으로 추정된다. 카카오톡 서비스는 약 19시간째 장애를 겪고 있다.

문제는 누가 어느 정도 범위로 멀티프로필이 유출됐는지 각 이용자가 알 수 없다는 점이다. 보험회사에 다니는 현 모씨는 "직장용으로는 프로필 사진을 아예 설정하지 않았지만, 사적으로 친한 이들에 한해선 우울감 등 솔직한 심정을 멀티프로필로 드러낸 경우가 많았다"며 "이게 노출되면 내 입장에선 '사회적 살인'이 되는 것"이라고 말했다.

대학원생인 정 모씨는 "지도교수에게 대판 '깨진' 뒤 친한 친구들용 멀티프로필에 지도교수를 원망하는 밈(유행하는 사진이나 그림)을 프로필로 올려 뒀는데, 이게 지도교수나 랩실 관계자들에게 노출됐을 지 몰라 노심초사하고 있다"고 했다.

그는 "오전 8시께 SNS에서 '멀프 노출' 얘기를 듣고 황급히 멀티프로필 사진을 내리려고 했으나 삭제조차 할 수 없었다"며 "다른 사람이 먼저 말해주지 않으면 모르는 구조다보니 먼저 '내 멀티프로필 사진 봤냐'고 물어볼 수도 없는 상황"이라고 토로했다.

카카오에 따르면 올초 기준 카카오톡의 국내 월간활성사용자(MAU) 수는 4743만명이다. 한국 총인구 수(5178만명)의 91.5%에 달한다.

이쯤되면 카톡에 의존하는 이유가 무엇인가? 생각하지 않을 수 없고..

왜 하나의 데이터센터에 가장 기본중의 기본인 서버 이중화가 되어 있지 않았는가에 대해서 묻지 않을 수 없다.

관련 업계의 경험으로 비추어 볼때 2014년 과천 삼성 SDS 데이터 센터 화재 사건을 얘기하지 않을 수 없다.

2014년 삼성SDS 과천데이터센터 불…7시간 만에 진화

외벽 3층서 옥상까지 번져…삼성SDS "데이터 소실 없어"

 
삼성SDS 과천데이터센터 불…7시간 만에 진화어제 낮 12시25분쯤 삼성그룹의 백업데이터를 보관하는 경기도 과천시 삼성SDS 데이터센터에서 화재가 발생해 사무실과 외벽 등 2천 7백제곱미터를 태우고 7시간 만에 진화됐습니다.

건물 안에 근로자는 없었지만 떨어진 구조물 주변에 있던 삼성SDS 협력업체 직원 장모씨가 어깨를 다쳐 병원에서 치료를 받았습니다. 거센 바람으로 진화 작업에 어려움을 겪다 소방대원 300여명과 헬기 5대를 투입한 뒤 오후 7시가 넘어서야 불길이 잡혔습니다. 소방당국은 3층 외벽에 설치된 비상발전기 과열로 불이 시작한 것으로 보고 정확한 화재 원인과 피해 규모를 조사하고 있습니다.

이 불로 삼성카드 홈페이지 접속과 온라인 쇼핑몰 결제 서비스 등이 중단됐습니다.
삼성그룹의 백업데이터를 보관하는 삼성SDS 건물에서 불이 나 7시간 만에 진화됐다.
삼성SDS는 불이 나자 선제 대응 차원에서 삼성카드 서버를 차단했지만 데이터 소실 피해는 없는 것으로 조사됐다.
20일 낮 12시 25분께 경기도 과천시 별양동 삼성SDS e-데이터센터 3층 외벽에서 불이 났다.

화재로 떨어지는 삼성SDS 과천센터 외벽 일부20일 오후 경기도 과천시 삼성SDS 과천센터 외벽에 화재가 발생해 소방대원들이 진화작업을 하고 있다. 소방당국은 외벽에 설치된 연통에서 화재가 시작된 것으로 보고, 진화작업을 마치는 대로 정확한 화재 원인과 피해 규모를 조사할 예정이다.
불은 외벽을 타고 10층짜리 건물 옥상까지 번져 외벽 1천591㎡와 10층 사무실 일부 등 모두 2천700㎡를 태운 뒤 오후 7시 24분께 꺼졌다.
소방당국은 오후 10시 현재 각 층을 돌며 잔불이 없는지 확인하고 있다.
 

경찰과 소방당국은 3층 외벽에 설치된 비상발전기에서 배기가스를 빼내는 연통에서 과열 등 원인으로 불이 시작한 것으로 보고 정확한 화재 원인과 피해 규모를 조사하고 있다.
삼성SDS는 외벽의 불이 일부 내부로 옮아붙은 10층에 있는 삼성카드 서버 피해를 막기 위해 오후 5시께 서버를 차단, 삼성카드 홈페이지 및 모바일 접속, 온라인 쇼핑몰 결제, 앱 등을 이용한 서비스, 카드 결제 후 알림문자서비스가 중단됐다.
삼성SDS 관계자는 "정확한 피해 규모는 아직 파악 중이지만 백업데이터에 관한 피해는 없다"며 "혹시 피해가 있더라도 메인데이터는 수원센터에 보관 중이므로 소실 우려는 없다"고 밝혔다.

해당사건 이후 모든 IDC (데이터 센터로 통칭) 에서는 재난대응방지 용어로는 Disaster Matrix 를 입주자 별로 모두 마련하게 되었었다. 서버 이원화 및 실제 서버와 백업 (대체서버 형태)를 전환하는 각종 플랜을 세웠었다.

하지만 고작 8년만에 아무 대비책 없는 국민 메신저라는 카카오톡으로 자영업등 운영에 필수 요소나 뱅킹에 당연히 큰 타격을 입히고 말았다.

이번 사태는 국민들이 91%이상이 사용하는 단순 메신저 서버의 다운이 아니다. 

분명 화재라는 불가항력적인 일이라고 기대고싶은 카카오그룹 이겠지만 서버나 서비스와 연동된 복잡한 구성 탓을 할게 아니다.

2014년 IDC의 화재 이후로 반드시 대응책을 마련하도록 한 것은 같은 맥락일 것이다.

서버의 이중화는 이런 형태로 이루어 진다.

데이터 센터 주요 재난 복구 대책 : 서로 다른 건물로 주 서버와 보조 서버를 나누는 것 

한마디로 현재 돌아가는 서버가 한 IDC에서 운영중이라면 똑같은 복제가 다른 건물에 운영되어 한 건물에 화재가 나더라도 문제가 남과 동시에 전환이 가능한 상태를 의미하는 것이다.

그 사이에는 네트워크 커넥션이 있는데 개인적인 소견으로 위에서 설명한 것 처럼 멀티프로필이 꼬인다던지 하는 현상을 설명해볼 수 있다.

데이터 무결성 이라고도 하는데 지속적으로 업데이트 되는 데이터에 대한 주 서버와 보조 서버에 대한 데이터가 일치 되어야 하는 것을 일컫는 말이다.

아마 전 이중화가 되어 있지 않은 상태에서 급하게 복구를 시도 하다가 지금같은 사태가 발생 한것으로 보인다.

10시간은 이 데이터 검증이나 각종 은행 업무등 방대한 양의 데이터에 대한 무결성 (데이터 차이)를 최소화 하기 위함이 아니었을까 생각해본다.

 

다운된 10시간은 누군가에게는 생계가 잠시 중단되는 일이 되었을 수도 있고, 누군가는 급한 연락을 하지 못해서 약속을 지키지 못하는 사소한 일 까지 예상을 해 볼수 있다.

하지만 과독점에 폐해와 이것으로 인한 대체 솔루션이 반드시 필요하다는 점은 짚고 넘어갈 필요가 있다.

너무 한 기업의 메신저에 의존적으로 사업이 진행되고 국민들도 어쩔 수 없게 쓰게 되고 있지 않은가 생각해본다.

하지만 국민 90%가 사용하는 메신저 및 각종 생활밀접 앱과 솔루션을 제공하는 업체라면 적어도 이정도 사태보다 더 나아가는 대책으로 장애 시간을 최소화 하는 노력은 보였어야 했다.

실망스러운 카카오그룹.

issue:Tracker

 

반응형