역사적 이야기

통계를 통해 전쟁과 테러의 이름 없는 희생자를 추적하세요

전쟁과 봉기 중에는 희생자가 얼마나 되는지 불분명한 경우가 많습니다. 인권 데이터 분석 그룹 불확실성의 한계를 대폭 줄이기 위해 부끄러운 종을 계산하는 데에도 사용되는 통계 기술을 배포합니다. 이는 정치적 결정과 이후의 정의를 위해 중요합니다. 만약 그런 일이 발생한다면 말입니다.

1999년 3월부터 6월까지 코소보의 알바니아 인구에 대한 세르비아 군대의 테러 작전으로 9000~12000명의 민간인과 반군이 사망했습니다. 기록된 사망자 수는 4,400명에 불과했지만 적어도 2002년 보고서에서는 그렇게 결론을 내렸습니다. 따라서 HRDAG(인권데이터분석그룹)가 작성한 이 보고서는 회의론과 비판을 불러일으켰습니다. 엉성하게 5천 건의 눈에 띄지 않는 죽음이 어디서 발생하나요?

개입할 것인가, 개입하지 않을 것인가

그럼에도 불구하고 평화가 회복되고 광범위한 현장 조사가 가능해진 2010년 두 차례의 조사를 통해 그들의 추정이 확인되었습니다. HRDAG는 폭력 분쟁에 대한 최고의 기록을 유지하는 것을 핵심 임무로 하는 미국 기반 조직입니다. 이는 국제 사회의 개입 여부를 결정하는 데 중요한 역할을 하는 경우가 많습니다. 그리고 물론 나중에 책임자를 지정하고 가능하다면 시도해 보세요.

HRDAG는 관찰자를 분쟁 지역 자체로 보내는 것이 아니라 가능한 한 많은 기존 소스를 사용하고 모든 데이터로부터 전체적인 그림을 공동으로 도출합니다. 물론 단순히 피해자 수를 집계하는 문제는 아닙니다. 예를 들어 시리아 내전을 참조하세요. 모든 종류의 구호 단체와 개인이 매우 혼란스러운 전투에 대해 보고합니다. 동일한 피해자가 여러 출처에서 보고되는 경우도 있습니다. 누구도 다른 피해자의 죽음을 공개하지 않습니다.

완전히 잘못된 사진

HRDAG의 연구원인 Megan Price는 제3회 하이델베르그 수상자 포럼에서 이 연구에 관해 강연했습니다. 이것은 가장 중요한 수학과 컴퓨터 공학상 수상자들이 모이는 8월의 연례 회의입니다. “다양한 당사자들이 보고하는 사상자 수를 합산하면 분쟁에 대해 완전히 잘못된 그림을 얻을 수 있습니다.” 이는 단순한 회계적 중요성보다 훨씬 더 중요합니다. 예를 들어, 뉴스 매체는 순진한 계산으로 다른 당사자가 전투에 참여한 후 갈등이 심화된다고 보도합니다. 또는 새로운 발전으로 인해 주간 피해자 수가 크게 감소했다는 메시지를 전달합니다. 이는 서방 국가의 개입 결정에 큰 영향을 미칠 수 있습니다. 아니면 무기나 돈으로 당사자 중 하나를 지원하기 위해.

이러한 지저분한 데이터에서 합리적으로 신뢰할 수 있는 추정치를 추출하는 수학적 기술이 있습니다. 소위 다중 시스템 추정입니다. (MSE). 원칙적으로 간단하지만 매우 노동 집약적인 데이터 정리에는 중복 제거가 포함됩니다. 즉, 모든 사망 보고를 고유한 개인으로 추적할 수 있도록 보장하는 것입니다. 물론 당신은 다른 이름을 가진 일부 사람들이 두 번 이상 살해된 데이터베이스를 원하지 않습니다. HRDAG는 2014년 1월까지 시리아 분쟁으로 인한 사상자 보고를 260,000건으로 집계했지만, 중복 제거 후에는 93,000건이 남았습니다. 기록된 사례들입니다. 실제 사상자 수는 어떻게 되나요?

MSE는 산토끼와 같은 동물 종의 표본이 해당 지역에 얼마나 많이 살고 있는지 추정하기 위해 한때 개발되었던 수학적 기술을 사용합니다. 기본 원칙은 캡처-재캡처입니다. 먼저 가능한 한 무작위로 약 100마리의 토끼를 잡아서 표시를 합니다. 몇 주 후에 다시 돌아와서 백 마리 정도의 토끼를 더 잡아옵니다. 개체수가 너무 크지 않다면 두 번째로 이미 태그가 붙은 산토끼 몇 마리를 잡은 셈이다. 두 표본 간의 이러한 중첩의 상대적 크기는 전체 모집단의 크기에 대한 추정치를 제공합니다(공식에 대한 설명은 위의 그림 캡션 참조). 분명히 이것은 불확실성 여유가 있는 추정치이며 그 크기는 A, B 및 M에 따라 달라집니다.

이는 또한 혼란스럽고 폭력적인 분쟁으로 인해 이름을 알 수 없는 수많은 희생자들을 셀 수 있는 방법이기도 합니다. 이러한 방법은 이전에 금기시되는 인구 중 HIV에 감염된 사람의 수와 심지어 미국의 매우 보수적인 지역의 레즈비언 수를 추정하는 데 사용되었습니다. 또한 실습을 통해 MSE가 작동하고 합리적인 불확실성 범위 내에서 신뢰할 수 있는 추정치를 제공하는 것으로 나타났습니다.

겹치는 샘플

시리아처럼 전쟁으로 전환하면 일정 기간 동안 현장에서 피해자 데이터를 수집하는 모든 조직이 표본이다. 여러 소스가 동일한 피해자를 독립적으로 보고하는 경우 이는 두 개 이상의 샘플이 중복되는 것입니다. 한 모집단에서 두 개 이상의 표본을 추출하는 경우 일부 표본이 서로 독립적이지 않을 수 있다는 점을 고려하기 위해 고급 기술을 적용할 수도 있습니다. 예를 들어, HRDAG는 코소보와 기타 여러 곳에서 발생한 분쟁으로 인해 잊혀진 죽음의 지도를 그릴 수 있었습니다.

하이델베르그에서의 연설에서 프라이스는 시리아 내전 중 언론에서 전투의 강도가 약해졌다고 보도한 한 단계의 예를 들었습니다. 이는 단순히 보고된 사상자를 집계한 것에 근거한 것입니다. HRDAG의 분석에 따르면 다양한 보고서 간의 중복이 감소한 것으로 나타났습니다. 계산 결과 전투가 막 시작된 ​​것으로 나타났습니다. 프라이스:"언론 보도에 의존한다면 그러한 갈등에 대해 완전히 잘못된 결론을 내릴 수 있습니다."

불행하게도 HRDAG와 같은 분석에는 시간이 걸립니다. 뉴스 매체가 스스로를 허용하지 않는 시간을 프라이스도 이해합니다. 그러나 그녀는 언론이 자신들이 잘하는 일, 즉 개인적인 이야기를 보도하고 피해자들의 얼굴을 보여주는 것에만 더 제한해야 한다고 주장합니다. 그리고 편집실에서 하루 만에 정리되는 온갖 종류의 무력충돌 통계와 인포그래픽은 독자와 시청자에게 큰 부담이 될 것입니다.