역사적 이야기

화석에서 페이스북까지:모든 것이 데이터입니다

우리는 수많은 방법으로 세상에 물리적, 디지털적 흔적을 남기고, 이를 통해 데이터를 생성한다. 우리는 어떤 데이터와 정보로 구성되어 있나요? “사람들은 자신의 데이터를 좀 더 절약해야 합니다.”

진흙 속의 발자국은 보잘것없는 발자국처럼 보이지만, 그 안에는 당신이 생각하는 것보다 더 많은 정보가 담겨 있습니다. 법의학 전문가를 부르면 당신이 가지고 있는 신발 사이즈, 어떤 신발을 신었는지, 대략 언제 걸었는지, 어느 방향으로 가고 있었는지 쉽게 추론할 것입니다. 그는 아마도 당신이 얼마나 무거운지, 어떻게 걷는지 말해 줄 수 있을 것입니다. 선사시대 초식동물 Orobates pabsti 그는 진흙 속을 걸었지만 자신의 발자국이 자신의 놀라운 걷기 행동을 재구성하는 데 2억 5천만년이 넘는 시간이 걸릴 것이라는 사실을 전혀 몰랐습니다.

발자국은 단지 하나의 예일 뿐입니다. 왜냐하면 우리는 믿을 수 없을 만큼 다양한 방법으로 곳곳에 흔적을 남기고 그 방식으로 '데이터'를 생성하기 때문입니다. 현실 세계와 디지털 세계 모두에서요. 일부 흔적은 빠르게 사라집니다. 다른 것들은 지속되고 무기한 저장되며 재사용될 수 있습니다. 일부 데이터는 가치가 없습니다. 다른 데이터는 상거래를 통해 무자비하게 수익을 창출합니다. Facebook은 300개의 '좋아요'(아직 협상 가능성이 있는 주장)를 기반으로 파트너보다 귀하를 더 잘 알고 있으며 해당 정보를 사용하여 귀하만 볼 수 있는 회사 광고 공간을 판매합니다.

자연의 중앙 저장소

지구상의 생명체는 데이터 저장 없이는 살아갈 수 없습니다. 이는 노트북이나 사진첩, 문서 관리 및 클라우드 스토리지를 의미하는 것이 아닙니다. 우리 몸의 모든 세포에는 눈 색깔부터 유전병 위험까지 모든 "특성"이 기록되는 유전 코드가 포함되어 있습니다. 이 정보는 DNA 분자에 포함되어 있으며 단 4개의 문자로 된 언어로 기록됩니다. 전체 코드의 길이는 30억 개가 넘습니다. 이는 놀라울 정도로 짧은 것 같습니다. DNA 코드는 약 3GB 크기의 파일에 적합하며 스마트 스토리지를 사용하면 크기가 1GB 미만으로 줄어듭니다. 4인 가족의 전체 유전자 코드를 DVD에 쉽게 구울 수 있습니다.

유전암호의 길이는 유기체의 복잡성에 관해 많은 것을 말해주지 않는 것 같습니다. 단세포 담수 아메바 Polychaos dubium의 게놈 인간보다 약 200배 더 길다고 합니다.

하지만 우리 몸에는 많은 데이터가 들어있습니다. 생물정보학자 Rob ter Horst는 우리의 면역 체계와 성별, 나이, 유전 정보와 같은 요인이 면역 체계에 어떤 영향을 미치는지 살펴봅니다. “우리 연구 중 일부에는 테라바이트 규모의 데이터가 포함됩니다. 우리는 코드를 확인하기 위해 게놈을 여러 번 읽는 다양한 개인과 DNA가 접히는 방식과 같은 추가 정보를 봅니다."라고 그는 말합니다. "이것이 소위 후성유전체입니다. 이는 다음으로 구성됩니다. 우리의 전체 게놈이 어떻게 접혀 있는지 알려주는 정보는 개인마다 다르며 이를 위해 약 6만 곳을 조사하고 있습니다.”

이제 연구자들은 자연이 중앙 저장소를 어떻게 배열했는지에 대해 좋은 아이디어를 얻었습니다. DNA의 코드는 신체에서 특정 기능을 수행하는 다양한 단백질이 어떻게 생겼는지 알려줍니다. 후성유전체는 각 단백질의 생성량을 부분적으로 결정하는 일종의 조절 층입니다. 그러나 인간의 특성 중 하나의 유전자에 의존하지 않고 여러 유전자와 환경적 요인이 협력한 결과인 특성이 많이 있습니다. 길이는 그러한 속성 중 하나입니다. Ter Horst는 이러한 프로세스를 정확하게 모델링하고 예측하는 것이 여전히 너무 복잡하다고 말합니다.

하드 드라이브로서의 지구

생명은 유전 데이터를 저장하는 정교한 방법을 찾았지만, 이는 또한 지구에 많은 흔적을 남깁니다. 실제로 지구는 일종의 하드 드라이브, 즉 생명체가 어떻게 탄생했는지 재구성하려는 과학자들을 위한 금광이라고 생각할 수 있습니다.

라이덴의 주변 건물 위로 우뚝 솟은 Naturalis Biodiversity Center에서 그러한 종류의 과학자를 찾을 수 있습니다. 그 탑 안에는 멸종된 벌이 들어 있는 수많은 서랍, 고대 상어 이빨 상자, 거대한 매머드 뼈, 그리고 5억 년 전의 화석화된 생명체의 흔적을 기록한 암석이 있습니다. 그것들은 모두 지구와 지구상의 생명체에 대한 수십억 년의 "이야기"에 대한 정보 조각입니다.

컬렉션 관리자 Natasja den Ouden에 따르면 타워에는 습도, 온도 등 구체적이고 일정한 조건에서 보관되는 4,200만 개의 컬렉션 항목이 포함되어 있습니다.

Den Ouden 자체는 가장 오래된 표본이 약 5억 7500만 년 된 화석의 하위 컬렉션을 책임지고 있습니다. 이들은 이른바 에디아카라 시대의 다세포생물로, 아직 존재하지 않았기 때문에 식물이나 동물 범주에 넣기가 어렵다.

대부분의 유기 포자가 순식간에 사라지는 반면, 행성 지구는 일부 포자를 그렇게 오랫동안 저장하는 것이 어떻게 가능합니까? Den Ouden에 따르면 그것은 우연의 일치입니다. “그냥 운이 좋아야 해요.”라고 그녀는 말합니다. “당신이 박물관에 들어가고 싶어하는 유기체라고 가정하고, 죽은 후 몸이 퇴적물로 빨리 덮이도록 하세요. 그리고 가능한 한 산소가 적어야 합니다. 예를 들어, 산소가 부족한 호수에 빠지는 것이 몸이 빨리 부패되어 먹힐 가능성이 있는 초원에서 죽는 것보다 훨씬 낫습니다.”

모든 것이 데이터입니다

암스테르담 대학의 이론물리학자 Erik Verlinde는 모든 것이 데이터라고 말합니다. 우리의 유전 정보를 기록하는 DNA 분자부터 지각의 화석까지, 블랙홀부터 우리의 생각까지. Verlinde는 가장 넓은 시각, 즉 우주적 관점으로 '정보' 개념을 바라보고 있습니다.

모든 것이 데이터라는 관찰은 Verlinde의 중력 이론의 핵심입니다. 그 이론은 별과 은하의 움직임을 설명하려고 시도하는데, 이는 보다 고전적인 모델로는 설명할 수 없는 일입니다.

Verlinde는 중력은 우주의 정보가 어떻게 작용하는지에 대한 소위 '창발' 속성일 뿐이라고 주장합니다. '긴급'이라는 용어는 다른 속성에서 발생하는 속성으로 가장 잘 설명될 수 있습니다. 온도를 예로 들어보겠습니다. 우리는 온도를 직접 경험하지만 분자 수준에서는 물질 입자가 이동하는 속도를 측정합니다.

그리고 Verlinde가 말하는 정보는 무엇입니까? 그에 따르면 우주에 있는 모든 입자의 위치와 질량 등 우주의 전체 '상태'를 실제로 기록하는 데 필요한 데이터다. Verlinde는 또한 이를 양자역학의 양자수와 비교합니다. 이 숫자는 입자의 상태를 나타냅니다. 예를 들어 입자가 어느 방향으로 회전하는지 알려주는 스핀이 있습니다.

Verlinde는 가장 놀라운 점은 이러한 정보가 존재한다는 사실이 아니라 그 양이 유한해 보인다는 점이라고 생각합니다. 게다가 그 정보량은 변하지 않습니다. “우주 전체의 상태를 기술한 '책'은 약 10 120 캐릭터가 크다”고 말했다. “그것은 우주의 물질 분포에서부터 물질적 뇌에서 싹트는 생각에 이르기까지 모든 것을 담고 있습니다.”

정말 아무것도 사라지지 않나요? 수년 동안 물리학자들은 블랙홀이 물질을 삼킬 때 정보가 사라지는지 여부에 대해 열띤 논쟁을 벌여왔습니다. 그러면 정보는 그 블랙홀 속으로 영원히 사라지고 보편적 정보 책이 축소되는 것처럼 보입니다. 그럼에도 불구하고 이러한 데이터는 유명한 물리학자 스티븐 호킹(Stephen Hawking)이 제안한 호킹 복사의 결과로 블랙홀이 천천히 "증발"하면서 결국 다시 나타난다고 Verlinde는 말했습니다. 따라서 정보는 일시적으로만 '숨겨졌습니다'.

일상생활에서 눈에 띄는 장소

DNA, 지구, 심지어 우주 형태의 데이터는 한동안 존재해 왔지만, 데이터는 우리 일상 생활에서도 점점 더 중요한 자리를 차지하고 있는 것 같습니다. 요즘 데이터에 대한 이야기가 왜 이렇게 많은 걸까요? 세계에서 가장 강력한 기업이 데이터 기업인 이유는 무엇이며 데이터가 정부에서 과학에 이르기까지 모든 종류의 사회적 영역에서 필수적인 역할을 하는 이유는 무엇입니까? Open University의 조교수인 Hugo Jonker는 무엇보다도 이를 디지털의 특성에 기인한다고 말합니다. . 정보:보통 오랫동안 지속되며 거의 쉽게 복사, 배포 및 검색할 수 있습니다. “당신이 슈퍼마켓에 갔는데 직원들이 거기서 당신을 만났다고 가정해 보세요. 경찰이 30분 후에 그곳에 있었는지 묻는다면 직원은 더 이상 당신을 알아보지 못할 수도 있습니다. 상담원이 로컬 Wi-Fi 포인트에 연결된 전화기의 IP 주소로 데이터베이스를 확인하면 즉시 전화기를 찾아낼 것입니다.”라고 그는 말합니다.

또한 Jonker에 따르면 많은 디지털 흔적은 '실제 세계'의 흔적보다 우리에 대해 더 많은 것을 말해 줄 수 있습니다. 우리는 일반적으로 인터넷에서 훨씬 더 '효율적'입니다. 이렇게 하면 실수로 상점을 지나가듯이 웹사이트를 실수로 '지나치는' 일이 발생하지 않습니다. 당신은 무언가를 찾고 있기 때문에 특정 웹페이지를 방문합니다. 해당 정보는 무해한(표적) 광고에 사용될 수 있을 뿐만 아니라 선거에도 영향을 미칠 수 있습니다.

Jonker는 데이터(예:하드 디스크의 1과 0)와 정보(특정 상황에서 해당 데이터가 의미하는 것)를 구분합니다. 그와 같은 개인 정보 보호 전문가에게는 정보 보호에 관한 것이므로 맥락이 매우 중요합니다. “'Positie Omtzigt, 다른 곳에서 기능하다'라는 말은 새 내각의 구성 담당자의 메모에 포함되어 있지 않고 사진으로 찍히지 않는 한 큰 의미가 없을 수도 있습니다. 그러다 갑자기 정치적 다이너마이트가 된다"고 말했다.

편집자가 추천

의학선크림에 함유된 미세플라스틱은 무슨 역할을 하고 있나요?!

천문학태양, 바다 그리고 과학

생물학녹는 땅으로의 탐험

당신은 당신의 데이터입니다

이 이야기에서 당신은 무엇입니까? 단지 어떤 안경을 쓰느냐에 따라 다릅니다. 당신은 DNA 분자에 들어 있는 30억 개의 '문자'이고, 당신의 뇌가 저장한다고 하는 대략 10테라바이트에 해당하며, 우주 정보 회계 시스템의 한 조각의 정보이고, 미래를 결정짓는 화석일 수도 있습니다. 문명은 우리 종을 설명합니다. , 당신은 세상에 남기는 (디지털) 흔적입니다.

Jonker에 따르면, 우리는 이러한 흔적과 관련된 데이터에 더욱 주의해야 하며 일부 사람들이 고수하는 '나는 숨길 것이 없습니다'는 말도 안되는 소리입니다. 귀하의 정보가 어떻게 사용되고 오용될 수 있는지 생각해 볼 수 있는 방법은 항상 있습니다. 가장 고전적인 예는 New York Times가 2012년에 보도한 미국 슈퍼마켓 Target의 예입니다(NEMO Kennislink 기사의 상자 참조). 미성년 소녀의 구매 행동을 기반으로 알고리즘이 매장을 '알았습니다'. 그녀가 임신했다는 사실은 매장에서 관련 쿠폰을 보낸 후에야 그 사실을 알게 된 그녀의 아버지를 당황하게 했습니다.

슬라이드1/12

동굴 벽화:인도네시아 멧돼지인도네시아의 혹멧돼지는 알려진 가장 오래된 동굴 벽화입니다. 아마도 트로피 사냥에 대한 이야기를 하려고 했던 것 같습니다. 그림은 아직도 선명하게 보입니다. 덥수룩한 뒷털도 눈에 띕니다. 유효 기간:이미 약 45,000년

슬라이드1/12

설형 문자:바위처럼 단단한 데이터 약 5천년 전, 갈대로 점토에 긁어 만든 문자 체계가 중동에서 나타났습니다. 처음에는 많은 그림 문자가 사용되었지만 나중에는 '못 같은' 홈을 사용하여 언어가 더욱 추상적이 되었습니다. 사람들은 무엇보다도 회계를 위해 그것을 사용했습니다. 많은 (경화된) 점토판은 여전히 ​​양호한 상태입니다. 유통기한:이미 5천년, 아마도 훨씬 더 길어질 것임

슬라이드1/12

파피루스:가장 오래된 종이 오늘날 우리는 주로 연못에 심는 식물로 사이페루스 파피루스를 알고 있습니다. 5천년 전, 그 줄기는 일종의 종이인 파피루스에 압착되었습니다. 고대 이집트의 문서에는 의료 관행, 수학적 계산 및 민담이 포함되어 있습니다. 불행히도 파피루스는 습기를 잘 견디지 못합니다. 유럽에서는 거의 모든 것이 사라졌습니다. 약 2000년 전에는 양피지와 이후의 종이가 파피루스를 대체했습니다. 유통 기한 :건조한 조건에서 수천년

슬라이드1/12

유화:르네상스의 스냅건물, 도자기 및 기타 재료에 대한 그림은 이미 오래 전에 이루어졌지만 유화는 15세기에 유럽에서 획기적인 발전을 이루었습니다. 화가는 주변 세계를 캔버스에 정확하게 포착하고 기술을 실험합니다. 처음에는 작품이 본질적으로 종교적인 경우가 많았으나 나중에는 일상적인 장면과 초상화가 더 많이 등장합니다. 유통 기한 :복원까지 500년

슬라이드1/12

천공 카드:정보의 구멍 치즈 1790년 프랑스의 발명가 Joseph-Marie Jacquard는 직기를 사용하여 직물에 패턴을 자동으로 짜는 시스템을 개발했습니다. 특정 위치에 구멍이 있는 '프로그래밍 가능한' 판지 스트립을 사용합니다. 이 패턴은 기계가 실을 한 줄씩 엮는 방법을 보여줍니다. 정보 매체로서의 천공 카드는 이후 200년 동안 다용도가 있음이 입증되었습니다. 예를 들어 컴퓨터가 사용되기 전에는 배럴 오르간과 인구 조사 기록에 사용되었습니다. 유통기한:수백년

슬라이드1/12

사진:빛 캡처 사람이 포함된 최초의 사진은 1838년 파리에서 촬영되었습니다. 그 당시에는 사진을 찍는 데 몇 분이 걸렸기 때문에 사람과 같은 움직이는 물체는 일반적으로 사진 속으로 사라졌습니다. 그런데 이 신사(사진 왼쪽 아래)는 아마도 신발을 닦기 위해 한동안 가만히 서 있었습니다. 인쇄 기술에 따라 유통기한이 다릅니다. 많은 사진이 수십 년 내에 변색됩니다. 유효 기간:기술에 따라 수십 년

슬라이드1/12

세척 실린더:과거의 소리 행복한 실로폰 음표가 관악기의 음색에 맞춰 춤을 춥니다. 이 4분짜리 음악은 1912년경에 녹음되었으며 소리 진동이 '스크래치'된 왁스 층이 있는 원통 위에 있습니다. 미국 발명가 토마스 에디슨(Thomas Edison)이 1880년에 개발한 장치인 소위 축음기로 여전히 재생할 수 있습니다. 유효 기간:최소 100년

슬라이드1/12

자기 테이프:입자 충돌이 있는 수 킬로미터 로봇은 자기 테이프의 긴 랙 사이를 빠르게 앞뒤로 이동하다가 특정 테이프를 집어 들고 읽기 위해 정지합니다. 제네바 근처의 유럽 입자 연구소 CERN에서는 실험에서 얻은 원시 데이터의 상당 부분이 테이프에 저장되어 있습니다. 2019년에 조직은 330,000,000GB의 데이터를 보유했습니다. 테이프는 많은 정보를 저장하는 비교적 저렴한 방법입니다. 유효기간:수십년

슬라이드1/12

플로피:유연한 정보크기가 다양하지만 결국에는 3.5인치 변형이 가장 인기를 끌게 되었습니다. 유연한 플로피에는 게임, 연구 결과 및 기타 중요한 파일을 저장할 수 있습니다. 그러나 비트(디스크에 있는 정보의 일부)가 자발적으로 변경되기 때문에 데이터는 상대적으로 쉽게 손실될 수 있습니다. 플로피는 유통기한이 길지 않았습니다. 이제 가장 큰 문제는 이를 '읽을' 수 있는 컴퓨터가 거의 없다는 것입니다. 유통 기한 :약 10 년

슬라이드1/12

카세트 테이프:연필 다루기 수년 동안 카세트 테이프는 음악을 재생하는 가장 인기 있는 방법이었습니다. 이동 중에도 좋아하는 아티스트의 음악을 들을 수 있습니다. 스트랩의 테이프가 때때로 붙어서 연필을 사용하면 모든 것을 다시 올바르게 돌릴 수 있는 솔루션을 제공하는 경우가 많았습니다. 유효 기간:최대 약 30~40년

슬라이드1/12

컴팩트 디스크:빛나는 디스크 카세트 테이프 이후 CD가 엄청난 인기를 얻었습니다. 음악 감상은 물론 데이터 저장에도 편리합니다. 디스크를 어떻게 처리하느냐에 따라 유통기한이 상당히 달라집니다. 무방비 상태로 햇볕에 놔두시나요? 그런 다음 내리막 길로 빠르게 내려갑니다. 그러나 좋은 품질과 치료를 받으면 수명이 늘어납니다. 유효기간:수십년

슬라이드1/12

하드 디스크:티핑 비트 하드 디스크는 (휴일) 사진, 영화 및 파일을 저장하는 가장 현대적인 방법 중 하나입니다. 당신은 그것이 가장 신뢰할 수 있는 것 중 하나라고 생각할 것입니다. 잘못된! 시간이 지남에 따라 비트가 자발적으로 변경되기 때문에 하드 드라이브는 데이터 부패로 인해 어려움을 겪습니다. 유효 기간:종종 약 10년

또한 더 극단적일 수도 있습니다. 데이터는 완전히 위험해질 수 있습니다. “당신이 최근까지 아프가니스탄의 한 여학교에서 교사였다고 가정해 보세요. 지난 여름 정권이 바뀔 때까지는 괜찮았습니다. 이제 당신은 새로운 통치자들의 눈에 갑자기 의심을 품게 되고 당신에 관한 정보는 위험해집니다. 나는 단지 이것이 제2차 세계대전 당시 유대인들에게 일어난 일이 아니라는 점을 말하고 싶습니다.”라고 그는 말합니다. “그리고 간첩 행위는 동독에서만 일어난 일이 아닙니다. 파트너를 신뢰하지 않으면 파트너의 휴대폰에 몰래 접근할 수 있는 스파이 앱이 있습니다.”

개인 정보 보호 전문가로서 Jonker는 종말의 시나리오를 생각해야 합니다. 이는 악당보다 앞서고 대중과 정치인을 긴장하게 만드는 데 필요합니다. 예를 들어, 그는 특정 오류 메시지를 제공하는 여권의 전자 칩을 언급합니다. 해당 오류 메시지는 국가마다 여권마다 다른 것으로 나타났습니다. "특정 국적의 사람들이 근처에 있을 때 자동으로 폭발하는 폭탄을 설계할 수 있다고 말할 때만 뉴스가 됩니다."라고 그는 말합니다. “사실 그때서야 ​​주목을 받는 게 아쉽네요. 예를 들어, 사람들은 실제로 자신의 지갑보다 데이터를 훨씬 더 많이 다루어야 합니다. 낯선 사람이 거기를 기웃거리게 놔두지도 마세요. 왜냐하면 그 사람들은 그곳에서 할 일이 없기 때문입니다.”