올 여름 초, 과학 금융업체 NWO는 네덜란드 인문학 과학자들이 '디지털 인프라'를 구축할 수 있도록 CLARIAH 프로젝트에 1,200만 유로를 지원했습니다. 그것은 무엇을 위한 것이며 어떤 이점이 있습니까? 국제사회사연구소(IISH) 소장이자 프로젝트 창시자 중 한 명인 행크 월스(Henk Wals)는 다음과 같이 설명합니다.
빅데이터 요즘은 완전 그렇네요. 인문학과 같이 전통적으로 데이터 분석을 거의 수행하지 않는 과학 분야에서도 마찬가지입니다. 그럼에도 불구하고 역사학자, 미디어 연구원, 언어학자들은 대규모 프로젝트인 예술 및 인문학을 위한 공통 연구실 연구 인프라(CLARIAH) 덕분에 곧 이 작업에 착수하게 될 것입니다. 이 프로젝트는 최근 몇 년간 인문학계에서 일어나고 있는 진정한 '혁명'의 일부입니다.
인문학 학자들은 아카이브의 문서뿐만 아니라 미디어의 텍스트, 이미지, 사운드도 사용합니다. 이제 점점 더 많은 유형의 소스를 디지털화할 수 있습니다. 디지털화된 소스의 장점은 특수한 컴퓨터 프로그램을 사용하여 검색할 수 있다는 것입니다. 컴퓨터는 디지털 역사 기록에서 특정 단어, 단어 조합 또는 단어의 변화를 빛의 속도로 스캔할 수 있습니다. 온갖 종류의 디지털 소스의 콘텐츠를 비교하고 결합함으로써 기존의 외로운 아카이브 연구자가 도달할 수 없는 결론을 도출할 수 있습니다.
하지만 그 모든 일이 일어나기 전에 도구를 완료해야 하는 몇 가지 작업이 있습니다. 개발될 예정이며 현재 이 목적을 위해 1,200만 유로가 제공되었습니다. 암스테르담에 있는 국제 사회사 연구소(IISH)의 Henk Wals 소장이 말하는 '디지털 인프라'입니다.
1,200만 달러는 큰 돈입니다. 정확히 무엇을 위해 필요한가요? “지금 인문학에는 혁명이 일어나고 있습니다. 특히 이용 가능한 연구 방법 분야의 디지털 혁명입니다. 그 혁명은 일부 지역에서 한동안 진행되어 왔습니다. 그러나 최근 몇 년 동안 점점 더 많은 자료가 디지털화되고 컴퓨터 과학이 인문학 과학자들에게 점점 더 흥미로운 일을 할 수 있기 때문에 이러한 혁명이 실제로 구체화되고 있음을 보셨습니다. 하지만 그 모든 데이터와 이를 분석하는 데 필요한 도구는 다양한 장소에 있습니다. 그렇기 때문에 이러한 도구와 데이터를 모두 통합하려면 일종의 '디지털 인프라'가 필요한 것입니다.”
그렇다면 인프라는 주로 데이터를 분석하는 컴퓨터 프로그램으로 구성된다는 것인가요? "무엇보다도 우리가 하는 일은 기본적으로 데이터와 분석 도구를 함께 가져오는 것입니다. 도구는 가능한 한 많은 유형의 데이터를 처리할 수 있는 방식으로 구성되어야 합니다. 그리고 데이터는 차례로 표준화되어야 합니다. 가능한 한 많은 도구를 사용할 수 있는 방식이므로 디지털 방식으로 서로 대화할 수 있는 데이터와 분석 도구가 필요합니다.”
“데이터에 관해 이야기할 때 이는 세 가지 유형의 데이터와 관련이 있습니다. 첫째, 서로 다른 데이터베이스에 저장된 구조화된 데이터입니다. 최근에는 비정형 데이터의 양이 증가하고 있습니다. 여기에는 아카이브의 대량의 디지털화되었지만 구조화되지 않은 텍스트가 포함됩니다. 이를 구조화된 데이터와 다르게 처리합니다. 마지막으로 영화, 사진, 오디오 등이 있습니다. 당신은 그것을 다르게 처리합니다.”
정말 빅데이터 그래서. 기존의 수공예품을 넘어서는 것인가요? "예를 들자면, IISH에는 노동조합 FNV의 기록보관소가 있습니다. 그것은 수 마일에 달하는 종이입니다. 그것은 이제 조금씩 디지털화되고 있습니다. 예를 들어, 제가 최근에 그 노동조합이 세계화에 어떻게 반응했는지 알고 싶다면, 수십년 동안 나는 모든 문서, 브로셔 및 회의록을 검토해야 했습니다. 이제 우리는 그러한 연구 질문과 관련된 모든 문서를 관련성 순서로 나열할 수 있는 데이터세트를 만들 수 있는 단계에 있습니다."피>
“그렇다고 모든 연구가 즉시 완료된다는 의미는 아니지만 훨씬 더 빠르게 데이터를 수집할 수 있다는 의미입니다. 그래프와 지도 네트워크를 생성할 수 있는 시각화 도구도 설정할 수 있다면 인문학 학자로서 새로운 통찰력을 얻는 데 많은 도움이 됩니다.”
De Groene Amsterdammer의 설문조사에 따르면 많은 인문학 학자들이 디지털 인문학을 하고 있는 것으로 나타났습니다. 해당 분야에서 가장 중요한 발전을 찾아보세요. 기존 조사 방법이 고갈되었나요? “이 디지털 혁명을 한 가지 방법을 다른 방법으로 대체하는 것으로 보아서는 안 됩니다. 해석, 잘 쓰여진 이야기 등 전통적인 방법은 남아 있지만 새로운 연구 방법으로 뒷받침될 수 있습니다. 이를 통해 새로운 결론을 도출할 수 있지만 무엇보다 더욱 입증된 결론을 도출할 수 있습니다. 그리고 이는 일종의 효율성 향상이기도 합니다. 왜냐하면 개인 과학자로서 가능한 것보다 동시에 훨씬 더 많은 것을 읽고 연구할 수 있기 때문입니다. 문서를 읽고 그로부터 예비 결론을 도출하는 기계가 있는 경우 다음이 적용됩니다.무엇이든 가능합니다 .”
따라서 이는 주로 크고 광범위한 연구 질문에 답하는 것입니다... “예, 분석하려면 엄청난 양의 자료가 필요한 질문입니다. 또 다른 예는 제가 일했던 호이겐스 연구소(Huygens Institute)에서 한 일입니다. 우리는 그곳에서 17세기 지식 발전에 관한 프로젝트를 진행했습니다. 우리는 그곳의 17세기 학자들이 보낸 수천 통의 편지를 디지털화했습니다. 그런 다음 우리는 그러한 학자 집단에서 어떤 새로운 지식이 처음으로 나타나는 곳을 알고 싶었습니다. 새로운 지식은 어디서 어떻게 논의되었으며, 그것이 한 학자에서 다른 학자에게 어떻게 전달되었습니까?”
“이를 위해서는 당시의 다양한 유럽 언어로 된 문서를 분석할 수 있는 매우 발전된 도구가 필요합니다. 그리고 통신 네트워크를 매핑할 수 있는 시각화 도구입니다. 이런 식으로 인문학 과학자로서 당신은 훨씬 더 확고한 결론을 내릴 수 있습니다. 그러한 17세기 과학자 한 사람의 서신을 검토하는 대신, 동시에 많은 것을 연구할 수 있습니다. 그러면 당신의 결론은 더욱 과학적인 방향으로 갈 것입니다. 그 결론은 훨씬 더 어렵고 더 잘 입증될 것입니다.”
그렇다면 인문학을 베타 버전으로 끌어들이기 위해 그것이 필요한가요? 인문학자들은 양적 연구가 아닌 해석에 관심을 가질 것입니다… “인문학이 과학과 같아져야 한다는 것이 아니라 이것이 합의라는 것입니다. FNV와 17세기 과학자들의 예를 들어 제가 방금 말한 것은 많은 데이터를 수집하고 이를 바탕으로 결론을 도출한다는 것입니다. 하지만 결국 우리는 여전히 아름다운 이야기를 해석하고 쓰는 인문학자입니다. 그 이야기는 이런 식으로만 더 잘 입증됩니다.”
“제 생각엔 인문학 내에서 일종의 방향 싸움이 벌어지고 있는 것 같아요. 한편으로는 이러한 새로운 방법을 지지하는 과학자들이 있고 다른 한편으로는 디지털화가 인문학에 적합하지 않다고 생각하기 때문에 이를 전혀 좋아하지 않는 사람들이 있습니다. 하지만 디지털화는 이 외에 전통적인 방법이 존재할 것입니다. 이는 결론을 더 잘 입증하는 방법입니다.”