이 편지들은 런던 기록 보관소에서 우연히 발견되었습니다. 17세기와 18세기에 선원들과 집에 머물렀던 사람들 사이에 쓰여진 수천 통의 편지입니다. 언어학적 전처리를 통해 우리는 우리 언어의 역사에 대해 많은 것을 배울 수 있습니다.
Ijck는 내 사랑하는 남자가 하늘에 별이 있는 것처럼 너무 밝게 잘 자라고 칭송합니다 (사랑하는 남편이 하늘에 별만큼 많은 좋은 밤을 보내길 바랍니다)
오래 전 사랑하는 집에서 선원에게 보낸 편지입니다. 이 편지는 바다나 먼 고향 전선에 있는 네덜란드 사람들이 보낸 38,000통의 개인 및 사업 편지와 문서 모음의 일부이며, 그 반대의 경우도 마찬가지입니다. 편지는 17세기와 18세기 개인화 기간 동안 캡처되었으며 수세기 동안 영국 기록 보관소에 보관되었습니다. 그것들은 1980년에 재발견되었으며 그 중 일부는 역사가와 언어학자들의 연구를 위해 네덜란드에서 이용 가능해졌습니다.
보통 사람들의 언어
우리가 알고 있는 대부분의 역사적 문헌은 서면 표준에 따라 의도적으로 쓴 글을 읽고 쓸 줄 아는 사람들에게서 나옵니다. 이 편지들은 그렇지 않습니다. 이들 편지 작성자의 언어는 그들 중 다수가 글쓰기에 그다지 익숙하지 않았음을 보여줍니다. 시작과 끝 부분에 다음과 같은 관례적인 공식이 있는 경우가 많은 것이 사실입니다.당신도 잘 지내길 바랍니다. 그렇지 않으면 매우 슬플 것입니다. 그러나 당시의 구술 언어와 밀접하게 관련된 철자, 단어 및 문장 구성도 셀 수 없이 많습니다. 그리고 바로 여기에 문자의 가치가 있습니다. 여기서 우리가 발견하는 것은 평범한 사람들의 다듬어지지 않은 언어입니다. 지금까지는 이렇게 많은 양이 제공되지 않았습니다.
언어 변이 연구
Leiden의 Letters as booty 프로젝트에서 하위 집합(말뭉치 ) 약 1000개의 편지를 조사했습니다. 라이덴 언어학자들은 주로 사회 계층과 관련된 언어 차이에 중점을 둡니다. 그들은 또한 말뭉치의 17세기와 18세기 부분 사이의 언어 변화를 살펴봅니다. 연구자들은 또한 이 말뭉치를 추가 연구에 사용할 수 있게 만들고 싶어합니다. 결국 철자법, 방언 형태, 문장 구조 등에 관한 온갖 종류의 질문이 여전히 남아 있습니다. 여기에는 컴퓨터가 중요한 역할을 합니다. 이렇게 다양한 텍스트를 언어 연구에 적합하게 만들려면 어떻게 해야 할까요? 첫 번째 단계는 손으로 쓴 텍스트를 정확하게 입력(기록)하는 것입니다. 그러나 그것만으로는 충분하지 않습니다. 모든 종류의 단어와 문장 패턴을 빠르고 완벽하게 검색하려면 추가 처리가 필요합니다. 이 코퍼스는 라이덴에 있는 네덜란드 어휘학 연구소(INL)에서 언어적으로 풍부해졌습니다. 이는 철자법, 품사 등 모든 종류의 언어 정보가 전사된 단어에 추가된다는 의미입니다.
100개 이상의 철자
편지를 쓸 당시에는(현재 Green Book에서와 같이) 공식적인 철자법 합의가 없었기 때문에 동일한 단어를 다양한 방식으로 쓸 수 있었습니다. 캡틴이라는 단어 예를 들어 captijen,을 포함하여 100개 이상의 철자에서 나타납니다. 대문자 그리고 케이틴 또 다른 예는 부츠맨입니다. 그것도 보스맨으로요 그리고 화난 남자 철자가 적혀 있어서 우리가 알아보기가 어렵습니다. 언어 편집에서는 현대 철자 captain 그리고 부츠맨 이 오래된 철자와 관련이 있습니다. 현대 표준 형식을 보조정리라고 하며 그 과정은 표제어 정리입니다. 이렇게 하면 모든 오래된 철자 변형을 한 번에 수집할 수 있습니다.
편지에서 우리는 글에서 느슨하게 쓰여진 단어 부분도 발견합니다. 예를 들어 캡션 대신 이 두 개의 별도 단어를 표제어로 묶을 때 기본형 opschrift 첨부된. 글로 써 같은 단어와 다른 점은 이렇습니다. 각 단어에는 자체 보조정리가 있습니다. 이러한 현대적인 보조정리를 추가하면 텍스트를 더욱 이해하기 쉬워집니다.
피트 삼촌 또는 피트 삼촌
현대의 보조정리 외에, 오래된 단어에 단어 유형 지정도 추가됩니다. 따라서 해당 단어가 명사, 부사, 동사 등인지 여부가 표시됩니다. 이름에는 특수 코드가 부여됩니다. 이를 통해 단어 기능의 발달을 조사하고 단어 순서의 발달을 확인할 수 있습니다. 예:편지 본문에는 많은 가족 관계가 언급되어 있습니다. 많은 편지 작성자는 형제자매, 사촌, 숙모, 삼촌에게 안부를 전합니다. 이름은 관계 지정 앞에 오는 경우가 많습니다. Piet 삼촌, 사촌 존 또는 마이케 모에이 (문제 =이모). 하지만 그 반대의 경우도 발생합니다.nicht Geesje 또는 더크 삼촌 삼촌/사촌/피곤함을 검색하여 고유명사가 앞이나 뒤에 있으면 한 주문이 다른 주문보다 더 자주 발생하는지 빠르게 확인할 수 있습니다. 그런 다음 이것이 시간, 장소 또는 사회 계층과 연관되어 있는지 판단할 수도 있습니다.
어휘의 확장
실제로 WNT와 같은 종이 사전은 이러한 누락된 단어를 보완해야 합니다. 그러나 그것은 너무 비싸다. 디지털 데이터베이스에 새로운 단어를 추가하는 것이 훨씬 더 좋고 저렴한 솔루션입니다. bolkop과 같은 단어가 누락되었습니다. 그리고 심술궂다 따라서 INL의 중심 어휘에 포함됩니다. 매우 오래된(6세기)부터 최근까지의 모든 네덜란드어 단어가 해당 데이터베이스에 저장됩니다. 레이블로서 공식 규칙에 따라 철자가 표기된 현대적인 형식을 갖습니다. 이렇게 하면 역사적 단어 형태에 대한 사전 지식이 없더라도 모든 사람이 이 역사적 어휘에 접근할 수 있습니다. 장기적으로는 각 단어를 다른 단어와 연결하는 것도 가능합니다(예:mother 그리고 너 ), 사전 및 백과사전의 정보와 함께 제공됩니다. 이러한 방식으로 당시의 편지 작성자들은 수세기 후에 네덜란드어 어휘를 설명하는 데 기여했습니다.
자세히 보기
- 역사 사전 및 중앙 데이터베이스:INL 웹사이트
- 문자에 담긴 언어에 대한 연구
- 국립문서보관소의 편지
- 자원봉사자의 전사
- 오래된 편지는 옛 언어 사용에 대한 통찰력을 제공합니다(지식 링크)
- 모든 사람이 접근할 수 있는 수천 통의 탈취된 편지(지식 링크)