Ⅰ. 서론
본 논문의 목적은 ‘빅데이터 의미망 분석’을 통해 우리나라 지역의 문화경관을 기술한 지역신문 기사를 수집해 코퍼스를 구축하고, 형용사와 명사를 추출해 네트워크로 연결하여 단어 사용 패턴과 맥락 등을 분석하는 것이다. 그리고 분석자료를 활용해 ‘문화경관 형용사 목록’ 분류 방안을 제시하고, 주요 내용을 시각화하여 지식지도 형태 등으로 나타내는 것이다.
문화경관(文化景觀, cultural landscape)이란 인간의 생존 및 경작 활동으로 변화된 자연경관 또는 인간이 특정 목적을 위해 만든 인공경관을 말한다(오정심, 2023: 165). 세계유산위원회는 문화경관이 인간과 자연환경의 상호작용과 정주지의 진화 발전을 보여주는 증거가 된다고 말했다. 그리고 1992년에 열린 제16차 유네스코 총회에서 문화경관을 세계유산으로 지정해 보호하기로 했다(UNESCO World Heritage Centre, 2008: 24). 세계유산위원회가 이러한 결정을 내리자 세계 각국도 자국의 문화경관을 보호하기 위한 각종 정책과 제도를 마련했다. 가장 눈에 띄는 움직임을 보인 나라는 유럽연합과 일본이었다. 2000년 유럽연합은 유럽경관협약(The European Landscape Convention)을 채택했다. 2004년 일본은 세계유산협약의 문화경관 개념을 도입하기 위해 관련 법을 개정했다. 그리고 농어촌 황폐화에 따른 문화경관 문제까지 고려하여 관련 사업을 운용하고 있다(노시훈, 2019: 9; 일본 문화청).
이러한 세계적인 흐름과 달리 국내에서는 아직 문화경관을 다루는 정책과 제도를 마련하지 않았다. 2007년에 제정된 ‘경관법’에 경관과 관련한 규정만 있을 뿐이다. 게다가 경관법의 위상은 도시개발법보다 아래에 있고 대부분의 경관 사업은 환경 정비 위주로 시행되고 있다. 이로 인해 종로 피맛골, 김포 장릉처럼 많은 문화경관이 도시개발과정에서 훼손되고 있다(산업연구원, 2017: 6; 오마이뉴스(2022. 7. 17.); 한국일보(2023. 3. 15)).
한편 ‘경관 형용사 목록’을 바탕으로 한 의미분별척도(semantic differential scale)1)는 경관 관련 정책이나 사업에 이용하는 대표적인 방법이다. 평가자에게 대칭을 이루는 경관 형용사 쌍의 목록을 주고 해당 경관의 특성을 가장 잘 나타내는 형용사를 고르도록 하여 응답 결과를 점수로 환산해 분석하는 방법이다(오정심, 2023:163; 이원식, 2019: 92).
경관 관련 정책이나 사업에서 경관 형용사는 중요한 역할을 한다. 형용사를 통해서 경관의 특성을 파악할 수 있기 때문이다. 경관은 인간이 바깥세상을 보고 지각하는 행위를 해야만 존재할 수 있는 개념이며, 인간이 바깥세상을 볼 때면 언제나 감정이 따르게 된다. 그런데 감정은 정량적 측정을 할 수 없으므로 감정을 표현하는 말 즉 형용사를 통해 경관의 특성을 파악하는 것이다.
‘경관 형용사 목록’은 경관의 특성을 나타내는 형용사를 모아서 체계적으로 분류한 것이다. 경관 형용사 목록과 관련한 연구는 외국에서 활발히 이뤄졌다. 1971년 크레이크(Craik, K. H.)가 제시한 경관 형용사 목록(landscape adjective checklist)과 1979년 화이머(Feimer, N. R)가 제시한 경관 형용사 목록을 대표적인 예로 꼽을 수 있다(Lawrence, 1978:35). 특히 화이머가 제시한 목록은 우리나라 연구에도 자주 인용되고 있는데, 자연경관의 특성을 설명하기 위해 뽑은 240개 형용사가 체계적으로 정리돼 있다. 이밖에 미국 토지관리국에서 제시한 경관 관련 어휘 목록(132개 어휘)와 영국 환경평가학회와 조경학회에서 제시한 경관현장조사 목록(48개 어휘) 등이 있다(주신하ㆍ임승빈, 2003: 2; 구민아ㆍ엄붕훈ㆍ한예서, 2018: 188).
국내에서 경관 형용사 목록과 관련한 연구는 부족한 형편이다. 선행연구 대부분이 외국의 경관 형용사 목록을 번역해 쓰거나, 기존 연구에서 제시한 목록에 대해 적합성 평가만 추가하여 쓰고 있다(주신하ㆍ임승빈, 2003: 2; 반영운 외, 2012: 96). 그런데 외국의 경관 형용사 목록은 영어로 되어 있어서 우리나라 경관을 분석하기에 적합하지 않다. 그래서 주신하ㆍ임승빈의 연구(2003)를 비롯한 몇몇 선행연구에서 이를 문제로 지적하고 한국어로 된 경관 형용사 목록을 개발해 제시했다. 하지만 이 연구들은 경관 형용사를 관련성이 적은 텍스트에서 수집하거나 설문조사를 통해 수집하여 대표성이 떨어지는 문제를 안고 있다.
이에 본 연구에서는 선행연구의 한계를 뛰어넘기 위해서 ‘빅데이터 및 의미망 분석’을 통해 문화경관 관련 텍스트를 총망라해 수집하고, 분석자료를 활용해 ‘문화경관 형용사 목록’ 분류 방안을 제시할 것이다. 빅데이터 분석 방법은 표본을 추출하지 않고 데이터 전체를 분석하기에 데이터 누락이나 대표성 논란과 같은 문제가 나타날 가능성이 작다.
2. 이론적 배경
사전에서 경관(景觀)의 뜻을 찾아보면 ‘산이나 들, 강, 바다 따위의 자연이나 지역 풍경’이라고 설명돼 있다. 문화경관은 ‘자연경관에 인간의 영향이 가하여져 이루어진 경관’이라고 설명돼 있다(표준국어대사전). 그런데 바깥에 산이나 강이 있다고 해서 그것을 가리켜 경관이라 하지 않는다. 경관이 존재하려면 ‘경(景)’과 ‘관(觀)’이 모두 갖춰져야 한다. 다시 말해, 경관이 존재하려면 ‘바깥세상에 놓인 볼거리(景)’와 ‘사람의 보는 행위(觀)’가 있어야 한다2)(황기원, 2011: 21). 같은 환경 속에 사는 사람이라도 보는 행위를 하는 사람에게 환경은 경관이 될 수 있지만, 보는 행위를 하지 않는 사람에게 환경은 생존 환경에 불과하듯이 경관이 존재하려면 ‘경(景)’과 ‘관(觀)’이 모두 있어야 한다.
경관은 인간 활동의 영향의 여부에 따라 자연경관과 문화경관으로 구분한다. 자연경관(自然景觀)은 인간의 손길과 발길이 닿지 아니한 자연 그대로 있는 경관을 말한다. 이와 달리 문화경관(文化景觀)은 인간의 손길과 발길이 닿아 변화된 자연경관 또는 인간이 특정 목적을 위해 만든 인공경관을 말한다(오정심, 2023:163). 문화경관은 인간 활동의 영향 정도에 따라 여러 갈래로 나눌 수 있는데, <표 1>은 그 내용을 요약한 것이다.
자료 : 오정심(2023: 163) 보완.
이처럼 경관은 크게 자연경관과 문화경관으로 구분하며 문화경관도 인공 정도에 따라 결합 경관, 관리된 경관 등 6개 세부 유형으로 분류한다. 따라서 경관 형용사도 경관 유형에 따라 구분해 쓰는 것이 바람직하다. 본 논문에서는 문화화된 자연경관 중에서 ‘결합 경관’, ‘관리된 경관’과 인공경관 중에서 ‘경작된 경관’을 중심으로 문화경관 형용사를 연구할 것이다. 이는 일본에서 농어촌 황폐에 따른 문화경관 문제를 고려하여 관련 제도를 운용하고 있는 것에 착안한 것이다.
빅데이터 분석이란 아주 큰 규모의 데이터에서 새로운 정보와 통찰 따위를 얻어서 문제를 해결하는 방법을 말한다. 빅데이터 분석 작업에 이용하는 기법에는 데이터 마이닝, 시맨틱 네트워크 분석 등이 있다(오정심, 2022: 51). 본 연구에서는 시맨틱 네트워크 분석(semantic network analysis, 의미망) 기법을 이용할 것이다. 이것은 간단히 말해 비정형 텍스트를 형태소 의미망으로 만들고 여기서 일정한 패턴, 숨은 정보과 의미 등을 발견하는 방법이다.
빅데이터 분석은 ‘데이터 수집’, ‘데이터 전처리’, ‘데이터 분석’, ‘해석 및 평가’ 등과 같은 단계로 진행한다. 이 중에서 중요한 부분을 하나 꼽으라면 ‘데이터 전처리’이다. 데이터의 전처리 정도에 따라 분석 결과의 정확도가 달라지기 때문이다. 데이터 전처리 작업은 비정형 데이터를 정형화된 데이터로 바꾸거나 데이터에서 불필요한 내용을 없애는 일이다. 여기서 비정형 데이터란 인터넷 블로그 게시글, 뉴스 기사와 댓글과 같이 일정한 형식과 구조가 없는 데이터를 말한다. 비정형 데이터는 컴퓨터가 읽을 수 없기에 전처리 작업을 하여 컴퓨터가 읽을 수 있는 형태로 바꿔줘야 한다(함유근ㆍ채승병, 2017: 24; 오정심, 2022: 23). 데이터 전처리 작업에 이용하는 대표적인 기술로 형태소 분석이 있다. 이것은 비정형 텍스트에서 형태소를 추출하여 품사를 판별하고 태깅하는 기술이다(오정심, 2022: 31).
데이터 전처리 작업을 통해 추출한 형태소 집합을 ‘코퍼스’라 부른다. 코퍼스(corpus, 말뭉치)란 일정한 목적에 따라 컴퓨터에 저장한 언어 자료 모음을 의미한다. 코퍼스는 성격에 따라 글말, 입말 등으로 구분한다. 글말 코퍼스는 글에서 쓰는 말로 이루어진 데이터 모음을 말하며 학술논문 초록, 인터넷 신문 기사 등을 그 예로 들 수 있다. 입말 코퍼스는 일상 대화에서 쓰는 말로 이루어진 데이터 모음을 말하며 트위터 트윗, 유튜브 댓글 등을 그 예로 들 수 있다(박명수, 2017: 42; 강범모, 2014: 407). 입말 코퍼스에는 비속어, 은어, 비표준어가 섞여 있기에 데이터 전처리에 어느 정도 시간이 소요된다.
데이터 전처리가 끝나면 연구 목적에 맞는 분석 기법을 선택하여 데이터를 분석한다. 본 논문에서는 ‘시맨틱 네트워크 분석 기법’을 이용해 데이터를 분석할 것이다. 시맨틱 네트워크 분석에는 언어를 복잡계(complex system)로 보는 관점이 담겨 있다. 즉 언어를 수많은 요소가 상호작용하는 체계로 보는 것이다. 시맨틱 네트워크 분석을 할 때 가장 먼저 할 일은 ‘단어 네트워크’를 만드는 것이다. 단어 네트워크는 단어와 단어 사이를 선으로 연결한 그래프이다. 단어 네트워크를 만드는 방법에는 크게 ‘등장 순서에 따른 방법’과 ‘동시 출현에 따른 방법’이 있다(오정심, 2022: 53). 본 논문에서는 ‘등장 순서에 따른 방법’으로 단어 네트워크를 만들 것이다. 이 방법은 문단 단위에서 서로 가깝게 위치한 단어 사이를 연결해 준다. 이 방법을 선택한 까닭은 문단에서 함께 자주 쓰인 명사와 형용사의 의미론적 관계를 분석하기 위해서이다. 여기서 ‘문단에서 함께 자주 쓰인’이라는 표현은 전문 용어를 써서 ‘공기 관계(co-occurrence), 연어 관계(collocation)’로 바꿀 수 있다. 공기 관계는 문단 단위에서 함께 자주 등장하는 단어들을 말한다. 연어 관계는 관습적으로 함께 자주 쓰인 단어들 또는 가까운 거리에 있는 단어들을 말한다(강범모, 2010: 3).
경관 형용사와 관련한 연구는 김영태ㆍ조동범 연구(2022) 등 70여 편이 있다. 관련 연구 대부분이 경관 형용사로 의미분별척도를 구성해 지역 이미지나 경관 선호도를 조사했다.3) ‘경관 형용사 목록’ 자체를 문제로 지적해 연구한 논문은 주신하ㆍ임승빈 연구(2003), 반영운 외 3인 연구(2012), 노희영ㆍ손유진 연구(2022) 등 3편뿐이다. 주신하ㆍ임승빈 연구(2003)는 도시 경관을 대상으로, 반영운 외 3인 연구(2012)는 농어촌 경관을 대상으로, 노희영ㆍ손유진 연구(2022)는 관리된 경관 중에서 정원을 대상으로 경관 형용사 목록을 연구해 제시했다. 이들 연구는 국내에서 외국의 경관 형용사 목록을 번역해 쓰고 있는 점을 문제로 지적해 우리말로 된 경관 형용사 목록을 제시했다는 점에서 본 논문의 선행연구로서 가치가 있다.
이밖에 빅데이터 분석 방법을 활용해 경관 이미지를 연구한 논문으로 ⎾빅데이터를 활용한 섬 경관 특성 분석에 관한 연구(도지윤, 2022)⏌가 있다. 이 연구는 소셜 네트워크 서비스에 자주 등장하는 명사를 중심으로 섬 경관 이미지를 분석했는데, 형용사를 다루는 본 논문의 연구 방향과 다르다. 또한 형용사를 활용해 지역 이미지를 연구한 논문으로 ⎾도시이미지에 관한 감성 어휘 유형화 연구(여호근, 2017)⏌ 등이 있다. 이 연구들은 실내 디자인 분야에서 분류한 감성 형용사를 통해 도시 이미지를 분석했는데, 경관 형용사를 다루는 본 논문의 연구 방향과 다르다.
이렇게 경관 이미지나 선호도 등을 조사한 연구는 선행연구에서 제외하고 경관 형용사 목록을 다룬 논문만 선행연구로 선정하여 주요 내용을 <표 2>와 같이 정리했다. 선행연구 중에서 주신하ㆍ임승빈 연구(2003)는 경관 형용사 목록을 구체적으로 제시하여 본 논문에 시사하는 바가 있다. 하지만 아래와 같이 한계가 지적되어 보완할 필요가 있다.
발표 연도 | 제목 및 저자 | 주요 내용 |
---|---|---|
2003 | 도시 경관 분석을 위한 경관형용사 목록 작성 (주신하·임승빈) | |
2012 | 경관영역 및 공간유형별 대표 경관형용사 선정 (반영운 외 3인) | |
2022 | 국내 정원 이미지의 대표 형용사 선정과 분류 연구 (노희영·손유진) |
첫째, 국어 교과서에서 형용사를 수집하여 경관과 관련성이 낮은 형용사까지 목록에 포함되었다. 경관과 관련성이 높은 글에서 형용사를 수집할 필요가 있다.
둘째, 대학생 40명을 대상으로 한 설문조사 방법으로 형용사를 수집하여 대표성 논란과 같은 문제가 생겼다. 주신하ㆍ임승빈(2003)도 설문조사를 통해 수집한 형용사가 다양하지 못함을 문제로 지적하고, 향후 어휘력이 풍부한 사람을 대상으로 후속 연구가 이뤄져야 한다고 말했다.
셋째, 수집한 형용사를 13개 유형으로 분류했는데, 보다 체계적으로 분류할 필요가 있다. 그리고 형용사를 분류할 때 의미성 분석 기법을 응용했다고 밝혔는데, 구체적인 내용을 제시하지 않아서 정확한 분석이 어렵다. 또한 형용사를 분류한 내용에서 여러 가지 오류가 발견되어 수정이 필요하다. 예를 들어 목록에 ‘이국적인’, ‘살고 싶은’과 같이 관형사, 보조형용사가 들어가 있다. 혼란을 막기 위해서 본형용사만 넣는 게 바람직하다.
본 논문에서는 선행연구의 한계를 넘기 위해서 다음과 같은 사항을 정해서 연구를 진행할 것이다. 첫째, 표본 설문조사 방법의 한계를 넘기 위해서 ‘빅데이터 분석 방법’을 이용하여 관련 데이터를 총망라해 분석할 것이다. 빅데이터 분석 방법은 데이터 수가 아무리 많아도 짧은 시간에 분석할 수 있으며, 데이터에서 표본을 추출하지 않고 전체를 분석하기에 대표성 논란과 같은 문제의 가능성이 작다(오정심, 2022:51).
둘째, 추출한 형용사를 체계적으로 분류하기 위해 ‘국어 형용사 분류 방법론’과 ‘세계유산협약 운영 지침의 문화경관 평가 항목’을 참고하여 분류 기준을 마련할 것이다.
셋째, 추출한 형용사가 텍스트에서 경관 형용사로 쓰였는지 맥락을 파악하기 위해 ‘시맨틱 네트워크 분석(의미망 분석)’ 기법을 이용할 것이다.
넷째, 문화경관과 관련성이 높은 형용사를 수집하기 위해 우리나라 ‘지역신문’에서 문화경관을 기술한 텍스트를 수집할 것이다. 지역신문은 일종의 글말 자료이며 온라인에서 수집하기가 쉽다.4)
3. 연구 대상 및 방법
본 논문의 목적은 ‘빅데이터 의미망 분석 방법’을 통해 문화경관 관련 지역신문 기사를 수집해 코퍼스를 구축하고, 형용사와 명사를 추출해 의미망으로 연결하여 단어 사용 패턴과 맥락 등을 분석하는 것이다. 그리고 분석자료를 활용해 ‘문화경관 형용사 목록’ 분류 방안을 제시하고, 주요 내용을 시각화하여 지식지도 형태 등으로 나타내는 것이다. 이러한 연구를 통해 우리나라 지역의 고유한 문화경관의 특성을 밝히는 일과 문화경관 제도와 정책을 마련하는 일에 이바지하는 것이다.
지역신문 기사에서 문화경관 관련 텍스트를 수집한 이유를 설명하면 다음과 같다. 첫째, 본 논문은 문화경관 관련 정책과 사업에 활용할 수 있는 문화경관 형용사 목록의 개발까지 목표로 하기에 비표준어가 섞여 있는 입말 자료보다는 글쓰기 기술과 어휘력을 갖춘 기자가 쓴 글말 자료가 적합하다고 생각했다.
둘째, 문화경관은 눈에 보이는 풍경뿐만 아니라 자연환경과 인간의 상호작용까지 아우르는 개념이기에 특정한 주제를 다루는 학술논문보다 지역의 생활문화를 전반적으로 다루는 지역신문이 더 적합하고 판단했다.
셋째, 경관(景觀)은 인간이 바깥세상을 보고 지각하는 행위를 해야만 존재할 수 있는 개념인데 지역신문 기사는 인간이 바깥세상을 보고 지각하도록 이끄는 매개체 역할을 한다고 생각했다.5)
연구는 크게 ‘데이터 수집’, ‘데이터 전처리’, ‘데이터 분석’, ‘종합 및 해석’ 등 4단계로 진행했다. 그리고 연구 결과를 종합하여 문화경관 형용사 목록을 분류했다. 데이터 수집과 분석에 이용한 프로그램은 기계학습 기반 넷마이너(NetMiner)이다.
본 논문은 문화경관 세부 유형(<표 1>)의 문화화된 자연 경관 중에서 ‘결합 경관’, ‘관리된 경관’과 인공경관 중에서 ‘경작된 경관’을 중심으로 문화경관 형용사 목록을 연구하는 것을 목적으로 한다. 그래서 공간 범위를 농어촌 지역 중에서 전라남도 신안군과 진도군으로 정했다. 이곳을 선택한 이유는 첫째, 인간과 자연환경의 상호작용을 잘 보여주는 섬 문화경관을 풍부하게 보유하고 있기 때문이다. 둘째, 최근에 급격한 인구 감소에 따른 황폐화 문제가 증가하고 있어 이곳의 문화경관을 관리하는 일은 시급하다고 생각했기 때문이다. 셋째, 오래전부터 온라인 서비스를 제공하는 지역 언론매체를 보유하고 있기 때문이다.
현재 신안군과 진도군의 지역신문 매체들 가운데 온라인 서비스를 제공하는 곳은 신안군에 4종, 진도군에 3종이 있다. 해당 사이트에서 웹 데이터 자동 추출 프로그램을 이용해 관련 기사를 총망라해 수집했다. 1차로 수집한 자료 중에서 광고 및 홍보, 인물 동정 등 연구 목적에 상관없는 내용을 삭제했다. 특히 정치인 동정, 군청 홍보 뉴스와 같은 내용을 삭제하기 위해 예비 분석을 두 차례 시행하였다. 최종으로 신안군 지역신문 4종에서 관련 기사 4,566건과 진도군 지역신문 3종에서 관련 기사 3,993건, 총 8,459건을 연구 대상으로 선정해 분석했다.
매체명 | 신안 | 전남제일신문 | 목포시민신문 | 남악신문 | 신안신문 |
---|---|---|---|---|---|
진도 | 진도투데이 | 예향진도신문 | 뉴스진도 | - | |
수집처 | 신안 | www.jeilnews.com | www.mokposm.co.kr | www.namaknews.com | www.sanews.co.kr |
진도 | www.jindotoday.com | www.yhjindo.com | www.newsjindo.com | - | |
수집 대상 | 문화면 기사 총망라 | ||||
수집 기간 | 최초 발간일 ~ 2022년 8월 최근 | ||||
1차 필터링 | 광고 및 홍보, 인물 동정, 정치인 치적, 사건 사고 등 관련 없는 내용 제거 | ||||
▼ | ▼ | ▼ | ▼ | ||
최종 분석 대상 | 신안 | 텍스트 2,329건 | 텍스트 1,100건 | 텍스트 250건 | 텍스트 877건 |
신안 지역신문 4종에서 텍스트 총 4,556건 | |||||
진도 | 텍스트 2,645건 | 텍스트 839건 | 텍스트 509건 | - | |
진도 지역신문 3종에서 텍스트 총 3,993건 | |||||
총 8,459건 |
수집한 데이터를 전처리 작업6)을 하여 신안군 지역신문 4종에서 명사형 형태소 18,224개와 형용사형 형태소 512개를 추출하고, 진도군 지역신문 3종에서 명사형 형태소 16,643개와 형용사형 형태소 565개를 추출하여 지역별 코퍼스를 각각 구축했다. 이어서 시맨틱 네트워크 분석 기법으로 등장 순서에 따라 단어 네트워크를 형성해 데이터를 분석했다.
[그림 1]은 시맨틱 네트워크 분석 과정을 요약해 그린 것이다. 그림에서 4번 작업은 텍스트에서 형용사가 어떤 맥락으로 쓰였는지 확인하기 위해서 하는 일이다. 본 논문에서 이용한 넷마이너는 단어 네트워크 목록의 내용을 엑셀 파일로 출력해 주고, 단어 네크워크 맵으로 시각화하여 나타내준다. 출력한 엑셀 파일과 그림에서 형용사와 연결된 명사의 내용을 검토했다.
단어 네트워크 목록과 네트워크 맵을 검토할 때 다음과 같은 사항을 정하여 염두에 두었다. 형식상 지역신문 기사는 여러 문단과 문장으로 이뤄져 있으며, 문장은 주어와 목적어 자리에 있는 명사와 서술어 자리에 있는 형용사 등으로 이뤄져 있다. 그리고 내용상 지역신문 기사는 기자가 어떤 대상을 조사하여 기술한 내용으로 되어 있다. 따라서 지역신문 기사에 쓰인 ‘명사’를 어떤 대상이나 볼거리를 가리키는 이름씨라 할 수 있고, ‘형용사’를 어떤 대상이나 볼거리의 특성을 형용하는 그림씨라 할 수 있다(오정심, 2023:168).
Ⅱ. 본론
데이터 전처리 작업을 하여 신안군 문화경관 관련 기사 4,556건에서 명사형 형태소 18,224개와 형용사형 형태소 512개를 추출하고 진도군 문화경관 관련 기사 3,993건에서 명사형 형태소 16,643개와 형용사형 형태소 565개를 추출하여 코퍼스를 각각 구축했다. 그리고 지역별 코퍼스별로 단어 등장 순서에 따른 방법으로 네트워크를 형성해 주요 지표로 분석했다. 먼저 ‘출현 빈도수’ 분석 결과부터 살펴보자. 출현 빈도수는 텍스트에서 단어가 얼마나 자주 나타나는지를 계산한 값이다. 빈도수가 크게 나올수록 해당 텍스트에 자주 쓰였다는 뜻이다. <표 4>는 출현 빈도수가 10회 이상 나온 단어7)를 추려서 정리한 것이다.
※ ●표시 :객관형용사, ▲표시 :주관형용사
신안군 문화경관 관련 기사 4,556건에서 출현 빈도수가 가장 높게 나온 형용사로 ‘있다’가 나타났다. 이어서 ‘크다’, ‘아름답다’, ‘새롭다’, ‘다양하다’ 순으로 나타났다. 진도군 문화경관 관련 기사 3,993건에서 역시 ‘있다’의 빈도수가 가장 높게 나타났다. 이어서 ‘크다’, ‘없다’, ‘많다’, ‘다양하다’ 순으로 나타났다.
한편 국어문법에서 형용사를 ‘객관형용사’와 ‘주관형용사’로 구분한다. 객관형용사는 어떤 대상이나 장소의 속성, 상태 등을 나타내는 말이다. 주관형용사는 말하는 이의 생각, 감정, 느낌 등을 나타내는 말이다(유현경, 2000:238). 문화경관 형용사를 체계적으로 분류하기 위해서 추출한 형용사를 객관형용사와 주관형용사로 분류하였다. <표 4>에서 보는 바와 같이 객관형용사에 ‘있다’, ‘없다’, ‘크다’, ‘작다’, ‘많다’ 등(●표시)이 있다. 주관형용사에 ‘아름답다’, ‘새롭다’, ‘희귀하다’, ‘뛰어나다’ 등(▲표시)이 있다. 표에서 객관형용사와 주관형용사의 수를 비교해 보면 객관형용사의 수가 약간 더 많다.
그런데 표에 정리된 내용만 보고 추출한 형용사가 지역신문 기사에서 경관 형용사로 사용됐는지 알 수가 없다. 그래서 시맨틱 네트워크 분석 방법으로 형성한 단어 네트워크 목록에서 형용사와 연결된 명사의 내용을 검토하여 사용 맥락을 살펴봤다. 본 논문에서 이용한 넷마이너는 단어 네트워크를 엑셀 파일로 출력해 준다. 출력한 파일에는 링크로 연결된 단어가 한 쌍씩 표로 정리돼 있다. 다음 장에서 단어 네트워크 목록을 검토한 결과를 살펴보자.
지금부터 단어 네트워크 목록에서 형용사와 연결된 명사의 내용을 검토한 결과를 살펴보자. 단어 네트워크 목록을 검토할 때 추출한 형용사가 문화경관과 관련이 있는지 체계적으로 알아보기 위해서 ‘유네스코 세계유산협약 운영 지침의 문화경관 평가 항목’을 참고했다. 유네스코 세계유산협약 운영 지침에는 문화경관의 평가 항목을 7개로 구분하여 명시했는데 <표 5>는 그 내용을 정리한 것이다. 데이터 분석 결과와 비교하기 쉽도록 각 항목에 이름을 붙여서 구분했다.
자료 : 문화재청(2018: 242).
<표 6>은 세계유산협약의 문화경관 평가 항목을 바탕으로 단어 네트워크 목록을 검토한 내용 중에서 주목할 만한 부분만 추려서 정리한 것이다. <표 6>에서 보는 바와 같이 객관형용사 ‘있다’, ‘많다’, ‘다양하다’, ‘깨끗하다’ 등은 볼거리 존재 여부, 수량, 속성 등을 나타내는 말로 쓰이고 있다.
[그림 2]는 ‘있다’와 연결된 명사를 따로 모아서 직관적으로 파악할 수 있게 워드 클라우드 형태로 그린 것이다. 글자 크기가 클수록 빈도수가 큰 것으로 해석한다. [그림 2]에 서 보이는 명사들이 어우러져 신안군과 진도군의 문화경관을 이룬다고 생각할 수 있다.
신안군과 진도군은 서남권 섬 문화 벨트로 묶일 만큼 비슷한 자연환경을 보유하고 있다. 그래서 비슷한 볼거리가 나타날 것이라 예상했는데, 분석 결과에서 다른 내용이 나타났다. 이를 앞에서 살펴본 ‘문화경관 세부 유형 분류표(<표 1>)’와 비교해 보면, 신안군에는 갯벌, 돌담, 길, 소금, 다도 등 ‘문화화된 자연경관’과 관련한 볼거리가 많고, 진도군에는 운림산방, 아리랑, 문학관, 집성촌 등 ‘인공경관’과 관련한 볼거리가 많은 것으로 해석할 수 있다.
같은 방법으로 주관형용사와 연결된 명사의 내용을 살펴보자. <표 6>에서 보는 바와 같이 ‘아름답다’, ‘예쁘다’, ‘탁월하다’, ‘빼어나다’, ‘수려하다’, ‘희귀하다’ 등은 볼거리의 심미성, 우수성, 탁월성을 나타내는 말로 쓰이고 있다. [그림 3]은 신안군 지역신문에서 심미성, 우수성, 탁월성을 나타내는 형용사와 연결된 명사를 모아서 이원모드 네트워크 맵(2-mode network map)8)으로 그린 것이다.
<표 6>과 [그림 3]에서 두드러지게 보이는 부분이 있다. 신안군에서는 기존에 잘 알려진 볼거리 외에도 새롭게 ‘퍼플섬’, ‘순례’, ‘한국의 산티아고’가 나타났다. 하지만 진도군에서는 새로운 볼거리가 나타나지 않았다. 운림산방, 진도 아리랑은 이미 널리 알려져서 새로운 게 있는지 살펴봤는데 없었다.
퍼플섬은 신안군의 반월도와 박지도를 가리켜 부르는 별칭이다. 신안군은 반월도와 박지도를 관광 명소로 키우기 위해서 이곳에 있는 모든 시설을 보라색으로 칠하고 퍼플섬이란 이름을 지어 불렀다. 색깔을 보라색으로 선택한 이유에 대해 신안군은 반월도와 박지도는 도라지와 꿀풀의 자생지로 유명한데 도라지와 꿀풀의 꽃잎이 보라색이기 때문이라고 설명했다. 퍼플섬은 대중에게 큰 관심을 불러일으켜 2022년에만 38만 명의 관광객이 다녀갔다. CNN을 비롯한 언론에서 노인만 남았던 쓸쓸한 섬이 여행객들이 가고 싶어 하는 관광지로 탈바꿈했다고 퍼플섬을 평가했다(The JoongAng (2022. 1.20)). 순례길은 신안군의 기점도와 소악도를 잇는 노둣길을 가리켜 부르는 별칭이다. 신안군은 이곳에 예수의 12명의 제자 이름을 붙인 예배당을 세우고 12사도 순례길이란 이름을 지어 불렀는데, 관광객이 이곳의 경치가 마치 스페인의 산티아고와 비슷하다고 해서 한국의 산티아고라 부른 것이다(신안군청 홈페이지).
지금까지 단어 네트워크 목록에서 명사와 형용사로 연결된 단어 내용을 검토하여 경관 형용사로써 사용 맥락 등을 살펴보았다. 이제부터 에고 네트워크 분석을 통해 추출한 형용사의 사용 맥락을 더욱 구체적으로 확인해 보자. 에고 네트워크(ego-network)란 특정 노드와 바로 연결된 이웃 노드들의 집합 연결망이다. 신안군과 진도군의 특징을 설명하기 위해 자주 쓰인 단어를 분석하기 위해서 에고 네트워크 분석을 하였다. 이러한 분석을 통해 신안군과 진도군을 대표하는 볼거리가 무엇이며 그것을 수식하기 위해 어떤 형용사가 쓰였는지 알 수 있다. [그림 4]와 [그림 5]는 에고 네트워크 분석 결과를 직관적으로 알 수 있게 일원모드 네트워크 맵(1-mode network map)10)으로 그린 것이다.
[그림 4]에서 보는 바와 같이 신안군의 대표 볼거리로 ‘(다도해)해상국립공원’, ‘(갯벌)도립공원’, ‘임자면 대광 해수욕장’, ‘해변’, ‘생물’, ‘식물’, ‘꽃 축제’, ‘퍼플섬 꽃 축제’, ‘수국 축제’, ‘수국 정원’, ‘갯벌 토양’, ‘갯벌 습지’, ‘갯벌 어장’, ‘천일염’, ‘낙지’, ‘홍도’ 등이 나타났다. 그리고 볼거리를 수식하는 형용사로 ‘청정하다’, ‘쾌적하다’, ‘깨끗하다’, ‘풍부하다’, ‘다양하다’, ‘희귀하다’, ‘우수하다’가 나타났다. 지역신문 기사에서는 신안군의 대표 볼거리를 ‘청정한 갯벌’, ‘깨끗한 천일염’, ‘우수한 천일염’, ‘세계적 갯벌’, ‘다양한 갯벌 자원’, ‘풍부한 갯벌 자원’, ‘희귀한 식물’, ‘희귀한 홍도 원추리’ 등으로 기술하고 있는 것이다.
같은 방법으로 [그림 5]를 살펴보면, 진도군의 대표 볼거리로 ‘민속 문화 공연’, ‘향토문화회관’, ‘문화예술원’, ‘문화 체험 행사’, ‘신비 바닷길 축제’, ‘명량대첩 축제’, ‘해양 수산’, ‘김 전복 양식’, ‘친환경 농업’이 나타났다. 그리고 볼거리를 수식하는 형용사로 ‘다양하다’, ‘우수하다’, ‘많다’, ‘크다’ 등이 나타났다. 지역신문 기사에서는 진도군의 대표 볼거리를 ‘청정한 해역’, ‘다양한 문화’, ‘우수한 축제’, ‘큰 바다 생산량’, ‘우수한 진도홍주’ 등으로 기술하고 있는 것이다.
지금까지 시맨틱 네트워크 분석 방법으로 추출한 형용사가 수집한 텍스트에서 지역의 볼거리를 수식하는 말로 쓰였음을 확인하였다. 본 논문에서 이용한 넷마이너에는 특정 단어가 포함된 원문의 내용을 확인할 수 있는 기능이 있다. 이 기능을 이용하여 추출한 형용사가 포함된 원문을 확인하여 사용 맥락을 다시 한번 확인하였다. 다음 장에서 추출한 형용사가 문화경관 형용사 목록으로 활용될 수 있도록 체계적으로 분류해 보자.
문화경관 관련 신안군 지역신문 기사 4,566건과 진도군 지역신문 기사 3,993건 총 8,459건에서 추출한 형용사 중에서 중복된 단어를 제외하고, 단어 출현 빈도수가 2회 이상 나오고 단어 네트워크 목록에서 사용 맥락을 확인한 형용사 260개를 도출했다. 이 형용사가 ‘문화경관 형용사 목록’으로 활용될 수 있도록 일정한 기준을 세워서 분류했다. 분류 기준은 세계유산협약 운영 지침의 문화경관 평가 항목, 국어 형용사 분류 방법론11), 한국어 감성 사전12) 등을 참고해서 마련했다. 분류 기준을 제시하면 아래와 같다.
첫째, 추출 형용사를 크게 ‘객관형용사’와 ‘주관형용사’로 분류했다. 객관형용사는 어떤 사물과 장소의 존재 여부, 속성과 상태 등을 나타내는 말이다. 주관형용사는 화자의 생각, 감각기관을 통한 느낌 따위를 나타내는 말이다. 객관형용사로 분류된 형용사는 지역의 볼거리 존재 여부, 물리적 특성을 나타내는 말이며, 지역 간 문화경관의 물리적 특성을 비교할 때 주로 이용할 수 있다. 주관형용사로 분류된 형용사는 경관 이미지나 선호도를 조사하거나 경관 자원의 우수성, 심미성 등을 평가하는 일에 활용할 수 있다.
둘째, 형용사가 연구 목적에 따라 알맞게 활용될 수 있도록 객관형용사 항목을 4개 세부 항목으로, 주관형용사 항목을 8개 세부 항목으로 나눴다. 각 항목에 대한 설명은 <표 7>에 기술했다.
1. 밑줄 표시: 선행연구에서 적합성 평가를 통해 제시한 형용사.
2. 기울기 표시: 2편 이상 선행연구에서 제시한 형용사.
3. *표시: ’세계유산협약 운영 지침’ 참고하여 분류한 항목.
셋째, 세부 항목에서 세계유산협약 운영 지침의 문화경관 평가 항목과 관련한 부분을 구분해 넣었다(<표 7>에서 *표시). 이 항목에 분류된 형용사는 지역의 문화경관 자원을 발굴하는 일에 활용할 수 있다. 예를 들어 주관형용사 ‘탁월하다’와 연결된 명사를 지역을 대표하는 볼거리로 발굴해 관련 정책을 마련할 수 있다.
넷째, 추출한 형용사 중에서 주신하ㆍ임승빈 연구(2003), 반영운 외 3인 연구(2012), 노희영ㆍ손유진 연구(2022)에서 적합성 평가를 통해 제시한 형용사를 밑줄로 표시했다. 그런데 선행연구에서는 관형사, 보조형용사도 목록에 넣었지만, 본 논문에서는 본형용사만 목록에 넣었다. 그리고 2편 이상 선행연구에서 제시한 형용사는 기울기로 표시했다.
Ⅲ. 결론
지금까지 문화경관 관련 신안군 지역신문 기사 4,566건과 진도군 지역신문 기사 3,993건 총 8,459건을 시맨틱 네트워크 분석 방법을 통해 분석한 결과를 살펴봤다. 서론에서 제시한 연구 문제를 중심으로 분석 결과를 요약하면 다음과 같다.
첫째, 수집한 텍스트에서 자주 쓰인 형용사를 알아보기 위해서 출현 빈도수를 분석했다. 분석 결과, 신안군 지역신문에서는 ‘있다’, ‘크다’, ‘아름답다’, ‘새롭다’, ‘다양하다’, ‘없다’, ‘높다’ 순으로 빈도수가 높게 나타났다. 진도군 지역신문에서는 ‘있다’, ‘크다’, ‘없다’, ‘많다’, ‘다양하다’, ‘높다’, ‘새롭다’ 순으로 높게 나타났다. 이 중에서 ‘있다’, ‘없다’, ‘크다’, ‘많다’, ‘높다’, ‘다양하다’는 어떤 대상의 속성을 나타내는 객관형용사로 분류할 수 있다. ‘아름답다’, ‘새롭다’는 화자의 심리상태나 감각기관을 통한 느낌 등을 나타내는 주관형용사로 분류할 수 있다.
객관형용사는 지역 간 문화경관의 물리적 특성을 비교할 때 활용할 수 있다. 주관형용사는 경관 이미지나 선호도 등을 조사하거나 문화경관 자원을 발굴하는 일에 활용할 수 있다. 그런데 주관형용사는 말하는 이의 심리상태, 사회적 배경 등에 따라 달라질 수 있기에 주기적으로 조사할 필요가 있다.
둘째, 추출한 형용사가 텍스트에서 경관형용사로 사용됐는지 확인하기 위해 단어 네트워크 목록과 단어 네트워크 맵 등에서 형용사와 연결된 명사의 내용을 검토했다. 검토 결과, 객관형용사 ‘있다’, ‘많다’, ‘다양하다’, ‘깨끗하다’ 등은 볼거리의 존재 여부, 수량, 속성 등을 나타내는 말로 쓰이고 있었다. 주관형용사 ‘아름답다’, ‘예쁘다’, ‘탁월하다’, ‘희귀하다’ 등은 볼거리의 심미성, 우수성, 탁월성을 나타내는 말로 쓰이고 있었다.
셋째, 형용사와 명사의 연결 관계를 직관적으로 살펴보기 위해서 단어 네트워크 맵을 그렸다. 그림에서 눈에 띄는 점이 발견되었는데 신안군 네트워크 맵에서 기존에 잘 알려진 볼거리 외에도 새롭게 ‘퍼플섬’, ‘순례’, ‘한국의 산티아고’가 나타났다.
퍼플섬과 순례길은 아름다운 자연환경에 인공적 요소를 더함으로써 사람을 경관 주변에 모여들게 만든 ‘문화화된 자연경관’ 사례로 주목할 만하다. 주지하듯이 경관(景觀)은 사람이 보고 지각하는 행위를 해야만 성립되는 개념이다. 사람이 있어도 보는 행위를 하지 않는다면 경관은 존재할 수 없다. 퍼플섬과 순례길은 정책을 통해 사람을 경관 주변으로 모여들게 하여 경치를 보고 지각하게 만듦으로써 경관의 실체가 드러나고 그 가치와 의미가 더하게 된 사례라 할 수 있다.
넷째, 추출한 형용사 중에서 단어 출현 빈도수가 2회 이상 나오고 단어 네트워크 목록에서 사용 맥락을 확인한 형용사, 260개를 뽑았다. 그리고 형용사를 선행연구, 국어 형용사 분류 방법론, 세계유산협약 운영 지침의 문화경관 평가 항목 등을 참고하여 12개 항목으로 분류하여 ‘문화경관 형용사 목록’으로 제시했다.
다섯째, 본 논문에서 제시한 ‘문화경관 형용사 목록’을 3편의 선행연구에서 도출한 경관 형용사 목록과 비교했다. 추출한 260개 형용사 중에서 58개는 선행연구에서도 제시한 것으로 조사됐다. 그런데 본 논문에서는 관형사, 보조형용사를 목록에 넣지 않았기에 이런 품사까지 넣었으면 그 개수가 증가했을 것이다. 특히 ‘아름답다’, ‘밝다’ 등 24개는 2편 이상의 선행연구에서도 경관 형용사로 제시한 것으로 문화경관 형용사 목록에 반드시 포함해야 할 단어로 분석됐다.
현재 우리나라에는 문화경관을 본격적으로 다루는 정책과 제도가 아직 없다. 그리고 경관 사업 대부분이 환경 정비 위주로 시행되고 있고, 대표적인 경관 관리 방법인 경관 형용사 목록마저 외국의 것을 번역해 쓰고 있다. 이러한 배경 아래 본 논문에서는 우리나라 농어촌 지역의 문화경관을 기술한 텍스트를 수집하여 빅데이터 의미망으로 분석하고 ‘문화경관 형용사 목록’을 제시했다. 본 논문에서 제시한 문화경관 형용사 목록은 의미분별척도로 구성해 지역의 고유한 문화경관 특성을 밝히거나 지역 이미지 등을 조사해 로컬마케팅 전략을 마련하는 일에 활용할 수 있다. 본 논문의 연구 방법론은 공간 범위를 바꿔서 도시나 다른 지방의 문화경관을 연구하는 데 적용할 수 있다. 특히 명사ㆍ형용사 네트워크 목록과 단어 네트워크 맵을 통해 단어 사용 맥락을 검토하는 방법은 감성 형용사를 다루는 실내 디자인, 도시 마케팅, 관광 마케팅 등 관련 분야에 응용할 수 있다.
본 논문의 연구 의미는 다음과 같은 점에서 찾을 수 있다. 첫째, 기존 연구에서 외국의 경관 형용사 목록을 번역해 쓰고 있는 점을 문제로 지적하고 우리말로 된 문화경관 형용사 목록을 연구해 제시했다. 둘째, 기존 연구에서 주로 이용한 설문조사 대신에 빅데이터 의미망 분석 방법을 이용하여 관련 텍스트를 총망라해 수집하고 분석했다. 셋째, 문화경관 형용사 문제를 복잡계와 네트워크 과학 영역으로 가져와 연구함으로써 새로운 연구 영역을 여는 데 이바지했다.
본 논문과 관련한 연구가 앞으로 이어질 수 있도록 후속 연구에서 다음과 같은 사항이 보완되어야 할 것이다. 첫째, 본 논문에서는 지역신문에서 글말 자료를 수집해 분석했는데, 문화경관 형용사 목록의 내용을 풍부하게 보완하기 위해서 유튜브 댓글, 블로그 게시글 등 입말 자료도 분석해야 할 것이다. 입말 자료는 문화경관에 대한 일반 대중의 생각과 느낌 등을 파악하는 데 중요한 자료가 될 수 있다. 둘째, 본 논문에서는 농어촌 지역의 문화경관 형용사를 수집했는데, 향후 공간 범위를 바꿔서 도시와 근교 도시의 문화경관 형용사를 수집해 살펴볼 필요가 있다. 또한 문화경관의 세부 유형별로 형용사를 추출해 비교해 볼 필요가 있다.