코로나19로 이전과는 다른 세상에서 살게 될 것이라고 합니다. 변화의 계기는 갑자기 찾아왔지만 변화는 천천히, 지속적으로 우리 삶에 영향을 미칠 것입니다. 그렇다면 우리의 삶의 터전인 지역에는 어떤 변화가 있을까요? 소통과 관계 방식, 이동과 교류방식도 바뀔 것이라고 합니다. 비대면사회가 가속화된다고 하지만 대면사회였던 지역은 어떻게 될까요? 지역에서 살아가는 우리는 어떤 질문을 할 수 있을까요? 우리의 일상, 일, 관계, 소통의 현장인 ‘로컬'의 미래는 어떻게 변할까요? 6회째를 맞이한 「지리산포럼2020」은 코로나19 상황을 감안하여 한꺼번에 많은 인원이 모이는 대신, 참가 규모를 줄이고 개최 시간과 장소를 분산하여 10월 17일부터 24일까지 총 8일간 진행했으며, ‘로컬라이프’를 주제로 한 7개의 주제섹션과 지리산 5개 지역의 로컬섹션, 특별섹션이 운영되었습니다. 지리산포럼2020 더 알아보기 [바로가기] |
10/22 로컬의 재구성 #3 데이터로 로컬을 본다는 것 - 박선양 (다른도시) 도시공간의 변화를 시도하는 프로젝트에 참여하고 있습니다. 흩어진 데이터를 찾아 도시를 바라보고, 해석하고, 변화를 제안하고, 그 일련의 과정을 아카이빙하며 느꼈던 이야기를 공유하고자 합니다. |
데이터로 로컬을 본다는 것은 ‘내가 살고 있는 지역으로서의 로컬을 어떻게 바라볼 것인가’하는 관점에서 데이터를 모으고, 해석하고 변화를 제안하고 시도하는 과정이다.
공공데이터로 로컬을 본다는 것
서울을 중심으로 도시공간을 가꾸는 프로젝트를 참여하면서 주목했던 것은 문헌과 데이터, 현장 사이에서 사람들의 이야기를 찾는 것이었다. 이 사이에서 문헌과 데이터에 접근하는 데 많은 한계를 느꼈고, 정말 로컬을 데이터로 볼 수 있을까? 수집한 정보와 사람의 이야기를 엮어 아카이빙할 수 있을까 고민하게 된다.
비전문가로 지역정보데이터 분석에 관심을 갖게 된 계기는 <서울로 7017> 합류였다. 지역을 데이터로 보기 위해서는 지역을 인식하는 지리감각, 범위 안의 데이터를 찾기 위해 가져야할 문제의식과 주제의식을 가져야 한다. 그 작업을 지속하려면 찾고자하는 호기심, 스스로 정보의 원천을 수집하고 나의 활동을 노출해야 만이 현장과 닿아있는 이야기를 할 수 있다. 내가 데이터를 보는 것은 데이터를 통해서 사람을 만나고 지역을 이해하고, 지역의 문제를 이야기하고 해결하기 위한 과정의 하나이다.
ⓒ지리산이음
지역데이터 조사는 주로 공공데이터조사, 설문조사, 인터뷰와 간담회의 프로세스로 이루어진다. 서울시의 경우, 25개의 자치구, 425개의 행정동, 약 19500개의 집계구 단위로 정보가 수집되고 데이터가 공개된다. 공공데이터는 정보공개단위의 한계가 있고, 행정적인 이유에서 데이터의 경계가 존재해 사람들의 행태를 실제를 반영하지 못한다. 공공데이터를 분석하고 시각화할 때는 실제 사람들은 경계가 없다는 점에 유의해야 한다. 공공데이터를 잘 분석하고 사용하기 위해서는 분석할 수 있을 만큼의 지식을 쌓아가고 무엇을 찾아야 할 것인가 문제의식과 주제의식을 갖는 것이 중요하다.
서울시 생활인구는 공공데이터의 좋은 사례다.
서울시가 보유한 빅데이터와 통신사의 통신데이터를 측정해 집계구 단위까지 매일, 시간대별, 연령별, 내/외국인별로 제공한다. 이 데이터만으로도 다양한 지역별 특성추론과 이슈 파악이 가능해진다. 빠르게 제공되는 생활인구 데이터로 코로나 19이후 사람들의 삶의 변화(국민일보, 코로나19가 바꿔놓은 서울생활인구)를 분석하고 업종별 특성과 추후에 찾아야 할 데이터들도 파악할 수 있다.
생활인구 공공데이터는 활용할 수 있는 분야도 다양하지만 서울 밖에서는 생활인구의 개념도 없고, 유사한 유동인구 공공데이터는 유료형 주문형태로 접근이 어렵다. 데이터 신청처리과정에 2만 2천원비용의 발생 뿐 아니라, 프로세스가 시대를 반영하지 못한다. 도시공간은 1년 안에 수많은 변화가 일어나지만 서울권 밖에서는 예전의 자료밖에 볼 수 없어 데이터의 신속성, 현재성이 결여되어 있다.
대기업이 아닌 민간 단위에서는 정보의 생산이 굉장히 어렵다.
공공의 역할은 데이터베이스를 잘 구축하는 것이다. 멋진 시각화보다 데이터베이스와 원자료 구축이 더 중요하다.
공공데이터화 되지 않은 것들을 데이터화하고 분석할 수 있을까?
기존의 데이터를 쪼개고 시각화하고 새로운 데이터 접근법을 찾기도 했다.
첫 번째, 데이터를 쪼갤수록 보이는 것들이 생긴다. 2020년 4월 총선 결과에서 언론을 통해 지역구 단위로 제공되는 정당지지율을 선거관리위원회 홈페이지에 공개된 개표결과 데이터를 행정동 단위로 추출, 시각화해 지역별로 어떤 이슈가 있었는지, 지지율에 대한 새로운 가설을 세워볼 수 있었다.
두 번째, 기존의 공공데이터로 접근하는 방법 외 새로운 데이터의 접근법으로 언론모니터링 리포트가 있다. 서울로7017에서 갖게 된 문제의식은 ‘반대가 많다’면 얼마나? 왜?에 대한 질문이었다.
언론모니터링으로 데이터를 수집하고 60개 정도의 기사 검색으로 헤드라인과 핵심적인 키워드로 긍정, 부정에 대한 1차 모니터링을 진행했다. 사업을 진행하면서 모니터링 방식을 변경해 더 단순화했다. 언론 보도량과 흐름을 정리하고 서울시 관련사건, 정치적 활동과의 연관성을 찾아 분석하고 모니터링을 통해 쟁점들을 발견하게 되었다. 언론모니터링 리포트는 이슈에 대해 대립하는 주체들의 의견과 언론보도의 흐름을 파악에 도움이 된다. 언론보도를 데이터로 활용하기 위해서는 목록화가 가장 중요한데 사전에 이슈에 대한 이해와 백업지식을 갖고 있지 않다면 유의미한 데이터를 파악할 수 없다. 최근 언론모니터링에서는 보도의 양의 양상, 어떤 용어를 쓰느냐를 파악하는 것도 중요하다.
광화문광장의 집회와 시위가 지역의 주요이슈가 되는지 정보를 찾고 가공해 데이터화하기도 했다. 경찰서 홈페이지에서 ‘토요일 집회와 시위 신고 공개자료 1년치 원자료를 목록화하고, 지도로 위치를 파악하는 시각화를 통해 직접적인 영향을 받는 지역을 파악하고 실제 상황을 입체적으로 이해할 수 있다.
현장과 문헌과 데이터사이에서의 고민들
숫자로 나타나지 않는 것들을 과연 어떻게 알 수 있을 것인가에 대한 고민, 특히 지역으로 갈수록 현장에 닿는 것에 대한 갈증과 한계가 커진다.
주어진 기존 정보가 특정 지역에 집중되거나 오래된 정보에서 오는 한계, 데이터를 분석하는 사람으로서 가장 크게 느끼는 시간의 한계, 접하는 시각의 한계에 속에서 데이터를 통해 어떻게 도시를 바라볼 것인가에 대해 계속 고민하고 있다.
데이터로 로컬을 보는 입장에서 서울의 어느 봉제골목에서도 현장과 문헌, 데이터 사이에서 한계를 발견한다. 사업체 통계로는 보이지 않는 산업생태계가 존재한다. 용어와 가치사슬, 연결망을 이해할 수 없는 엑셀자료로는 제대로 된 산업생태계를 파악할 수 없다. 기존의 연구를 종합하면서 현장에서의 직접조사, 관심을 가지고 연구했던 사람들과의 협업이 이루어져야 하다.
현장과 문헌, 데이터 사이의 한계를 극복하기 위해서 애정과 관심을 가지고 반복의 과정을 겪으며 지역에 대한 이해와 깊이를 확장해나가는 방법밖에 없다. 의미 있는 데이터를 만들어 내기 위해서는 축적의 시간과 양이 필요하고 이를 위해 꾸준하게 기록하고 레퍼런스를 읽고, 나의 활동을 공개하고 함께 이야기하는 과정이 중요하다.
기록 및 정리 | 이경원
코로나19로 이전과는 다른 세상에서 살게 될 것이라고 합니다. 변화의 계기는 갑자기 찾아왔지만 변화는 천천히, 지속적으로 우리 삶에 영향을 미칠 것입니다. 그렇다면 우리의 삶의 터전인 지역에는 어떤 변화가 있을까요? 소통과 관계 방식, 이동과 교류방식도 바뀔 것이라고 합니다. 비대면사회가 가속화된다고 하지만 대면사회였던 지역은 어떻게 될까요? 지역에서 살아가는 우리는 어떤 질문을 할 수 있을까요? 우리의 일상, 일, 관계, 소통의 현장인 ‘로컬'의 미래는 어떻게 변할까요?
6회째를 맞이한 「지리산포럼2020」은 코로나19 상황을 감안하여 한꺼번에 많은 인원이 모이는 대신, 참가 규모를 줄이고 개최 시간과 장소를 분산하여 10월 17일부터 24일까지 총 8일간 진행했으며, ‘로컬라이프’를 주제로 한 7개의 주제섹션과 지리산 5개 지역의 로컬섹션, 특별섹션이 운영되었습니다.
지리산포럼2020 더 알아보기 [바로가기]
10/22 로컬의 재구성 #3
데이터로 로컬을 본다는 것 - 박선양 (다른도시)
도시공간의 변화를 시도하는 프로젝트에 참여하고 있습니다. 흩어진 데이터를 찾아 도시를 바라보고, 해석하고, 변화를 제안하고, 그 일련의 과정을 아카이빙하며 느꼈던 이야기를 공유하고자 합니다.
데이터로 로컬을 본다는 것은 ‘내가 살고 있는 지역으로서의 로컬을 어떻게 바라볼 것인가’하는 관점에서 데이터를 모으고, 해석하고 변화를 제안하고 시도하는 과정이다.
공공데이터로 로컬을 본다는 것
서울을 중심으로 도시공간을 가꾸는 프로젝트를 참여하면서 주목했던 것은 문헌과 데이터, 현장 사이에서 사람들의 이야기를 찾는 것이었다. 이 사이에서 문헌과 데이터에 접근하는 데 많은 한계를 느꼈고, 정말 로컬을 데이터로 볼 수 있을까? 수집한 정보와 사람의 이야기를 엮어 아카이빙할 수 있을까 고민하게 된다.
비전문가로 지역정보데이터 분석에 관심을 갖게 된 계기는 <서울로 7017> 합류였다. 지역을 데이터로 보기 위해서는 지역을 인식하는 지리감각, 범위 안의 데이터를 찾기 위해 가져야할 문제의식과 주제의식을 가져야 한다. 그 작업을 지속하려면 찾고자하는 호기심, 스스로 정보의 원천을 수집하고 나의 활동을 노출해야 만이 현장과 닿아있는 이야기를 할 수 있다. 내가 데이터를 보는 것은 데이터를 통해서 사람을 만나고 지역을 이해하고, 지역의 문제를 이야기하고 해결하기 위한 과정의 하나이다.
ⓒ지리산이음
지역데이터 조사는 주로 공공데이터조사, 설문조사, 인터뷰와 간담회의 프로세스로 이루어진다. 서울시의 경우, 25개의 자치구, 425개의 행정동, 약 19500개의 집계구 단위로 정보가 수집되고 데이터가 공개된다. 공공데이터는 정보공개단위의 한계가 있고, 행정적인 이유에서 데이터의 경계가 존재해 사람들의 행태를 실제를 반영하지 못한다. 공공데이터를 분석하고 시각화할 때는 실제 사람들은 경계가 없다는 점에 유의해야 한다. 공공데이터를 잘 분석하고 사용하기 위해서는 분석할 수 있을 만큼의 지식을 쌓아가고 무엇을 찾아야 할 것인가 문제의식과 주제의식을 갖는 것이 중요하다.
서울시 생활인구는 공공데이터의 좋은 사례다.
서울시가 보유한 빅데이터와 통신사의 통신데이터를 측정해 집계구 단위까지 매일, 시간대별, 연령별, 내/외국인별로 제공한다. 이 데이터만으로도 다양한 지역별 특성추론과 이슈 파악이 가능해진다. 빠르게 제공되는 생활인구 데이터로 코로나 19이후 사람들의 삶의 변화(국민일보, 코로나19가 바꿔놓은 서울생활인구)를 분석하고 업종별 특성과 추후에 찾아야 할 데이터들도 파악할 수 있다.
생활인구 공공데이터는 활용할 수 있는 분야도 다양하지만 서울 밖에서는 생활인구의 개념도 없고, 유사한 유동인구 공공데이터는 유료형 주문형태로 접근이 어렵다. 데이터 신청처리과정에 2만 2천원비용의 발생 뿐 아니라, 프로세스가 시대를 반영하지 못한다. 도시공간은 1년 안에 수많은 변화가 일어나지만 서울권 밖에서는 예전의 자료밖에 볼 수 없어 데이터의 신속성, 현재성이 결여되어 있다.
대기업이 아닌 민간 단위에서는 정보의 생산이 굉장히 어렵다.
공공의 역할은 데이터베이스를 잘 구축하는 것이다. 멋진 시각화보다 데이터베이스와 원자료 구축이 더 중요하다.
공공데이터화 되지 않은 것들을 데이터화하고 분석할 수 있을까?
기존의 데이터를 쪼개고 시각화하고 새로운 데이터 접근법을 찾기도 했다.
첫 번째, 데이터를 쪼갤수록 보이는 것들이 생긴다. 2020년 4월 총선 결과에서 언론을 통해 지역구 단위로 제공되는 정당지지율을 선거관리위원회 홈페이지에 공개된 개표결과 데이터를 행정동 단위로 추출, 시각화해 지역별로 어떤 이슈가 있었는지, 지지율에 대한 새로운 가설을 세워볼 수 있었다.
두 번째, 기존의 공공데이터로 접근하는 방법 외 새로운 데이터의 접근법으로 언론모니터링 리포트가 있다. 서울로7017에서 갖게 된 문제의식은 ‘반대가 많다’면 얼마나? 왜?에 대한 질문이었다.
언론모니터링으로 데이터를 수집하고 60개 정도의 기사 검색으로 헤드라인과 핵심적인 키워드로 긍정, 부정에 대한 1차 모니터링을 진행했다. 사업을 진행하면서 모니터링 방식을 변경해 더 단순화했다. 언론 보도량과 흐름을 정리하고 서울시 관련사건, 정치적 활동과의 연관성을 찾아 분석하고 모니터링을 통해 쟁점들을 발견하게 되었다. 언론모니터링 리포트는 이슈에 대해 대립하는 주체들의 의견과 언론보도의 흐름을 파악에 도움이 된다. 언론보도를 데이터로 활용하기 위해서는 목록화가 가장 중요한데 사전에 이슈에 대한 이해와 백업지식을 갖고 있지 않다면 유의미한 데이터를 파악할 수 없다. 최근 언론모니터링에서는 보도의 양의 양상, 어떤 용어를 쓰느냐를 파악하는 것도 중요하다.
광화문광장의 집회와 시위가 지역의 주요이슈가 되는지 정보를 찾고 가공해 데이터화하기도 했다. 경찰서 홈페이지에서 ‘토요일 집회와 시위 신고 공개자료 1년치 원자료를 목록화하고, 지도로 위치를 파악하는 시각화를 통해 직접적인 영향을 받는 지역을 파악하고 실제 상황을 입체적으로 이해할 수 있다.
현장과 문헌과 데이터사이에서의 고민들
숫자로 나타나지 않는 것들을 과연 어떻게 알 수 있을 것인가에 대한 고민, 특히 지역으로 갈수록 현장에 닿는 것에 대한 갈증과 한계가 커진다.
주어진 기존 정보가 특정 지역에 집중되거나 오래된 정보에서 오는 한계, 데이터를 분석하는 사람으로서 가장 크게 느끼는 시간의 한계, 접하는 시각의 한계에 속에서 데이터를 통해 어떻게 도시를 바라볼 것인가에 대해 계속 고민하고 있다.
데이터로 로컬을 보는 입장에서 서울의 어느 봉제골목에서도 현장과 문헌, 데이터 사이에서 한계를 발견한다. 사업체 통계로는 보이지 않는 산업생태계가 존재한다. 용어와 가치사슬, 연결망을 이해할 수 없는 엑셀자료로는 제대로 된 산업생태계를 파악할 수 없다. 기존의 연구를 종합하면서 현장에서의 직접조사, 관심을 가지고 연구했던 사람들과의 협업이 이루어져야 하다.
현장과 문헌, 데이터 사이의 한계를 극복하기 위해서 애정과 관심을 가지고 반복의 과정을 겪으며 지역에 대한 이해와 깊이를 확장해나가는 방법밖에 없다. 의미 있는 데이터를 만들어 내기 위해서는 축적의 시간과 양이 필요하고 이를 위해 꾸준하게 기록하고 레퍼런스를 읽고, 나의 활동을 공개하고 함께 이야기하는 과정이 중요하다.
기록 및 정리 | 이경원