본 사이트는 자바스크립트가 작동되어야 편리하게 이용하실 수 있습니다. 현재 스크립트가 정상적으로 작동되지 않습니다.

환경

음식물쓰레기와 코로나 (2)

음식물 쓰레기가 나오는 양과 코로나 확진자수는 관련이 있을까?
지역별 음식점 등 주요 상권, 음식물 쓰레기 배출내역, 코로나 확진자 수 및 인구 데이터 분석

"금방 끝날 줄 알았는데"
코로나 때문에 다들 집콕한지 벌써 2년.
언택트, 온택트…
미래를 말하는 새로운 마케팅 용어가 난무하지만 당면해 있는 현실은 아직 희망적이라고 하기 어렵다.
순식간에 택배와 배달이 일상에 굳게 자리잡은 시대. 음식점은 어려움에 처해 있고, “배달” 관련해 많은 사업 모델이 생겨났다.
소상공인의 위기임은 물론, 쓰레기 발생도 사회 문제로 부각되고 있다.
데이터 분석을 통해 코로나와 쓰레기 발생과의 관계를 규명하고 그를 통해 이러한 문제를 어떻게 해결할 수 있을지 전략 도출의 실마리를 찾기 위해 이 시리즈를 기획하였다.

작성자 : 대홍기획 빅데이터솔루션팀 안중호 CⓔM
E-Mail : bakky14@gmail.com

활용한 데이터 셋은 다음과 같다.

상세정보
구분 원천 데이터셋 링크 비고
소상공인 매출 및 사업자 정보 https://www.bigdata-region.kr/#/dataset/266e8af1-d30d-4af0-9c56-cdba6e6c4528 소상공인 및 경기신용보증 비대면(모바일)보증 실적 데이터
소상공인 진흥공단 상가(상권) 정보 https://www.data.go.kr/tcs/dss/selectFileDataDetailView.do?publicDataPk=15083033 영업 중인 전국 상가업소 데이터
(상호명, 업종코드, 업종명, 지번주소, 도로명주소, 경도, 위도 등)
지역별 음식물 쓰레기 배출 추정정보 https://www.bigdata-environment.kr/user/data_market/detail.do?id=b5341100-3074-11eb-bc79-3b11eb915d6d 지자체별 음식물 쓰레기 배출내역
서울시 코로나 발생 동향 https://www.seoul.go.kr/coronaV/coronaStatus.do 서울시 공식 페이지 제공 정보 웹크롤링 (실시간 갱신)
서울시 주민등록인구 구별 통계 https://data.seoul.go.kr/dataList/419/S/2/datasetView.do 서울시 열린데이터 광장에서 제공하는
자치구별 주민등록인구수 일반 보고통계

Story #03
“코로나 확진자가 많으면, 음식물 쓰레기가 많이 나올까?”

- 음식물 쓰레기 배출현황 및 음식물 쓰레기와 코로나 확진자수의 연관관계 -

[ 서울시 구별 코로나 확진자수 ]

코로나가 가장 많이 발생한 지역은 강남구, 송파구, 관악구 순이며 기업들이 다수 위치해 “출퇴근 인구”가 많은 중구, 종로구에는 확진자가 적게 발생하였다. 다른 데이터와의 융합 등 다양한 추가 분석을 통해 원인을 알아보기로 한다.

서울시 구별 코로나 확진자수 총계(강남구8425명, 송파구8266명, 관악구7057명, 구로구 6651명, 영등포구6376명, 강서구 5890명, 은평구 5646명, 강동구 5500명, 노원구 5437명, 성북구 5359명, 동작구 5221명, 서초구 5215명, 동대문구 5212명, 중랑구 4834명, 마포구 4681명, 광진구 4371명, 양천구 4322명, 강북구 3719명, 성동구 3660명, 도봉구 3602명, 서대문구 3484명, 용산구 3388명, 금천구 3225명, 종로구 2365명, 중구2336명) 그래프

[ 서울시 구별 코로나 확진자수 밀도 ]

확진자수가 많은 강남구, 송파구, 관악구 등을 지도에서 색깔로 구분할 수 있다. 그런데 코로나 확진자 발생수는 다른 어떤 요소와 관계가 있을까?

서울시 구별 코로나 확진자수 밀도
서울시 구별 코로나 확진자수 밀도

[ <음식물 쓰레기 양> 과 <코로나 확진자 수> 사이의 관계 – 산포도(scatterplot) ]

<음식물 쓰레기 양>과 <코로나 확진자 수> 사이의 관계에 대해 이 시각화에서는 경향성을 뚜렷이 보기 어려우므로 추가 분석을 실시한다.

강남구 배출량 1.418406B/확진자수 8425명, 마포구 배출량 20.82555B/확진자수4681명, 송파구 배출량 38.26551B/확진자수 8266명,

[ 음식물 쓰레기 양과 코로나 확진자 수 사이의 관계 – 회귀선 추가 ]

상관관계의 크기와 방향을 나타내는 회귀선을 그어본 결과 기울기, 즉 피어슨 상관계수는 0보다 약간 커서 음식물 쓰레기 양과 코로나 확진자 수는 약한 양의 상관관계를 보였다.

구별 음식물 쓰레기 배출량과 코로나 발생의 관계
구별 음식물 쓰레기 배출량과 코로나 발생의 관계

[ 음식점 수과 코로나 확진자 수 사이의 관계 – 회귀선 추가 ]

또한, 음식점 수과 코로나 확진자 수 역시 양의 상관관계를 보였다.

구별 음식점수와 코로나 발생의 관계
구별 음식점수와 코로나 발생의 관계

[ 음식점 수, 음식물 쓰레기 양, 코로나 확진자수 간 상관분석 – heatmap ]

확진자 수와 음식점 수의 상관계수는 0.68로 매우 크다. 그런데 이것이 음식점이란 장소가 코로나의 주요 발생 원인이라는 것을 의미한다고 볼 수 있을까?
코로나 발생이 음식물쓰레기에 어떤 작용을 하기에 상관성이 있을까?

음식점 수, 음식물 쓰레기 양, 코로나 확진자수의 상관관계
음식점 수, 음식물 쓰레기 양, 코로나 확진자수의 상관관계

[ 분석의 결론 ]

코로나 확진자 수가 많으면 자가격리로 택배/배달을 많이 시키게 되어 음식물 쓰레기 양이 많아질 것이다 라는 가설 하에
상권 데이터와 음식물 쓰레기 배출량 데이터, 코로나 확진자 데이터를 결합, 다양한 시각화를 거쳐 최종 상관관계 분석까지 진행한 결과,
코로나 확진자가 늘어날 때 음식물 쓰레기는 조금씩 증가하고 음식점 수 는 크게 증가(상관계수 0.68)하는 현상을 확인하였다.

음식점이 코로나가 발생하는 원인이기 때문일까? 그리고 음식물 쓰레기 양과 코로나 확진자 수는 무슨 관계가 있을까?

[ 시사점 및 다음 분석 방향 ]

코로나 확진자 수가 많으면 자가격리로 택배/배달을 많이 시키게 되어 음식물 쓰레기 양이 많아질 것이다 라는 가설 하에
상권 데이터와 음식물 쓰레기 배출량 데이터, 코로나 확진자 데이터를 결합, 다양한 시각화를 거쳐 상관관계 분석까지 진행하였으나 가설을 정확히 확인할 수 없었다. 그 이유로는 :

1. 음식점 수만 분석 대상으로 삼은 결과
· 택배/음식배달에서 나오는 음식물 쓰레기는 고려되지 않았다.
· 택배/음식배달 데이터를 포함한다면 더 정확한 분석 결과가 도출될 것이다.

2. 상관관계와 인과관계의 정확한 구별
· 확진자 수가 증가할 때 음식물 쓰레기도 증가하지만 코로나 확진이 원인이 되어 음식물 쓰레기가 증가했다는 의미는 아니다.
· 마찬가지로, 음식점이 코로나 확진의 원인이었다는 의미도 아니다.
· 상관관계는 증명되었으나, 인과관계는 확인이 필요하다.

코로나 확진자 발생에 다른 요소들이 영향을 미친 것인지 현재 상황에서 구할 수 있는 데이터로 추가 분석을 진행하고자 한다.

Story #04
“지역 인구와 코로나 확진자수는 상관이 있을까?”

- 지역별 주민등록 인구수와 코로나 확진자수와의 연관관계 -

[ <서울시> 구별 인구 순위 ]

주요 거주지인 <송파구>, <강서구>, <강남구> 순으로 상주 인구가 많고 “회사”가 많은 <종로구>, <중구>는 “출퇴근 인구”가 많은 대신 “거주 인구”는 적은 것을 확인할 수 있다.

서울시 구별 코로나 확진자수 총계 송파구664.996K	 강서구581.265K 강남구538.075K 노원구517.038k 관악구501.572k 은평구477.961k 강동구467.997k 양천구452.255k 성북구441.717k 구로구422.361k 서초구420.045k 영등포구401.814k 동작구396.122k 중랑구393.149k 마포구379.525k 광진구353.38k 동대문구351.626k 도봉구320.711k 서대문구316.415k 강북구304.257k 성동구294.14k 금천구244.887k 용산구238.3k 종로구154.318k 중구131.943k

[ 서울시 구별 인구 밀도 ]

인구가 많은 <송파구>, <강서구>, <강남구> 등을 지도상에서 쉽게 찾을 수 있다. 그런데 <인구 수> 와 <코로나 발생> 이 관계가 있을까? 데이터 융합 분석으로 알아보았다.

서울시 구별 인구 밀도
서울시 구별 인구 밀도

[ 서울시 구별 <코로나 확진자 수>와 <인구수> 밀도 비교 ]

코로나 발생이 많은 <강남구>, <송파구>, <강서구>가 인구도 많은 것을 볼 수 있다. <종로구>는 코로나 환자도 적고 인구도 적은 등 전반적으로 두 데이터는 비슷해 보인다. <코로나 환자 수>와 <인구>는 어떤 관계가 있는지 상관분석을 통해 “정확한 수치”를 살펴보자.

서울시 코로나 확진자 분포 서울시 인구 분포
서울시 코로나 확진자 분포 서울시 인구 분포

[ <인구>와 <음식점 수>, <음식물 쓰레기>, <코로나 발생>의 관계 ]

회귀선의 각도가 클수록 상관관계가 크다. 히스토그램, 산포도, 회귀선을 동시에 그려 본 결과 <인구>가 많아질 때 <음식점 수>, <음식물 쓰레기>, <코로나 발생>이 동시에 증가하는 것을 확인하였다.

인구가 많아질 때 음식점 수, 음식물 쓰레기, 코로나 발생이 동시에 증가함을 나타내는 그래프
인구가 많아질 때 음식점 수, 음식물 쓰레기, 코로나 발생이 동시에 증가함을 나타내는 그래프

[ <인구>와 <음식점 수>, <음식물 쓰레기>, <코로나 발생>의 상관분석 – heatmap ]

<인구>가 많아질수록 자연스럽게 <음식점 수>, <음식물 쓰레기>도 함께 늘어난다. 특히 <인구>와 <확진자 수>의 상관계수는 0.87로, <음식점 수>와 <확진자 수>의 0.69보다 크다. <코로나 확진자 수>에 가장 큰 영향을 미치는 것은 <인구 수>임을 확인하였다.

코로나 확진자 수에 가장 큰 영향을 미치는 것은 인수임을 나타내는 상관관계도
코로나 확진자 수에 가장 큰 영향을 미치는 것은 인수임을 나타내는 상관관계도

이전 분석에서 <음식점 수>와 <코로나 확진자 수>의 상관성을 확인하였으나 <상관관계>와 <인과관계>는 구별해야 하므로 이것으로 <음식점>이 <코로나 발생>의 근원지라고 결론 내릴 수 없다.

상관관계는 증명되었으나, 인과관계를 확인하기 위해 <코로나 확진>에 다른 어떤 요소들이 영향을 미친 것인지 여러 데이터를 융합해 추가 분석을 진행한 결과 <코로나 발생>에 가장 큰 영향을 주는 것은 <인구 수>라고 판단되었으며 인구와 함께 <음식점 수>와 <음식물 쓰레기>도 많아진 효과로 <음식점 수>에 따라 <코로나 발생>이 늘어나는 것처럼 “보여진” 것이라 결론지었다.

[ 시사점 ]

1. 추가로 <인구 밀도> 고려
· 단순히 인구가 많아서 그에 비례해 코로나 환자가 많은 것인지, 지역의 면적까지 고려한 <면적 대비 인구 밀도>가 높음으로 인해 접촉이 많아 코로나가 많이 발생한 것인지 확인할 필요가 있다.

2. 데이터 수집의 기준과 시기 일치
· 여러 데이터를 통합하려면 동일한 기준(수집 시기 등)에 의해 수집된 데이터라야 한다.
· 각 데이터의 기준과 수집시기가 다르므로 (ex:상권-2020년, 코로나-2021년 실시간) 이번 분석의 의미를 과도하게 확장 해석하는 것은 경계해야 한다.

3. <인과관계>의 심화 탐색 필요
· “실무적으로” 매우 강한 상관관계가 있을 경우 “인과관계를 추단”한다.
· 인구 수와 코로나 발생의 상관관계가 0.87로서 매우 강하여 인과관계를 추단하였으나 잘 설계한 추가 분석에 의해 “추단된 인과관계가 없음이 증명”될 수도 있다.

[ 데이터 스토리 총정리 및 향후 과제 ]

데이터를 통해 코로나와 쓰레기 발생과의 관계를 새로이 규명하고 코로나 시국을 겪는 소상공인의 어려움 등 당면한 문제를 해결하는데 도움을 주려는 의도에서 이 스토리를 기획하게 되었다. “바로 현장에 적용가능한 전략”을 도출하기에는 데이터의 상황 등 여러 한계와 마주쳤으나 최선을 다해 다양한 시도를 통해 상황을 다각도로 파악하고 흥미롭고 발전 가능성 있는 인사이트를 이끌어낸 과정이 의미 있었다. <코로나>와 관련된 4편의 데이터 스토리 시리즈를 마무리하며 향후, 현재의 데이터를 업데이트하고 다양한 추가 데이터를 구하여 새로운 목적과 그에 따른 분석을 고민하는 것이 다음 과제임을 밝힌다.

[ fin. 서울시 데이터 요약 ]

서울시의 음식점 상권분포, 음식물쓰레기 양, 코로나 확진자 수, 구별 인구 분포를 지도로 표시
서울시의 음식점 상권분포, 음식물쓰레기 양, 코로나 확진자 수, 구별 인구 분포를 지도로 표시

※ 본 데이터스토리 작성을 위해 사용된 코드와 결과물은 통합 데이터지도 GitHub URL이나 아래의 붙임파일을 통해 확인하실 수 있습니다.

상세정보
구분 링크 비고
통합 데이터지도 GitHub https://github.com/niadatamap/DataMap_DataStory
음식물쓰레기와 코로나 (2) GitHub https://github.com/niadatamap/DataMap_DataStory/raw/master/2021/26/
음식물쓰레기와 코로나 (2) 소스코드 다운로드 pdf | html1 | html2
맨 위로 버튼