본문 바로가기
프로젝트/(공모전)순환경제 활성화를 위한 서울시 스마트수거함 입지선정

공모전 참여 케이스 스터디 -2 (서울시 수소차 충전소 우선 입지 선정)

by 규딩코딩 2023. 10. 5.

본 게시글은 2021 빅데이터캠퍼스 공모전 수상작 중 하나인 "서울시 수소차 충전소 우선 입지 선정" 과제 발표 자료를 토대로 케이스 스터디한 것입니다.(출처 : 링크)

 

1. 서론

1-1 분석배경

- 분석 배경을 제시하고 있으며, 친환경 시대의 도래라는 사회 거시적 변화에 따라오는 문제점 중 하나를 지적

- 기사를 언급하는 등 실제 근거와 시각화로 비교를 용이하게 함

 

- 충전소 한 곳 당 527대의 수소차 충전을 담당해야한다고 하는데

+ 나중에 우리 분석에서는 부족하다면 얼마나 부족한건지 보통은 몇 대가 적당한 건지에 관한 언급을 해주면 좋을 것 같음

 

- 필요성을 한 번 더 언급함 = 수소차 이용자 민원 1위가 충전시설 부족 = 자료 출처도 역시 공식적인 국민권익위 자료를 제시함.

★ 실제 필요성이 가장 와닿는건 민원 결과가 잘 설명해줄 수 있을 것 같아서 좋은듯

 

- 분석하기 전에 뭘 고려해서 분석/수집 해야할지를 언급, 비용 / 지역별 특성 / 님비현상 / 안전성 홍보

 

★ 무작정 지역 균등보다 최대한 적게 배치하면서(비용 줄이면서) 최대한 많은 수요를 충족시키는 입지 선정을 목표로

 

1-2 분석 개요

- 데이터 수집 및 전처리 = 클러스터링(k-means) = 우선 설치 대상 법정동 선정 = 최종 입지 선정

 

- 어떤 데이터가 어떻게 쓰였는지를 보여주는 좋은 시각화라고 생각이 들었음.

 

1-3 변수 전처리

- 미성년자는 자가용 운행이 불가하므로 생활인구 데이터에 20세이상의 연령을 추출

- 충전소 수요에 직접적인 영향을 주는 8시~22시(서울 소재 수소차 충전소 평균 이용가능 시간대)를 먼저 추출하고, 이중에서 평일 근무시간인 10시~18시를 제외한 교통량을 추출함

★ 평일 근무시간대에도 주유가 필요하지 않은가 싶은 생각은 있지만... 어쨋든 중요한 것은 해당 분석의 특성과 도메인 지식에 근거한 데이터가 추출되었다는 것이 중요하다고 생각한다. 데이터분석은 가설과 데이터 통제가 중요하니까

 

2 클러스터링

- 최적 군집 개수 결정에서 기존에 알고 있던 Elbow Method, Silhouette Method에 더하여 NbClust 지표를 사용한 것을 배울 수 있었다.

★ NbClust 지표 분석 : 군집 수, 거리 측정 및 군집화 방법의 모든 조합을 활용하여 군집 개수 추천

 

3. 우선 설치 대상 법정동 선정

- "수요지수 = 수소차 증가점수 + 거리점수 + 수소차 보유대수" 를 개발함

- 수소차 증가점수 = 수소차 증가량과 독립변수들간의 다중회귀분석을 실시하여, 유의미하게 나온 변수들만 추출하여 새로운 다중회귀분석을 실시하는 프로세스를 거쳤다.

- 거리점수 = 법정동별 위경도를 이용하여 기존 서울 소재 수소충전소 네 곳과의 거리 중 최단거리를 적용

- 수소차 보유 대수 = 법정동별 수소차 보유 대수 데이터

 

★ 각 세 변수들에 대하여 오름차순으로 순위를 부여하고, 이들의 합을 수요지수로 지정하여 수요지수가 높은 순서로 우선 설치대상을 고려함

=> 수소차가 증가할 것으로 예상되고, 현재 수소차 충전소들과의 거리가 멀고, 수소차 보유 대수가 많은 곳을 동시에 만족하는 법정동이 선정되게 함

 

- 더하여, 점수가 높더라도 기존 수소충전소 반경 2.5km (차로 20-30분을 가정) 원과 서로 겹치면 제외하고 이전에 뽑힌 법정동 반경과도 2.5km 반경이 겹치면 미포함하여 선정하여 설치가 시급한 입지를 선정하기 위한 장치를 마련했다.

 

4. 최종 입지 선정 과정

- 다음과 같이 실제 지도에서의 위치를 보여주고, 구체적으로 어디에 위치하면 좋을지 해당 위치 특징을 분석하여 실제 사업을 진행하는 것과 다름이 없는 수준의 도메인 분석 내용과 노력을 보여준 것이 좋았다고 생각한다.

 

 

반응형