회의정리
1.데이터 전처리의 건 :
- 결론 : 집객시설에 대한 재수집 필요성이 있어 검토 및 전처리 진행중
2. 역할 분담의 건 :
- 분반1 : 상권 분류
- 기능별 상권 분류의 각 상권 기준 최종 정의
- 집객시설을 중심으로 아파트 수 등과 같은 피처 추가 선정 및 데이터 재수집
- + 다양한 사례의 상관분석 실시
- 분반2 : 지하철/버스 데이터 처리
- 상권 영역으로 부터의 지하철/버스 데이터를 얼만큼의 반경의 데이터들을 포함할 것인지
- 상권별 지하철역/버스 정류장/각 승하차 승객수 컬럼 추가하기
- + 파이썬 여러 라이브러리를 이용하여, 상권 중앙을 기준으로 몇 미터 내에 "무엇"이 몇개 위치하는지 등 위치 정보를 활용할 수 있는 코드 작성 등
- 추가 업무 :
- 분반별 과업 수행, 상황 발생 시 상황공유
3. 상권 영역 표시의 건 :
- geopandas 라이브러리를 이용하여, 상권영역을 폴리곤으로 시각화하고 특정 점이 해당 폴리곤(상권분류 영역)에 속하는지 등을 학습하여 전체 현황 공유함.
4. K-means Clustering(기능별 상권 분류) 관련 건
- k-means clustering도 target과 가장 연관있는 변수를 기준으로 한다길래 상관분석 heatmap을 그려보았으나 종속변수인 시간대별 매춝과 상관관계가 유의미하게 나오는 피처가 없었음(0.6 이상이 없음)
- 결론 : 일단 도메인 지식을 이용한 기준으로 여러 피처로 상권을 나누어 상관분석 해보기로 결정
- 추가 업무 : 분반 1,2 상호 합의 후 피처 종류 줄이기, 분반 1 새로운 피처 추가 및 그에따른 데이터 찾기
차기 회의(9/8, 금, 수시)
반응형
'프로젝트 > (세미)강남구 지역 상권 기반 시간대별 편의점 매출 예측' 카테고리의 다른 글
좌표 데이터(.shp) -3 반경 내 좌표 개수 세기 (0) | 2023.09.09 |
---|---|
5. 프로젝트 회의 정리(09.08) (0) | 2023.09.08 |
좌표 데이터(.shp) -2 폴리곤 좌표 데이터를 파이썬에서 활용하는 방법 (0) | 2023.09.07 |
3. 프로젝트 회의 정리(09.06) (0) | 2023.09.06 |
좌표 데이터(.shp) - 1 폴리곤 좌표를 파이썬으로 가져오기 (0) | 2023.09.06 |