회의정리
1.데이터 전처리의 건 :
- 분반별 최종 데이터프레임 제작을 위하여 각 파트별 전처리 진행 중
2. 역할 분담의 건 :
- 분반1 : 상권 분류
- 기능별 상권 분류의 각 상권 기준 최종 정의
- 집객시설을 중심으로 아파트 수 등과 같은 피처 추가 선정 및 데이터 재수집
- + 다양한 사례의 상관분석 실시 후 유의미한 상관분석 결과는 공유
- + 집객시설 데이터에서 다량의 피처 제거
- +
배후지 데이터 처리
고민 - +
추가할 feature
논의
- 분반2 : 지하철/버스 데이터 처리
상권 영역으로 부터의 지하철/버스 데이터를 얼만큼의 반경의 데이터들을 포함할 것인지=> 폐기- + 폐기 사유 : 기존 선행연구들은 각 편의점 점포마다의 상권분석을 실시하였으나, 우리 프로젝트에서 확보한 데이터로는 위와 같은 연구가 불가능함. 또한, 현행 상권분석서비스는 반경으로 정한 상권 영역에서 현재의 다각형 모양으로 기준을 바꾸었고, 그 취지가 있음을 이해하고 기존의 상권분석서비스의 상권(폴리곤 데이터)을 이용하여 해당 상권을 기준으로 사용하기로 결정
- + 상권별 지하철역/버스 정류장/각 승하차 승객수 컬럼 추가하기(현재 상권별 역,정류장 개수까지 파악완료)
- 추가 업무 :
- 분반별 과업 수행, 상황 발생 시 상황공유
3. K-means Clustering(기능별 상권 분류) 관련 건
- k-means clustering도 target과 가장 연관있는 변수를 기준으로 한다길래 상관분석 heatmap을 그려보았으나 종속변수인 시간대별 매춝과 상관관계가 유의미하게 나오는 피처가 없었음(0.6 이상이 없음)
- 결론 : 일단 도메인 지식을 이용한 기준으로 여러 피처로 상권을 나누어 상관분석 해보기로 결정
- + 상권분류가 유의미하게 나오지 않으면 현재 상권분석서비스의 4분류체계를 차용하는 것이 최선이라는 의견
- 추가 업무 : 분반 1,2 피처 종류 줄이기, 분반 1 새로운 피처 추가 및 그에따른 데이터 찾기
분반별 회의(9/9 ~ 9/10, 주말, 필요시)
차기 전체 회의(9/11, 월, 수시)
반응형
'프로젝트 > (세미)강남구 지역 상권 기반 시간대별 편의점 매출 예측' 카테고리의 다른 글
좌표 데이터(.shp) -4 영역 내 좌표 개수 세기 / 해당 좌표 출력하기 (0) | 2023.09.10 |
---|---|
좌표 데이터(.shp) -3 반경 내 좌표 개수 세기 (0) | 2023.09.09 |
4. 프로젝트 회의 정리(09.07) (0) | 2023.09.07 |
좌표 데이터(.shp) -2 폴리곤 좌표 데이터를 파이썬에서 활용하는 방법 (0) | 2023.09.07 |
3. 프로젝트 회의 정리(09.06) (0) | 2023.09.06 |