본문 바로가기
반응형

서울 열린데이터 광장3

좌표 데이터(.shp) - 1 폴리곤 좌표를 파이썬으로 가져오기 1. 배경 - 해당 프로젝트 게시글을 꾸준히 보고 계시다면 아시겠지만, 혹시 이 글로 처음보시는 분들을 위해 간단요약 - 프로젝트 진행 중 힘들게 해당 지점의 버스정류장 승하차 인구 데이터를 수집하였는데, 정작 프로젝트 최종 합본 데이터프레임에 매칭시켜줄 방법이 없어 다소 안좋은 상황이었다. - 가장 큰 문제는 상권분석 서비스가 요런 상태라는 것이다 ... - 열심히 철저하게 상권을 분류해주신 덕분에 폴리건이 굉장히 다다다다각형인 상황이다. 그래서 좌표를 일일히 따는 것도 꽤나 어려운 상황이었으며, 상권영역에는 영역데이터이나 X, Y좌표 하나만 제공된 상항 - 역으로 생각해보면 상권분석서비스를 제작했을 때 분명 웹페이지에 폴리건을 그린 어떤 좌표 기준 값들이 데이터화 되어 있었을 것이고, 지금도 여전히 .. 2023. 9. 6.
데이터 전처리(버스 승하차 데이터) 0. 데이터 분석 및 이해 - 이번 프로젝트에서 전처리를 담당한 데이터는 버스 정류장 승하차 인원 데이터였다. 내가 담당하게 된 데이터는 사실 처음부터 팀원들의 우려가 많았다. 일단 해당 데이터는 서울시 전체의 버스정류장을 대상으로 하고 있는데, 전처리 조건은 강남구에 속한 데이터만 추출하는 것이었고 분류는... 되어있지 않았기 때문이다. 최악의 상황에는 몇 백개가 될지도 모르는 정류장을 하나 하나 찾아가며 매칭해야될 수도 있는 작업이었다. - 일단 1개의 연도 데이터에 약 47만개 정도의 행이 존재했다. 서울시 정류장별 각 노선의 월별 승하차 데이터였기 때문이다. 정말 막막했는데 데이터를 잘 보니 버스 정류장별 ARS 번호라는 컬럼이 있었다. 각 정류장별 고유번호값이 지정이 되어있었는데, 생각해보니 분.. 2023. 9. 4.
0. 프로젝트 시작과 사전에 논의된 내용 - 첫 공동 프로젝트를 수행하게 되었다. - 9월1일부터 공식적으로 시작하며, 프로젝트 준비 단계에서 미리 주제를 구체화하고 사전 논의한 내용을 정리하고자 한다. 1. 9월 1일 이전에 있었던 일 총 정리 1-1 주제 변화 최초 과도기 현재 시간대별 유동인구에 따른 상권별 매출 예측 강남구 시간대별 요일별 유동인구에 따른 상권별 업종별 매출 예측 강남구 상권별 편의점의 평균 매출을 시간대별* 예측하여 BI 제시 * 서울시 상권분석 서비스에서 구분한 시간대 구간은 00~06 / 06~11 / 11~14 / 14~17 / 17~21 / 21~24 총 6개 구간이다. - 주제가 바뀌게 된 이유는 여러 이유가 작용했다. 확보할 수 있는 매출 관련 데이터는 서울시 상권 분석 서비스에서 사용하는 상권별 - 추정매출.. 2023. 8. 31.
반응형