반응형 프로젝트45 2. 프로젝트 회의 정리(09.04-5) HTML 삽입 미리보기할 수 없는 소스 회의 내용 정리 1. 데이터 전처리의 건 데이터 전처리 중 협의가 필요한 경우가 있어서, 협의가 필요한 파트를 의견 나누어 기준 설정함. 결론 : 일부 데이터 전처리는 차기 회의까지 전처리하는 것으로 업무 기한 연장 2. 결측치 데이터 해결의 건 특정 상권의 편의점 점포수 결측치 문제는 데이터 전처리자의 거듭적인 확인을 거쳐 다시 의논하기로 함. 결론 : 1과 같음 3. 상권 영역 표시의 건 현재 상권분석서비스에서 나눈 각 상권은 N각형으로 아주 점이 많은 다각형의 형태를 띄고있음 Python 라이브러리인 geopandas 를 이용하여 각 점의 좌표만 알 수 있다면 해결이 어느정도 가능할 것으로 보임 다만 현재 상권영역 데이터에는 점 하나만 제공됨. 지하철데이터는 .. 2023. 9. 5. 데이터 전처리(버스 승하차 데이터) 0. 데이터 분석 및 이해 - 이번 프로젝트에서 전처리를 담당한 데이터는 버스 정류장 승하차 인원 데이터였다. 내가 담당하게 된 데이터는 사실 처음부터 팀원들의 우려가 많았다. 일단 해당 데이터는 서울시 전체의 버스정류장을 대상으로 하고 있는데, 전처리 조건은 강남구에 속한 데이터만 추출하는 것이었고 분류는... 되어있지 않았기 때문이다. 최악의 상황에는 몇 백개가 될지도 모르는 정류장을 하나 하나 찾아가며 매칭해야될 수도 있는 작업이었다. - 일단 1개의 연도 데이터에 약 47만개 정도의 행이 존재했다. 서울시 정류장별 각 노선의 월별 승하차 데이터였기 때문이다. 정말 막막했는데 데이터를 잘 보니 버스 정류장별 ARS 번호라는 컬럼이 있었다. 각 정류장별 고유번호값이 지정이 되어있었는데, 생각해보니 분.. 2023. 9. 4. 1. 프로젝트 회의 정리(09.03) HTML 삽입 미리보기할 수 없는 소스 회의 내용 정리 1. 데이터 추가의 건 논문을 찾아보니 100건 이하의 데이터로 분석을 수행한 경우도 있었음. 데이터가 많고 적은 것은 우리 팀에서 결정해야할 문제로 정해진 답은 없는 듯 결론 : 현재 약 300개 데이터는 너무 적은 것으로 판단, 2020년과 2021년 데이터를 추가로 조사하는 것으로 최종 결정 발생 업무 : 현재 전처리된 데이터에서 2020년과 2021년 데이터를 추가로 확보, 연도 컬럼을 추가 2. 결측치 데이터 해결의 건 현재 추정 매출 데이터에서 상권별 편의점의 평균 매출 산정을 위해 필요한 점포수가 없거나, 아예 상권의 추정 매출 데이터가 없는 상권이 16개나 존재하여 결측치 해결 방법 논의 필요 최종 스트림릿 대시보드에 매출금액이 나오지.. 2023. 9. 3. 0. 프로젝트 시작과 사전에 논의된 내용 - 첫 공동 프로젝트를 수행하게 되었다. - 9월1일부터 공식적으로 시작하며, 프로젝트 준비 단계에서 미리 주제를 구체화하고 사전 논의한 내용을 정리하고자 한다. 1. 9월 1일 이전에 있었던 일 총 정리 1-1 주제 변화 최초 과도기 현재 시간대별 유동인구에 따른 상권별 매출 예측 강남구 시간대별 요일별 유동인구에 따른 상권별 업종별 매출 예측 강남구 상권별 편의점의 평균 매출을 시간대별* 예측하여 BI 제시 * 서울시 상권분석 서비스에서 구분한 시간대 구간은 00~06 / 06~11 / 11~14 / 14~17 / 17~21 / 21~24 총 6개 구간이다. - 주제가 바뀌게 된 이유는 여러 이유가 작용했다. 확보할 수 있는 매출 관련 데이터는 서울시 상권 분석 서비스에서 사용하는 상권별 - 추정매출.. 2023. 8. 31. 엑셀에서 csv 파일 여는 방법(데이터 가져오기) - 최근 처음으로 공동 프로젝트를 시작하면서 여러 데이터들을 접하고있다. 또한, Pandas DataFrame으로 만들기 전 해당 데이터들의 원본을 엑셀로 열어 미리 확인하고 있다. - 그러나 데이터가 CSV 파일로 저장된 후에 다시 엑셀로 열게되면 다음과 같이 데이터들이 깨지는 현상이 있었다. - 알고보니 CSV 파일을 엑셀로 여는 방법은 기존에 엑셀을 여는 방법과 다르게 특별한 방법이 필요했다. 오늘은 간단한 내용이지만 앞으로 데이터들을 용이하게 확인하기 위해 해당 글을 통해 메모를 해두려고 한다. 1. 엑셀 실행하여 준비하기 - 먼저 엑셀을 실행하여 번호순대로 클릭하면, 새 엑셀시트를 만들 수 있다. 2. 외부 데이터 가져오기 - 새 엑셀 문서에서 순서대로 데이터 - 외부 데이터 가져오기 탭의 텍스.. 2023. 8. 30. 이전 1 ··· 6 7 8 9 다음 반응형