반응형 CSV2 데이터 전처리(버스 승하차 데이터) 0. 데이터 분석 및 이해 - 이번 프로젝트에서 전처리를 담당한 데이터는 버스 정류장 승하차 인원 데이터였다. 내가 담당하게 된 데이터는 사실 처음부터 팀원들의 우려가 많았다. 일단 해당 데이터는 서울시 전체의 버스정류장을 대상으로 하고 있는데, 전처리 조건은 강남구에 속한 데이터만 추출하는 것이었고 분류는... 되어있지 않았기 때문이다. 최악의 상황에는 몇 백개가 될지도 모르는 정류장을 하나 하나 찾아가며 매칭해야될 수도 있는 작업이었다. - 일단 1개의 연도 데이터에 약 47만개 정도의 행이 존재했다. 서울시 정류장별 각 노선의 월별 승하차 데이터였기 때문이다. 정말 막막했는데 데이터를 잘 보니 버스 정류장별 ARS 번호라는 컬럼이 있었다. 각 정류장별 고유번호값이 지정이 되어있었는데, 생각해보니 분.. 2023. 9. 4. 엑셀에서 csv 파일 여는 방법(데이터 가져오기) - 최근 처음으로 공동 프로젝트를 시작하면서 여러 데이터들을 접하고있다. 또한, Pandas DataFrame으로 만들기 전 해당 데이터들의 원본을 엑셀로 열어 미리 확인하고 있다. - 그러나 데이터가 CSV 파일로 저장된 후에 다시 엑셀로 열게되면 다음과 같이 데이터들이 깨지는 현상이 있었다. - 알고보니 CSV 파일을 엑셀로 여는 방법은 기존에 엑셀을 여는 방법과 다르게 특별한 방법이 필요했다. 오늘은 간단한 내용이지만 앞으로 데이터들을 용이하게 확인하기 위해 해당 글을 통해 메모를 해두려고 한다. 1. 엑셀 실행하여 준비하기 - 먼저 엑셀을 실행하여 번호순대로 클릭하면, 새 엑셀시트를 만들 수 있다. 2. 외부 데이터 가져오기 - 새 엑셀 문서에서 순서대로 데이터 - 외부 데이터 가져오기 탭의 텍스.. 2023. 8. 30. 이전 1 다음 반응형