반응형 프로젝트45 공모전 참여 케이스 스터디 -2 (서울시 수소차 충전소 우선 입지 선정) 본 게시글은 2021 빅데이터캠퍼스 공모전 수상작 중 하나인 "서울시 수소차 충전소 우선 입지 선정" 과제 발표 자료를 토대로 케이스 스터디한 것입니다.(출처 : 링크) 1. 서론 1-1 분석배경 - 분석 배경을 제시하고 있으며, 친환경 시대의 도래라는 사회 거시적 변화에 따라오는 문제점 중 하나를 지적 - 기사를 언급하는 등 실제 근거와 시각화로 비교를 용이하게 함 - 충전소 한 곳 당 527대의 수소차 충전을 담당해야한다고 하는데 + 나중에 우리 분석에서는 부족하다면 얼마나 부족한건지 보통은 몇 대가 적당한 건지에 관한 언급을 해주면 좋을 것 같음 - 필요성을 한 번 더 언급함 = 수소차 이용자 민원 1위가 충전시설 부족 = 자료 출처도 역시 공식적인 국민권익위 자료를 제시함. ★ 실제 필요성이 가장.. 2023. 10. 5. 공모전 참여 케이스 스터디 -1 (크롤링 / 워드클라우드) 이번에 좋은 기회로 훌륭한 팀원들과 함께 "2023 서울시 빅데이터캠퍼스 공모전"에 참여하고자 한다. 경험이 많이 부족하기 때문에 기수상작에 대한 분석을 먼저 진행하는 것으로 계획을 세웠다. 다행히도 공모전 수상작들에 대한 사례들이 누리집 자료실에 존재하여 해당 페이지에서 제목들과 수상내역들을 크롤링하고, 최종적으로는 워드 클라우드로 만들어 주목할만한 키워드가 있는지 찾아보려고 한다. 1. 수상내역 페이지 크롤링 - 서울 빅데이터 캠퍼스 누리집의 https://bigdata.seoul.go.kr/noti/selectPageListTabNoti.do?r_id=P260&bbs_seq=&ac_type=A1 해당 링크에서 관련 내용을 찾아볼 수 있다. - 크롤링 코드는 다음의 코드를 사용하면 된다. # 빈 데이.. 2023. 10. 4. 20. 프로젝트를 마친 뒤 깨달음 그렇게 오늘 결과 발표를 끝으로 인생 첫 데이터분석 팀 프로젝트가 끝이 났다. 1. 프로젝트 후 느낀 점 - 데이터 수집이 너~무 어려웠다. 하고 싶은 분석은 많은데 매번 데이터가 없어서 점점 주제가 간소화되어 가는 것이 나도 그렇고 팀원들도 아쉬운 점이 많았다. 가공도 어렵고 이상치 처리도 어렵고 정해진 답은 없고, 가정의 가정의 가정의 연속이었다. 전처리에서 어려웠던 것 이상치는 어떤 근거로 얼마나 제거해야하는가? 이상치를 제거해서 오차가 줄어든다면 그것은 맞는 모델링일까? 예컨대 강남 편의점을 매출 순으로 줄 세워서 얻은 데이터는 분명 실재하는 매출 데이터이고, 틀린 데이터는 아닌데 단순히 매출이 다른 값들 보다 엄청 높아서 또는 엄청 낮기 때문에 모델의 성능을 위해서 제거해야하는가는 아직도 알 수.. 2023. 9. 27. 19. 프로젝트 발표 D-DAY(09.26) : 프로젝트 결과는 ... 1. 질문과 답변 - 먼저 전체적인 분위기 : 다들 질문을 많이 하지 않으시는 것이 아쉬웠다. 나는 다른 분들의 프로젝트에 너~무 관심이 많았는데 눈치보여서 한 조에 하나씩밖에 못 물어봤는데.. 들어보지 못했던 분석기법도 궁금하고, 여기서 왜 이렇게 생각하셨는지도 궁금했는데 뭔가 공격하는 느낌이 들어서 죄송하기도 했다 어쨋든 경쟁이라서 그런가 ㅠㅜ 감사하게도 질문을 주신 부분과 답변 내용을 요약해보자면 다음과 같다. 1. 강남역을 기준으로 한다면, 강남역의 어느 영역을 기준으로 하는지 : 먼저 "해당 상권"이란 대시보드에 보이는 각 상권(Polygon) 영역을 말합니다. => 이 부분은 시각화가 잘 구현되어있고, 각 상권 명칭도 분명하다고 생각해서 설명을 더 상세하게 드리지 못한 점이 조금 어렵게 느껴지.. 2023. 9. 26. 18. 프로젝트 마지막 회의 정리(09.25) 발표 D-1 HTML 삽입 미리보기할 수 없는 소스 회의정리 1. Streamlit 구현 1-1 기획 초안 강남구 지도를 상권영역에 따라 분리하고, 각각 상권 명을 나타내주어 사용자가 원하는 영역을 찾을 수 있도록 정보를 제공해주면 왼쪽의 사이드바에서 선택란에서 상권 명을 선택이 가능하도록 구현 = 완료 해당 지도에는 확대/축소 기능이 필요 = 완료 사용자는 상권 명(영역선택), 시간대 선택, 분기 선택 후, 나머지 변수들은 사용자가 직접 slider를 사용하여 값을 지정하며 예측 모델을 임의로 조절하는 기능도 구현 필요 = 완료 상권은 현재 골목상권과 비골목 상권 두 가지 모델로 이루어져있기 때문에, 사용자가 선택한 상권에 따라 다른 모델이 실행되도록 하는 기능 필요 = 완료 사용자가 변수의 값을 조절하는 기능은 .. 2023. 9. 25. 이전 1 2 3 4 5 6 7 ··· 9 다음 반응형