본문 바로가기
반응형

Python27

공모전 참여 케이스 스터디 -1 (크롤링 / 워드클라우드) 이번에 좋은 기회로 훌륭한 팀원들과 함께 "2023 서울시 빅데이터캠퍼스 공모전"에 참여하고자 한다. 경험이 많이 부족하기 때문에 기수상작에 대한 분석을 먼저 진행하는 것으로 계획을 세웠다. 다행히도 공모전 수상작들에 대한 사례들이 누리집 자료실에 존재하여 해당 페이지에서 제목들과 수상내역들을 크롤링하고, 최종적으로는 워드 클라우드로 만들어 주목할만한 키워드가 있는지 찾아보려고 한다. 1. 수상내역 페이지 크롤링 - 서울 빅데이터 캠퍼스 누리집의 https://bigdata.seoul.go.kr/noti/selectPageListTabNoti.do?r_id=P260&bbs_seq=&ac_type=A1 해당 링크에서 관련 내용을 찾아볼 수 있다. - 크롤링 코드는 다음의 코드를 사용하면 된다. # 빈 데이.. 2023. 10. 4.
좌표 데이터(.shp) -4 영역 내 좌표 개수 세기 / 해당 좌표 출력하기 * 사담 - 개발자들은 코딩하는 시간보다 생각하고 머리에서 정리하는 시간을 더 많이 사용해야하고, 다수의 소위 성공한 개발자들이 이를 공감하고 있다는 내용을 많이 들었다. 처음에는 이 말의 의미를 제대로 이해하지는 못하고 어렴풋이 생각만 했던 것 같다. - 하지만 이번 글에서 쓰는 코드를 만들기 위해 정말 생각8 : 코딩2 정도의 시간을 할애하면서 위의 말 뜻을 다소 이해할 수 있게 되었다. 우리는 컴퓨터와 일하지 않는다. 파이썬 언어를 사용하지만, 실제로 업무를 진행할 때는 사람과 사람이 "우리 무엇을 합시다(만듭시다)" 논의를 하고, 구현하는 것을 위해 파이썬 등의 컴퓨터 언어를 사용하는 것이다. - 인간의 말 즉 나의 생각, 내가 원하는 바를 파이썬의 언어로 구현하는 것 또한 쉬운 일이 아니었다(그.. 2023. 9. 10.
좌표 데이터(.shp) -3 반경 내 좌표 개수 세기 0. 준비하기 - 필요한 라이브러리를 설치해주고, 각 버스정류장 좌표 / 각 상권 중앙 좌표 / 지하철 역 좌표 데이터를 불러와주자. 1. 좌표계 변환하기 - 이번 반경 내 좌표 찾기에서 기준 좌표가 되는 상권 중앙 좌표값을 다른 좌표들과 함께 맞춰주고 직관적으로 이해하기 쉽게 WGS84 위경도 좌표로 변환해주자 # 좌표 변환 함수 정의 def transform_coordinates(x, y): epsg5181 = pyproj.CRS("EPSG:5181") wgs84 = pyproj.CRS("EPSG:4326") transformer = pyproj.Transformer.from_crs(epsg5181, wgs84, always_xy=True) longitude, latitude = transformer.. 2023. 9. 9.
좌표 데이터(.shp) -2 폴리곤 좌표 데이터를 파이썬에서 활용하는 방법 2023.09.06 - [프로젝트/(가제)편의점 시간대별 매출 분석을 통한 BI 제시-영업시간을 중심으로] - 좌표 데이터(.shp) - 1 폴리곤 좌표를 파이썬으로 가져오기 좌표 데이터(.shp) - 1 폴리곤 좌표를 파이썬으로 가져오기 1. 배경 - 해당 프로젝트 게시글을 꾸준히 보고 계시다면 아시겠지만, 혹시 이 글로 처음보시는 분들을 위해 간단요약 - 프로젝트 진행 중 힘들게 해당 지점의 버스정류장 승하차 인구 데이터를 bmil2011s.tistory.com - 이전 글에서는 좌표 데이터 값을 불러오는 정도와 확인하는 간단한 내용을 학습했고, 이번 글에서는 그래서 이 데이터로 뭘 할 수 있는데? 어떻게 써야하는데?라는 질문에 대한 답의 느낌으로 내용을 써보려고 한다. 1. 기존 데이터 프레임과 합.. 2023. 9. 7.
좌표 데이터(.shp) - 1 폴리곤 좌표를 파이썬으로 가져오기 1. 배경 - 해당 프로젝트 게시글을 꾸준히 보고 계시다면 아시겠지만, 혹시 이 글로 처음보시는 분들을 위해 간단요약 - 프로젝트 진행 중 힘들게 해당 지점의 버스정류장 승하차 인구 데이터를 수집하였는데, 정작 프로젝트 최종 합본 데이터프레임에 매칭시켜줄 방법이 없어 다소 안좋은 상황이었다. - 가장 큰 문제는 상권분석 서비스가 요런 상태라는 것이다 ... - 열심히 철저하게 상권을 분류해주신 덕분에 폴리건이 굉장히 다다다다각형인 상황이다. 그래서 좌표를 일일히 따는 것도 꽤나 어려운 상황이었으며, 상권영역에는 영역데이터이나 X, Y좌표 하나만 제공된 상항 - 역으로 생각해보면 상권분석서비스를 제작했을 때 분명 웹페이지에 폴리건을 그린 어떤 좌표 기준 값들이 데이터화 되어 있었을 것이고, 지금도 여전히 .. 2023. 9. 6.
반응형