[R Project] 전국 초,중,고 공립,사립,국립 학교 현황

지난 학기에 기회가 생겨 교양으로 빅데이터 과목을 신청하게 됐어.빅데이터 쪽에 관심을 가지고 보고 있었고, 딥러닝에 대한 프로젝트를 진행하기 위해서는 빅데이터도 알아야 한다고 소견했기 때문이다. 요즘은 백엔드 개발로 길을 바꿔서 공부중인데, 그래도 딥러닝은 계속할 의도) 이 과목은 프로젝트에서 진행하게 됐고, 문과생을 대상으로 한 과목이기 때문에 수학적인 지식을 배제하고 진행됐다.즉, 웬만한 프로그래밍 기본 코드 한 후, R언어 라이브러리를 활용하여 데이터 가공해서 시간화해 주는 정도?이 수업을 들으면서 R언어로 웹스크래핑도 하고, 샤이니, 지도를 이용한 데이터시간화 등을 해 본 것 같았다.그 후 배운 스토리로 프로젝트를 진행해야 하는데, 정직하게 배운 기능은 검색하면서 하면 바로 하기 때문에 주제를 정하는 데 많은 시간이 걸렸다.아마 2주 전까지 생각하고 있었나 봐.그리고 다른 학생들은 대부분 웹스크래핑을 해서 쉽게 시간화할 수 있을 것 같아서 과인은 빅데이터 과목답게 공공데이터포털에 실린 데이터를 통해 데이터를 시간화해 보는 것이 좋겠다는 소견이 있어 그쪽으로 선회했어.근데 주제가 생각이 안 나서. 진짜 답답하고… 미칠 지경이었다.그래서 친한 친구에게 질문을 하고 “너희에게 있다면 필요하고 유용한 것은 어떤 것이냐!!” 물어봤는데.. 친구들도 소견이 잘 없는 것 같더라구요.이때 교육학을 전공하는 친구가 “전국 초중고교의 공립, 사립, 국립의 개교 현황을 지도에 표시해 달라!!”고 한다.그래서 바로 이걸로 가자는 소견으로 작업을 하게 됐습니다R언어. 이번 과목에서 처음 써봤는데 솔직히 내용을 말하자면 내 스타일이 아니라고 소견이 되더군.뭔가 언어자체는 쉽지만 문법이 제대로 갖춰지지 않은 느낌일까?C언어, Java, Python처럼 문법이 정돈되어 있다는 느낌이 들지 않았다.그래서 당황스러웠던 기억이 있다.프로젝트에 필요했던 기본 데이터는 이후 홈페이지에 CSV 파일에서 다운로드 됐어.www.data.go.kr/dataset/15021148/standard.do

그 후 R언어로 데이터를 가공하는 소견을 했는데, 가공하는 과정이 때때로 많이 걸리기도 하고, 내가 유용한 툴로 데이터를 가공하고 싶어서 엑셀을 통해 향후와 같이 데이터를 가공했어.

>

옛날에 엑셀을 지겹게 한 것이 이렇게 도움이 될 줄이야!! OFFSET 함수와 이름정의 COUNTA 함수, COUNTIFS 함수를 사용했기 때문에 사용법은 도움말 스토리 참고 프로젝트에 사용한 라이브러리를 설명하면 data.tableデータを데이터를 테이블 형태로 하기 위해 공급 gplot2データを데이터를 차트로 가끔화 leaflet← (구글 지도 사용하고 싶었지만, 구글이 정책이 바뀌면서 조금 복잡해진다..) dev tools←github에 라이브러리를 가져올 때 사용하면서 행정구역획/Komoogood/Komingood/Komingood가 되어버리다. 그래서 다음이 괌인, 네이버 지도를 하는 소견을 했지만 이 역시 꽤 복잡하고 쉽지 않았다.그래서 11번째 구글링 중에 leaflet 이라는 라이브러리가 있어서 이것을 사용했는데, 제가 소견한대로 데이터가 과잉이라 만족했습니다.

>

그 후와 같이 CSV 파일을 R언어로 가져와서

>

지상코드도 가져오고

>

초·중·고별 국·공립·사립 데이터 가공, 일단 공립 초등학교 수만 표시

>

각 지역 초·중·고등학교의 국·사립·공립 데이터 표시

>

샤이니를 통해 전국 초·중·고등학교의 개교현황 표시를 위한 샤이니를 처음 시도했지만 샤이니에 관련 자료가 별로 없어서 사용하기에 조금 복잡하다고 생각했다.쓰면서 느낀 점은 정말 엑셀 동적 차트가 굉장히 자신감이 편하다는 것을 느꼈다.데이터 가공하는 것도 엑셀이 편하고, 옛날부터 Excel만 써 왔기 때문인지는 모르겠지만.R언어로 데이터 가공을 해서 시간화하는 것도 있을 것 같아서 좋지만… 활용은 엑셀을 따라가려면 아직 멀었다고 생각을 해.그래도 장점이 있다면 큰 데이터의 경우는 엑셀보다 작업속도가 빠르고, 비전공자도 프로그래밍을 배우면서 내가 직접 데이터를 시간화할 수 있는 것은 장점이라고 생각해.

앞으로의 프로젝트는 GitHub에 올렸으니 참고 부탁할께.