데이터 찾아 삼만리

요 며칠간 나라별로 Government expenditure 를 잘 정리해 놓은 데이터가 있지 않을까 해서 잉여한 웹서핑을 해 보았는데 쓸만한걸 건지지 못했다. 잘 정리되어 있을 것 같은 곳에서는 돈을 내라고 하더라. OECD Stats 에서 COFOG 를 볼 수도 있을 것 같아서 이걸 꺼내오는 쉬운 방법을 찾아보고 있다.

이렇게 잠시나마 삽질을 해보고 나니 백악관이 2016 budget data 를 github 에 공개했다는게 참 대단하게 느껴진다. 이걸 보고 마음을 가다듬고 다른 나라는 일단 포기. 우리나라의 과거 예산안이나 분야별 지출 내역을 먼저 찾아보기로 했다. 기획재정부나 디지털예산회계시스템에서 한글이나(hwp) pdf 문서를 구할 수는 있었다. 하지만 CSV, Excel 등 데이터 을 제공하거나 API 형태의 접근을 지원하는 곳이 없진 않지만거의 없다. 그리고 그나마 있는 데이터도 너무 파편화되어있어서 내가 찾는 데이터를 어디에 가서 찾아야 할 지를 모르고 길을 잃기도 쉬웠다. 정부 웹사이트 여러개가 나에게 전화돌리기를 시전하는 느낌이랄까.

이렇게 공공 데이터는 원칙적으로는 누구나 볼 수 있지만, 대부분 접근성이 썩 좋지 않다. 데이터를 찾으려 검색을 하면서 나보다 먼저 이런 필요성을 느끼고 기술 기반으로 해결을 시도했던 사람들을 발견할 수 있었다.

선구자들의 작업물을 보면서 뭔가 배울 수 있는게 있지 않을까 한다. 그리고 공부를 하다 보면 나도 저런 팀에 뭔가 도움을 줄 수 있을까, 나도 할 수 있는 일이 뭔가 있지 않을까 하는 생각도 좀 해 보았다.

Comments