본문 바로가기

분석

(8)
분석이란 무엇인가? 분석은 호기심과 관찰에서 시작됩니다. 똑같은 일상을 살고, 똑같은 대상을 보더라도 사람마다 보는 방식이 다릅니다. 경험, 관심, 지식, 관점이 다르기 때문입니다. 한가지는 분명합니다. 삼라만상이 분석의 대상이라는 것입니다. 분석을 나름대로 정의하고 분석을 잘하기 위해 일반적으로 적용가능한 방법들을 정리해 봤습니다. 사진: morebyless 읽기 전에 추천 한 번! 블로거에겐 큰 힘입니다 'Divide and Conquer'. 좋아하는 말입니다. 분석은 대상을 쪼개는 것에서 시작합니다. 분석의 한자도 '나눌 분(分)'자와 '쪼갤 석(析)'자를 씁니다. 나누고 쪼개는 것. 분석 그 자체 입니다. 어떻게 나누느냐가 중요합니다. 나눌 때 지켜야할 몇 가지 원칙이 있습니다. 첫째, 중복이나 누락이 없어야 합니다..
[리뷰] SBS스페셜, '부모 vs 학무보', 1부: 공든탑이 무너진다 한 주를 마무리하는 이벤트가 있습니다. SBS스페셜을 시청하는 것인데요. 신년특집 3부작으로 '부모 vs 학부모'라는 프로그램을 기획했습니다. 치열한 입시경쟁이 사회적인 문제가 된 것은 어제오늘 일이 아닙니다. 이번에는 그 원인이 부모에게 있다는 독특한 시각으로 접근한 점이 흥미롭습니다. 류승룡의 나레이션 역시 훌륭합니다. 학생들이 죽어나가는 사회 한 해 자살하는 학생수가 300명이 넘는다고 합니다. 그 가운데 가장 큰 이유가 학업성적의 문제입니다. 실은 대부분이 상위권이라는 것이 놀랍습니다. 실제 한 자율형 사립고의 학생이 학교생활과 친구관계를 무리없이 잘하다 유서 한 장 없이 스스로 목숨을 끊었습니다. 그 학교의 20~30퍼센트는 서울대나 카이스트에 가고 나머지 대부분은 연고대에 가지만 학생은 상위 ..
2013, 도서구입 분석과 추천도서 한 가지 주제를 정하면 책은 몰아서 읽는 편입니다. 일하는 시간을 제외하면 보통 다른 활동은 다 차치하고 빠지는 편이죠. 올해 역시 몇가지 주제에 빠졌습니다. 빅데이터, 인포그래픽, 파이썬, R프로그래밍, 데이터베이스, 글쓰기 등입니다. 이제 올해도 이틀 밖에 남지 않았습니다. 2013년, 돌이킬 순 없지만 돌아볼 순 있습니다. '나의 2013년을 함께한 책들'을 돌아보겠습니다. 도서 구입목록과 분석상세내역은 첨부파일을 참고하세요. 104권, 40,536페이지, 읽은 책 수와 페이지 올해 104권을 읽었습니다. 총 40,536페이지 입니다. IT 분야의 책이 42권으로 가장 많았습니다. 가장 많이 구매한 출판사는 한빛미디어로 총 14권입니다. IT분야를 전문으로 출판하는 곳이라 당연한 결과입니다. 2권 ..
빅데이터 분석을 위한 필수 분석도구 OS를 XP에서 윈도우7로 새로 설치했습니다. 항상 느끼는 거지만 OS를 새로 설치하고 기존에 사용하던 프로그램을 새로 설치하는 것은 상당한 작업량입니다. 데이터 수집, 가공, 분석, 그리고 시각화를 위해서는 많은 프로그램들이 필요합니다. 데이터 분석을 위한 도구들을 정리해 보기로 마음 먹었습니다. 그 도구들을 소개합니다. Microsoft Office 프로그램 숫자를 다룬다면 Excel 너무나 유명한 스프레드시트 프로그램입니다. 회사에서든 집에서는 숫자를 다루는 대부분의 작업을 엑셀로 합니다. 엑셀을 워드프로세스로 사용하는 것도 좋습니다. 엑셀도 다양한 함수와 VBA라는 프로그래밍 언어를 제공하고 있어 왠만한 데이터 분석은 엑셀만 이용하면 충분합니다. 스프레드시트 프로그램은 셀에 데이터를 입력하는 데 ..
분석, 어떻게 할 것인가? - (5) 데이터 수집하기 우리가 어떤 문제를 분석한다는 것은 대단히 어려운 분석방법을 사용해서 멋진 결과를 도출해야 한다는 것을 의미하는 것은 아닙니다. 단지 주어진 사실들을 면밀히 검토해서 그 속에 숨어있는 진실을 이해하면 되는 것입니다. 정확한 자료를 사실에 기반해서 찾기 여기에서 눈여겨 볼 것은 사실을 기반으로 자료를 수집해야 한다는 것입니다. 사실 요즘은 웹에서 찾을 수 없는 자료는 없는 자료라고해도 무방할 정도입니다. 그만큼 검증되지 않은 자료들도 많습니다. 자료수집은 될 수 있는 한 검증된 원천에 기반하는 것이 좋습니다. 국가 또는 지방자치단체, 민간 연구소, 언론사 등이 대표적인 예입니다. 그리고 인용한 자료들의 원천 데이터를 찾아보는 것 또한 새로운 사실을 확인할 수 있는 좋은 방법입니다. 1차자료와 2차자료 스티..
분석, 어떻게 할 것인가? - (3) 가설 설정하기 "Diagram of the causes of mortality in the army in the East" by Florence Nightingale. -wikipedia 네이버에서 '데이터 과학자' 를 한 번 검색해 보세요. 어떤 사람이 떠오르시나요? 저는 구글의 수석이코노미스트이자 UC버클리의 교수인 할 배리언(Hal Varian, 1947~ )같은 사람이 나올거라고 생각했습니다. 그런데 놀랍게도 지식백과항목에 우리가 알고 있는 어느 간호사의 초상이 나옵니다. 바로 나이팅게일(Florence Nightingale, 1820 ~ 1910)입니다. 나이팅게일은 1854년 크림전쟁의 참상에 자극되어 자원봉사자 38명과 함께 터키로 갔습니다. 그해 겨울 환자의 사망률은 43%에 달했습니다. 당시는 질병의 ..
분석, 어떻게 할 것인가? - (2) 배경지식 쌓기 문제를 정의한 다음 우리가 해야 할 일은 문제와 관련한 배경지식을 쌓는 것입니다. 이 단계에서는 관련된 자료를 최대한 모아 정리하는 것이 매우 중요합니다. 우리가 해결해야 할 문제의 대부분은 이미 해결된 문제일 수도 있습니다. 이미 있는 정보를 활용해야 합니다. 배경지식을 쌓기 위해서는 올바른 정보의 원천을 찾아야 합니다. 사진 :Hash Milhan 키워드 검색을 통한 얼개 그리기 가장 쉬운 방법은 웹에 있는 정보를 활용하는 것입니다. 우선 구글과 네이버 검색엔진을 통해 키워드로 관련 정보를 찾아봅니다. 키워드를 검색 할 때 중요한 점은 찾고자 하는 키워드 뿐만 아니라 유사한 키워드까지 검색해 보는 것, 그리고 키워드를 포함하는 상위 키워드를 검색해 보는 것입니다. 분석과 관련한 검색을 한다고 하면, ..
분석, 어떻게 할 것인가? - (1) 문제 정의하기 매월 결산을 완료하면 이런 질문들이 쏟아집니다. "재료비가 왜 이렇게 높게 나와?", "고정비 10% 줄일려면 어떻게 할거야?" .... 그렇습니다. 사실 분석이란 어쩌면 '왜'라는 질문에서 시작해서 '어떻게'라는 답을 구해가는 과정일지도 모릅니다. 분석을 이렇게 정의 하겠습니다. 분석 : 우리가 해결하고자 하는 문제를 정의하고 효과적이고 의미있는 해결책을 제시하여 분석 정보이용자에게 우리가 의도하는 반응을 이끌어내는 일련의 활동 그리고 이 분석 프로세스를 문제 정의하기, 배경지식 쌓기, 가설 설정하기, 추상화하기, 자료 수집하기, 자료 분석하기, 보고하기의 7단계로 나누어 이야기하려고 합니다. 오늘은 그 첫번째인 문제 정의하기입니다. 발생형, 탐색형, 설정형 문제 분석을 잘하기 위한 첫 단추가 바로 문..