본문 바로가기

IPython

(3)
데이터 분석을 위한 파이썬 필수라이브러리 데이터 분석을 위해서는 분석할 문제를 정의하는 단계에서 분석결과를 보고하는 단계까지 여러단계가 이루어진다고 포스팅했습니다. 이 중 첫 4단계는 컴퓨터의 도움없이 연필과 종이로 충분히 할 수 있습니다. 하지만, 실제 데이터를 수집하고, 가공해서, 보여주는 단계에 이르면 수작업만으로는 한계가 있습니다. 파이썬은 데이터 분석을 위한 다양한 라이브러리를 제공합니다. 데이터를 수집하고, 가공하고, 시각화하는 데 필수적인 파이썬 라이브러리를 소개하도록 하겠습니다. 데이터 수집 - Beautiful Soup Beautiful Soup 라이브러리는 강력한 HTML 파싱 라이브러리입니다. 우리가 분석을 위해 수집하는 데이터의 대부분은 웹 상에 존재합니다. 웹페이지는 태그가 포함된 HTML파일을 브라우저가 해석해 우리에게..
빅데이터 분석을 위한 필수 분석도구 OS를 XP에서 윈도우7로 새로 설치했습니다. 항상 느끼는 거지만 OS를 새로 설치하고 기존에 사용하던 프로그램을 새로 설치하는 것은 상당한 작업량입니다. 데이터 수집, 가공, 분석, 그리고 시각화를 위해서는 많은 프로그램들이 필요합니다. 데이터 분석을 위한 도구들을 정리해 보기로 마음 먹었습니다. 그 도구들을 소개합니다. Microsoft Office 프로그램 숫자를 다룬다면 Excel 너무나 유명한 스프레드시트 프로그램입니다. 회사에서든 집에서는 숫자를 다루는 대부분의 작업을 엑셀로 합니다. 엑셀을 워드프로세스로 사용하는 것도 좋습니다. 엑셀도 다양한 함수와 VBA라는 프로그래밍 언어를 제공하고 있어 왠만한 데이터 분석은 엑셀만 이용하면 충분합니다. 스프레드시트 프로그램은 셀에 데이터를 입력하는 데 ..
IPython Qtconsole과 Notebook 설정하기 파이썬을 처음 설치하고 IDLE을 실행하면 콘솔형태로 파이썬 코드를 작성하고 실행 할 수 있습니다. 그런데 기본적으로 제공하는 편집기를 사용하다 보면 불편함이 많습니다. 그래서 나에게 맞는 개발환경 구축을 위해 여러 방편들을 찾기 시작하게 됩니다. Eclipse에서 Pydev를 사용하기도 했고, Wing IDE라고 하는 파이썬에 최적화된 IDE를 사용하기도 했습니다. 그러나 이제는 IPython의 Qt Console과 Notebook에 정착했습니다. 가볍고, 편하고, 강력하기 때문입니다. Python을 활용한 Data분석을 위해서는 최고의 도구라고 생각합니다. IPython에 대한 자세한 내용은 ipython.org에서 확인할 수 있습니다. 여기서는 IPython을 처음 설치한 후 필요한 몇가지 설정사항..