본문 바로가기

전체보기

(97)
Python3에서 선형회귀분석을 위한 외부모듈 설치하기 파이썬 3에서 선형 회귀분석을 하기 위해서는 수학, 과학, 공학과 관련된 기능을 모아둔 SciPy, NumPy, Matplotlib을 설치해야 한다. 다음의 각 모듈 홈페이지에서 관련모듈을 다운 받아 설치할 수 있다.SciPy(http://www.scipy.org/)Numpy(http://www.numpy..org/)Matplotlib(http://matplotlib.sourceforge.net/)비공식적으로 Christoph Gohlke라는 프로그래머가 윈도우 환경의 파이썬 사용자를 위해 실행파일(exe)형태에의 바이너리를 개인홈페이지(http://www.lfd.uci.edu/~gohlke/pythonlibs/)에서 제공하고 있다. 이 사이트에서 본인의 환경과 버전에 맞는 Numpy, SciPy, Ma..
[R프로그래밍] R과 RStudio의 설치와 패키지 업데이트 하기 빅데이터 시대입니다. 이제 통계에 대한 기본지식과 분석툴에 대한 사용방법만 알고 있으면 누구나 데이터에서 의미있는 정보를 찾아낼 수 있습니다. 통계분석을 도와주는 도구는 SAS, SPSS, R, Excel의 분석도구와 VBA 등이 주로 사용됩니다. 오픈소스와 쉬운 사용방법으로 R이 통계분석의 표준으로 자리잡아 가고 있습니다. RStudio는 R을 위한 IDE를 제공하는 오픈소스 프로젝트입니다. 직관적인 사용자 인터페이스와 파워풀한 기능으로 R을 이용해 통계분석을 하는 많은 사용들의 컴퓨터에 깔려있습니다. RStudio를 사용하기 위해서는 R이 먼저 설치되어 있어야 합니다. R과 RStudion IDE를 컴퓨터에 설치해 보도록 하겠습니다. R 설치와 업데이트 하기 R 다운로드 R은 Windows, MAC ..
주간 인포그래픽 - 14년 4주차(1/20 ~ 1/26) 국민, 농협, 롯데카드의 개인정보 유출로 시끄러운 한 주였습니다. AI역시 큰 화제가 되었는데요. 금주의 주요인포그래픽을 정리했습니다. "물 대신 커피" 직장인 수분섭취 세계 보건기구의 하루 물 섭취 권장량은 성인기준 1.6L에서 2L라고 합니다. 하지만 실제 마시는 물의 양은 1L에 불과합니다. 대신 커피를 마시는 데요. 커피는 수분이지만 카페인을 함유하고 있어 탈수현상을 심화시킨다고 합니다. 수분섭취오 관련한 통계를 위키트리에서 인포그래픽으로 정리했습니다. Web Design Industry Analysis webydo.com의 인포그래픽에 따르면, 전 세계 웹사이트는 7억8천5백만개, 매월 16백만개의 웹사이트가 새로 생겨납니다. 이중 74%가 전문가 집단에 의해 만들어지고 단 3%만이 아마추어에 ..
투자자들이 유의해야할 복리의 마술과 진짜 마술 오마하의 현인'이라 불리는 세계 최고의 투자가 워렌 버핏(Warren Edward Buffett, 1930년 8월 30일 ~)은 11살에 처음으로 주식투자를 시작했습니다. 컬럼비아 대학에서 공부를 마치고 26세가 된 1956년 고향인 네브라스카주 오마하로 귀향해 본격적인 주식투자를 시작한 이후로 매년 24%이상의 수익을 올렸습니다. 단 한 해도 마이너스 수익률을 기록한 적이 없습니다. 버크셔 헤서웨이를 인수한 1964년 이후 달성한 누적수익률은 58만6817%에 이릅니다. 이것이 그를 '위대한 투자가'로 만든 이유입니다. 이렇듯 복리는 힘이 셉니다. 천재의 고유명사가 되어버린 아인슈타인은 복리를 두고 '세계 8대 불가사의'라고 경외했을 정도입니다. 1626년 맨허튼을 단돈 24달러에 팔아버린 맨허튼 인디..
평균의 함정과 올바른 평균의 계산방법 기술통계(descriptive statistics)는 데이터를 이해하기 쉽게 요약하는 통계방법론의 한 범주입니다. 크게 데이터의 중심적인 경향을 나타내는 중심경향성(central tendency), 퍼져있는 정도를 나타내는 산포(dispersion), 데이터의 분포형태와 대칭정도를 설명하는 분포(distribution), 데이터를 크기 순으로 배열해 100등분하였을 때 각 등분점인 백분위수(percentile) 등으로 나눕니다. 우리가 잘 알고 있다고 생각하는 대표적인 통계량 '평균(mean)'에 대해 알아보겠습니다. 읽기 전에 추천 한 번! 블로거에겐 큰 힘입니다 지난 포스팅에서 100대 기업 등기임원의 (산술)평균연봉에 대해 이야기 했습니다. 눈치가 빠르신 분들은 알아차리셨겠지만 평균에는 함정이 있습..
잘 나가는 임원들은 왜 그렇게 돈을 많이 받을까? 최근에 읽은 두 개의 칼럼이 여러가지 생각을 하게 만들었습니다. 동아일보 소비자경제부 김용석 차장의 '사장님 월급, 얼마면 됩니까'와 에세이스트라는 필명으로 김준이라는 회사원이 조선비즈에 기고한 '엑셀의 '엑'字도 모르는 J과장… 후배가 만든 보고서로 부장 총애 독차지' 입니다. 자본시장법 개정안이 국회를 통과함에 따라 이제 연봉 5억원 이상의 등기임원은 연봉을 공개해야 합니다. 12월 결산법인의 사업보고서 제출이 끝나는 3월 말이면 확인이 가능합니다. 지금은 등기임원의 인원수와 총보수액만 공개하고 있습니다. 문득 이런 생각이 들었습니다. 우리나라 100대 기업의 등기임원 연봉은 일반직원에 비해서 얼마나 많을까? 100대 기업 등기임원, 직원에 비해 평균 17.5배 많아 한국경제매거진에서 공개한 '201..
[R프로그래밍] R을 계산기로 사용하는 방법 읽기 전 클릭↑ 한 번! 블로거에겐 큰 힘입니다 R은 뉴질랜 오클랜드 대학의 로스이하카(Ross Ihaka)와 로버트 젠틀맨(Robert Gentleman)에 의해 시작된 통계계산과 그래픽을 위한 프로그래밍 언어입니다. GNU GPL을 따르고 있어 누구나 자유롭게 사용할 수 있고, 윈도우, 리눅스, OS X등 멀티 플랫폼에서 소스코드의 변형없이 재사용이 가능해 통계연구에 널리 쓰입니다. R은 프로그래밍 언어로써의 통계계산과 패키지 개발 용도 외에도 다양한 계산이 용이하고 탁월한 성능을 발휘합니다. 여기서는 R을 계산기로 사용하는 방법에 대해 이야기 합니다. 연산자, 연산의 우선순위와 데이터 할당 계산기는 다양합니다. 사칙연산, 간단한 무리수의 계산, 메모리기능을 가지고 있는 일명 쌀집계산기에서 부터 화폐..
빅데이터, 사용자에서 시작하자 '21세기의 원유'로 불리는 빅데이터가 크게 화두가 된지 채 1년이 되지 않습니다. 하지만 올해 IT분야를 관통할 핵심단어임을 부인하는 사람은 없습니다. 민간, 공공, 학계 구분없이 빅데이터에 대한 관심을 크게 내비치고 있습니다. 삼성전자가 "소비자의 생각을 읽겠다"며 지난 정기 조직개편시 미디어솔루션센터 산하에 빅데이터 센터를 신설하겠다고 밝혔고, 현대자동차 역시 차량의 품질과 서비스 향상을 위해 빅데이터 사업을 본격화하기로 했습니다. 공공부문 역시 빅데이터를 창조경제 및 정부 3.0의 핵심동력으로 육성하기로 하며 빅데이터 산업 발전전략을 발표했습니다. 학계는 서울대 빅데이터 센터 등을 중심으로 빅데이터에 대한 연구를 활발히 진행하고 있습니다. 초점은 기술에 맞춰져 있습니다. 빅데이터는 수억건에서 수백..