지난 포스팅에서 R과 RStudio를 설치했습니다. 이제 RStudio를 이용해서 프로젝트를 생성해 보겠습니다.



읽기 전에 추천 한 번!

블로거에겐 큰 힘입니다

RStudio 기본 패널

RStudio창은 기본적으로 4개의 패널로 구분됩니다. 소스편집기와 데이터뷰/R콘솔/작업환경과 히스토리/파일, 플롯, 패키지, 도움말이 그것입니다. 



 각 패널은 단축키를 가지고 있습니다. 단축키는 의 조합으로 사용할 수 있습니다.



또한, 메뉴의 Tools-Global Options-Panel Layout을 실행하면 각 섹션의 순서와 내용을 변경할 수도 있습니다.



프로젝트 생성하기

프로젝트를 생성해 보도록 하겠습니다. 지난 포스팅에서 사용했던 전자공시시스템의 평균급여 파일을 분석하기 위한 프로젝트를 생성하겠습니다. 메뉴모음에서 File-New Project를 클릭하면 New Project창이 뜹니다. 



여기서 New Project를 선택하고 Project Type에서 Empty Project를 선택합니다.



Create New Project 탭의 Create project as subdirector of:에서 Browse를 클릭하여 프로젝트를 생성할 디렉토리를 선택하고, Directory name:에서 생성할 디렉토리를 입력한 다음 하단의 Create Project 버튼을 클릭합니다. 



여기서는 salary라는 이름으로 생성했습니다.

이제 프로젝트가 생성되었습니다. 작업을 위한 기본구성은 완료된 것입니다.

데이터 불러오기

R에서의 데이터 분석작업은 기본적으로 3가지로 이루어집니다. 데이터를 불러온다. 불러온 데이터를 통해 통계량을 구한다. 불러온 데이터를 플로팅한다. 아무리 큰 데이터세트(Dataset)를 다룬다고 해도 기본적인 작업은 이와 크게 다르지 않습니다.


R에서는 다양한 방식으로 데이터를 읽어들일 수 있습니다. 벡터나 행렬로 직접 데이터 프레임을 작성할 수도 있고, 텍스트, CSV, 엑셀, 액세스를 통해 데이터를 읽어 들일 수도 있습니다. MySQL과 같은 데이터베이스에서 읽어 들이는 것도 가능합니다. 우선 CSV를 통해 데이터를 불러와 보겠습니다.


엑셀파일에서 데이터세트가 들어있는 시트를 CSV파일로 저장합니다. 엑셀에서 저장시 파일형식(T)을 CSV(쉼표로 분리)로 바꾸고 저장하면 됩니다.


salary.csv



이제 저장한 파일을 불러오겠습니다. 콘솔창에 아래와 같이 입력합니다.

salary <- read.csv("D:/project/programming/r/salary/salary.csv")

데이터를 불러왔습니다. 



새로운 포스팅을 통해 이 데이터로 여러가지 작업을 해보도록 하겠습니다.

댓글을 달아 주세요

  1. 강군

    안녕하세요. 블로그 보고 배우는 R 프로그래밍 새내기 입니다!
    혹시.. 제가 데이터를 구하기 힘들어서 그런데.
    전자공시시스템의 평균 급여 파일을 구할 수 있는 방법이 있을까요?

    2014.08.01 18:35 신고 Address Modify/Delete Reply
  2. 기미

    유익한 포스팅 잘 보고 있습니다.
    전자공시 시스템 평균 급여 파일은 어떻게 구하는지요?

    2016.03.09 14:00 신고 Address Modify/Delete Reply