R Fundamentals

Fundamentals of Corpus Knowledge

  • MOST IMPORTANT: 자기주도 학습, 관찰과 질문

환경설정

  • Download R
  • IDE

  • PATH에 추가
    1) R 우클릭 > 속성 > 고급
    2) “관리자 권한으로 실행” 설정해 두기

R기초

  • R은 통계분석을 위해 통계학자가 제작함
  • R의 출력결과는 Vector 형식임
    • ex) 입력: 2 + 2 출력: [1] 4
  • R의 시작값은 1이다 (타 언어 = 0 )
  • R은 enter을 쳐도 식이 제대로 완성될 때까지 값을 출력하지 않음 (input을 계속 받으려고 함)
    • example)

      cmdnotend

  • 한줄에 여러 명령 가능 ;로 분활
    • 답은 따로 나옴 (다른 줄로)
  • # 주석, comment
산술 연산자
2 + 2      # [1] 4
2 - 1      # [1] 1
2 * 2      # [1] 4
4 / 2      # [1] 2
5 %/% 2    # [1] 2 (몫)
5 %% 2     # [1] 1 (나머지)
(3+2) ^ 2  # [1] 125 (거듭제곱)
변수명

영문자로 시작할 시 숫자, 마침표 가능. case sensitive

    x <- 3
    x <- x + 2
Data Types (자료형)
class(TRUE)     # [1] "logical" (all capitalized)
class(F)        # [1] "logical"
class(12.3)     # [1] "numeric"
class(12)       # [1] "numeric"
class(12L)      # [1] "integer" (12로 출력됨)
class(3+2i)     # [1] "complex"
class('a')      # [1] "character"
class("TRUE")   # [1] "character"
  • 변환 방법: as.numeric(12L) => numeric으로 변함

Data Structure (데이터, 자료 구조)

  • 기본: vector
  • 데이터구조 당 한 종류의 자료형만 가능
    • 다른 데이터 추가 시 기존 자료형으로 자동 변환됨
  • 벡터 생성 : a <- c( 'red', 'green', 'yellow' )
    • c : combine
    • > class(a) : [1] “character”
    • > str(a) : chr [1:3] “red”, “green”, “yellow” (벡터X)
  • Factor : (통계에서의 명목 척도)
    • 척도: 숫자로 변환되어 있음
    • f <- factor(c (‘….’))
  • Data Frame :
    • g <- data.frame( gender = c(“…”), name = c(“…”))
    • table처럼 나옴
    • 인용보어 없음 (“”)
    • 각 column마다 datatype 같아야 함
    • column 명 = variable
    • dim(g)로 dimension 확인 가능