R 산점도


산점도

Plot 장 에서 plot()함수가 서로에 대해 숫자를 표시하는 데 사용 된다는 것을 배웠습니다 .

"산점도"는 두 수치 변수 간의 관계를 표시하는 데 사용되는 플롯 유형이며 각 관찰에 대해 하나의 점을 표시합니다.

동일한 길이의 두 벡터가 필요합니다. 하나는 x축(가로)이고 다른 하나는 y축(세로)입니다.

예시

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

결과:

위의 예에서 관찰은 12대의 자동차가 지나가는 결과를 보여야 합니다.

그래프를 처음 보는 사람에게는 명확하지 않을 수 있으므로 산점도를 더 잘 설명하기 위해 헤더와 다른 레이블을 추가해 보겠습니다.

예시

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")

결과:

요약하자면, 위의 예에서 관찰한 것은 12대의 자동차가 지나가는 결과입니다.

x축은 자동차의 수명을 나타냅니다 .

y축은 자동차가 지나갈 때의 속도를 나타냅니다 .

관측치 사이에 관계가 있습니까?

새 차일수록 더 빨리 달리는 것 같지만 결국 12대만 등록했기 때문에 우연의 일치일 수도 있습니다.


플롯 비교

위의 예에서 자동차 속도와 나이 사이에 관계가 있는 것 같지만 다른 날의 관찰도 플로팅하면 어떻게 될까요? 산점도가 우리에게 다른 것을 말해줄까요?

플롯을 다른 플롯과 비교하려면 다음 points()함수 를 사용하십시오.

예시

같은 그림에 두 개의 플롯을 그립니다.

# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

결과:

참고: 비교의 차이를 보려면 col매개변수를 사용하여 플롯에 다른 색상을 지정해야 합니다. 빨간색 은 1일차의 값을 나타내고 파란색cex 은 2일차를 나타냅니다 . 점의 크기를 늘리는 매개변수 도 추가했습니다 .

관찰의 결론: 두 플롯을 비교함으로써, 나는 그들이 우리에게 동일한 결론을 제공한다고 말하는 것이 안전하다고 생각합니다. 새 차는 더 빨리 운전합니다.