R 최대 및 최소


최대 최소

이전 장에서 mtcars 데이터 세트를 소개했습니다. 다음 페이지에서 이 데이터 세트를 계속 사용할 것입니다.

R 수학 장에서 R에 몇 가지 내장 수학 함수가 있다는 것을 배웠습니다 . 예를 들어 min()max()함수를 사용하여 집합에서 가장 낮거나 높은 값을 찾을 수 있습니다.

예시

hp변수 (마력) 의 가장 큰 값과 가장 작은 값을 찾습니다 .

Data_Cars <- mtcars

max(Data_Cars$hp)
min(Data_Cars$hp)

결과:

[1] 335
[1] 52

이제 우리는 세트에서 가장 큰 마력 값이 335 이고 가장 낮은 마력 값이 52 라는 것을 압니다 .

데이터 세트를 살펴보고 이 두 값이 어느 차에 속하는지 알아낼 수 있습니다.

자동차 관찰

                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2

표를 보면 가장 큰 hp 값이 Maserati Bora에 속하고 가장 낮은 hp 값이 Honda Civic에 속하는 것처럼 보입니다.

그러나 R이 우리를 위해 이것을 찾도록 하는 것이 훨씬 쉽고 안전합니다.

예를 들어, which.max()which.min()함수를 사용하여 테이블에서 최대값과 최소값의 인덱스 위치를 찾을 수 있습니다.

예시

Data_Cars <- mtcars

which.max(Data_Cars$hp)
which.min(Data_Cars$hp)

결과:

[1] 31
[1] 19

또는 더 나은 방법 으로 와 which.max()기능 을 결합 하여 가장 큰 마력과 가장 작은 마력을 가진 자동차의 이름을 얻을 수 있습니다.which.min()rownames()

예시

Data_Cars <- mtcars

rownames(Data_Cars)[which.max(Data_Cars$hp)]
rownames(Data_Cars)[which.min(Data_Cars$hp)]

결과:

[1] "Maserati Bora"
[1] "Honda Civic"

이제 우리는 확실히 알고 있습니다.
마세라티 보라 가 가장 높은 마력을 가진 차이고 혼다 시빅 이 가장 낮은 마력을 가진 차입니다.


이상치

최대값과 최소값을 사용하여 이상값 을 감지할 수도 있습니다 . 이상치는 나머지 관측치와 다른 데이터 포인트입니다.

mtcars 데이터 세트 에서 이상값일 수 있는 데이터 포인트의 예 :

  • 자동차의 최대 전진 기어가 11인 경우
  • 자동차의 최소 마력이 0인 경우
  • 자동차의 최대 중량이 50,000파운드인 경우