Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

모든 기술 통계와 함께 R 데이터 프레임의 통계 요약을 찾는 방법은 무엇입니까?

<시간/>

R 데이터 프레임의 통계적 요약을 찾을 때 최소값, 1사분위수, 중앙값, 평균, 3사분위수 및 최대값만 얻지만 설명에서는 분산, 표준 편차, 왜도, 첨도와 같은 다른 유용한 측정값이 많이 있습니다. , 등등. 따라서 fBasics 패키지의 basicStats 기능을 이 용도로 사용할 수 있습니다.

fBasics 패키지 로드 중 -

라이브러리(fBasics)

기본 R의 mtcars 데이터를 고려하십시오 -

데이터(mtcars)head(mtcars,20)

출력

 MPG Cyl Disp HP DRAT WT QSEC VS AM GEAR CARBMAZDA RX4 21.0 6 160.0 110 3.90 6 160.0 110 3.90 6 160.0 110 3.90 2.620 16.46 0 1 4 4MAZDA RX4 WAG 21.0 6 160.0 110 3.90 2.86.0 110 3.90 2.875 17.02 0 1 4 4 4 Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1hornet 4 drive 21.4 6 3.215 19.44 1 0 3 1 시간 175 0 0 3 2valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1duster 360 14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4merc 240D 24.4 3.190 20.00 1 0 4 2merc 230 22.92 3 0 4 2merc 230 230 1 0 4 2merc 280 19.92 3 0 4 2merc 280 19.92 3 0 4 2merc 280 19.92 3.440 18.30 1 0 4 4merc 280c 17.8 6 167.6 123 3.92 3.440 18.90 1 0 4 4merc 450SE 16.4 8 275.8 180 3.07 4.070 17.40 0 0 3 3Merc 450SL 17.3 8 275.8 180 3.07 3.730 17.60 0 0 3 3.780 18.00 0 0 3 3 3CADillac Fleetwood 10.4 8 472.0 205 2.93 5.250 17.98 0 0 3 4Lincoln Continental 10.4 8 460.0 215 3.00 5.424 17.82 0 0 3 4Chrysler Imperial 14.7 8 440.0 230 3.23 5.345 17.42 0 0 0 
 mtcars 데이터 세트의 통계 요약 찾기 -

>기본 통계(mtcars)
 MPG CYL DISP HP dratnobs 32.000000 32.000000 32.000000 32.000000 0.000000 0.000000 0.000000 32.000000NAs 0.000000Minimum 0.000000 10.400000 4.000000 71.100000 52.000000 33.900000 8.000000 2.760000Maximum 472.000000 335.000000 4.930000 4.000000 15.425000 1.Quartile 120.825000 3.080000 96.500000 8.000000 22.800000 3.Quartile 326.000000 6.187500 20.090625 180.000000 3.920000Mean 230.721875 6.000000 19.200000 146.687500 3.596563Median 196.300000 123.000000 3.695000Sum 642.900000 198.000000 7383.100000 4694.000000 115.090000SE 평균 1.065424 0.315709 21.909473 12.120317 17.917679 5.543607 0.094519 LCLMean 186.037211 121.967950 3.403790 6.831393 22.263571 UCLMean 275.406539 3.189516 36.324103 171.407050 3.789335Variance 15360.799829 4700.866935 0.285881Stdev 6.026948 1.785922 68.562868 0.534679Skewness 123.938694 0.610655 -0.174612 0.381657 0.726024 0.265904첨도 -0.372766 -1.762120 -1.207212 -0.135551 -0.714701


 중량 qsec 오전 GEA 연구는 0.000000 0.000000 0.000000 0.000000 0.000000 1.513000 14.500000 0.000000Minimum 0.000000 0.000000 3.000000 5.424000 22.900000 1.000000Maximum 1.000000 1.000000 5.000000 8.000000 2.581250 16.892500 1.Quartile 0.000000 0.000000 3.000000 2.000000 3.610000 32.000000 3.Quartile 32.000000 32.000000 32.000000 32.000000 32.000000NAs을 carbnobs 대 18.900000 1.000000 1.000000 4.000000 3.217250 17.848750 4.000000Mean 0.437500 0.406250 3.687500 3.325000 17.710000 2.812500Median 0.000000 0.000000 4.000000 2.000000Sum 102.952000 571.160000 14.000000 13.000000 118.000000 90.000000SE 평균 0.172968 0.315890 0.089098 0.088210 0.130427 2.864478 17.204488 0.285530LCL 평균 0.255783 0.226345 3.421493 3.570022 18.493012 2.230158UCL 평균 0.619217 0.586155 3.953507 3.394842 분산 0.254032 0.248992 0.544355 2.608871stdev 0.978457 1.786943 1.786943 0.504016 0.498991 0.737804 1.615200Skewness 0.423146 0.369045 0.240258 0.240258 0.364016 0.364016 0.528854 1.050874첨도 -0.022711 0.335114 -2.001938 -1.924741 -1.069751 1.257043

기본 R에서 나무 데이터와 압력 데이터를 사용하는 두 가지 예를 더 살펴보겠습니다.

나무 데이터 예 -

데이터(나무)머리(나무,20)

출력

 Girth Height Volume1 8.017.0 81 18.911 11.3 79 24.911 11.3 76 24.911 11.3 76 22.911 11.4 76 21.013 11.4 76 21.414 11.7 69 21.315 12.0 75 19.116 12.9 74 22.217 12.9 85 33.818 13.3 86 27.419 13.7 71 25.720 13.8 64 24.9


<최대 20.600000 87.000000 77.000000 1 분위수 11.050000 72.000000 19.400000 3.Quartile 15.250000 80.000000 37.300000 평균 13.248387 76.000000 30.170968 중간 12.900000 76.000000 24.200000 합계 410.700000 2356.000000 935.300000에게 둘레의 높이가 31.000000 31.000000 31.000000의 NA 0.000000 0.000000 0.000000Minimum 8.300000 63.000000 10.200000을 Volumenobs>> basicStats (나무) 사전 SE 평균 0.563626 1.144411 12.097309 2.952324LCL 평균 73.662800 24.141517 14.399466 78.337200 UCL 평균 차이 36.200418 9.847914 40.600000 270.202796 3.138139 6.371813 16.437846 STDEV 비대칭 0.501056 1.013274 -0.356877 -0.710941 -0.723368 0.246039 첨도

압력 데이터 예 -

데이터(압력)헤드(압력,20)

출력

 온도 압력 1 0 0.00022 20 0.00040 0.03005 80 0.03005 80 0.03005 80 0.03005 80 0.03005 80 0.27006 8.03005 80 0.03008 1.85009 17.85008 8.85006 1.85009 17.85008 8.85009 17.85007 8.85009 1800017.85008 8.85009 220 0.200010 180 1.85007 8.800011 220 0.200010 178.850018.800011 220 96.000014 260 96.000015 280 96.000015 280 157.000015 280 157.000016 300 247.000016 300 320 376.000018 340 558.000019 360 806.0000 


basicStats(압력)온도 압력nobs 19.000000 19.000000NAs 0.000000 0.000000최소 0.000000 0.000200최대 360.000000 006.000 사분위수 90.000000 0.1800003. 분위 270.000000 126.500000Mean 180.000000 124.336705Median 180.000000 8.800000Sum 3420.000000 2362.397400SE 평균 25.819889 51.531945LCL 평균 125.754426 16.072107UCL 평균 234.245574 232.601304 차이 12666.666667 50455.285428 STDEV 224.622540Skewness 112.546287 0.000000 2.334429 -1.390471 1.835588Kurtosis