현재 위치에 pandas.xlsx라는 이름으로 저장된 Excel 파일이 있다고 가정합니다. 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - pd.read_excel 메소드를 정의하여 pandas.xlsx 파일에서 데이터를 읽고 df로 저장 df = pd.read_excel('pandas.xlsx') df.iloc[:,0]을 적용하여 첫 번째 열의 모든 행을 인쇄합니다. df.iloc[:,0] df.iloc[:,-1]을 적용하여 마지막 열의 모든 행을 인쇄합니다. df.iloc[:
pandas.csv 파일을 이미 저장하고 Html 형식으로 파일을 내보낸다고 가정합니다. 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 다음과 같이 read_csv 메소드를 사용하여 csv 파일을 읽으십시오 - df = pd.read_csv('pandas.csv') 파일 객체를 사용하여 쓰기 모드에서 새 파일 pandas.html 생성, f = open('pandas.html','w') 데이터 프레임을 html 파일 형식으로 변환하는 결과 변수 선언,
시계열과 최대 월말 빈도에 대한 결과가 있다고 가정합니다. DataFrame is: Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 Maximum month end frequency: Id
파일에 pandas_sample.json으로 저장된 다음 샘플 json 데이터가 있다고 가정합니다. { "employee": { "name": "emp1", "salary": 50000, "age": 31 } } csv로 변환한 후의 결과, ,employee age,31 name,em
데이터 프레임과 피클 파일로 내보내는 결과가 있다고 가정하고 파일에서 내용을 다음과 같이 읽습니다. Export to pickle file: Read contents from pickle file: Fruits City 0 Apple Shimla 1 Orange Sydney 2 Mango Lucknow 3 Kiwi Wellington 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 데이터 프레임을
계열이 있고 시차 2와의 자기 상관에 대한 결과는 다음과 같다고 가정합니다. 계열은:0 2.01 10.02 3.03 4.04 9.05 10.06 2.07 NaN8 3.0dtype:float64계열 상관 관계:-0.4711538461538461지연이 있는 계열 상관 관계:-0.242805651 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 시리즈 정의 아래 방법을 사용하여 급수 자기상관을 구합니다. series.autocorr() 다음과 같이 lag=2인 자기상관을 계산합니다. series.aut
시계열 데이터가 있는 데이터 프레임이 있고 잘린 데이터의 결과는 다음과 같다고 가정합니다. before truncate: Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 after truncate: Id time_series 1 2 2020-01-12 해결책 이 문
Melt(),stack(),unstack() 및 pivot() 함수를 사용하여 데이터 프레임을 재구성할 수 있습니다. 해결책 1 데이터 프레임을 정의합니다. 용융() 함수를 적용하여 넓은 데이터 프레임 열을 행으로 변환합니다. 아래에 정의되어 있습니다. df.melt() 예시 더 나은 이해를 위해 아래 코드를 봅시다 - 판다를 pddf =pd.DataFrame({Id:[1,2,3],Age:[13,14,13],Mark:[80,90,85]})으로 가져오기 print(데이터 프레임은:\n,df)print(df.melt()
데이터 프레임이 있고 그룹화된 데이터와 해당 열에서 공분산을 계산한 결과가 다음과 같다고 가정합니다. 그룹화된 데이터 공분산:mark1 mark2subjectsmaths mark1 25.0 12.500000 mark2 12.5 108.333333science mark1 28.0 50.000000 mark2 50.0 233.333333grouped 데이터 공분산 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 데이터 프레임 정의 데이터 프레임 주제 열 내부에 groupby 기능 적용 df.groupby(주제
데이터 프레임이 있고 첫 번째 중복 행을 제거한 결과가 다음과 같다고 가정합니다. Id Age 0 1 12 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 데이터 프레임 정의 Id, Age
데이터 프레임이 있고 양수 방향과 음수 방향으로 두 기간의 이동 인덱스가 있다고 가정합니다. shift the index by three periods in positive direction Id Age 2020-01-01 00:00:00 NaN NaN 2020-01-01 12:00:00 NaN NaN 2020-01-02 00:00:00 1.0 10.0 2020-01-02 12:00:00 2.0 1
패널의 첫 번째 열의 최대값에 대한 결과는 첫 번째 열의 최대값은;Column1 1.377292입니다. 해결책 이 문제를 해결하기 위해 다음 접근 방식을 따릅니다 - 사전 키로 데이터 값을 Column1으로 설정하고 값을 pd.DataFrame(np.random.randn(5, 3)) 데이터 ={열1 :pd.DataFrame(np.random.randn(5, 3))} 패널에 데이터를 할당하고 p로 저장 p =pd.Panel(데이터) dict 키 Column1을 사용하여 열 인쇄 인쇄(p[열1]) m
해결책 특정 열의 데이터 프레임과 최소 순위가 있다고 가정합니다. Id Name Age Rank 0 1 Adam 12 1.0 1 2 David 13 3.0 2 3 Michael 14 5.0 3 4 Peter 12 1.0 4 5 William 13 3.0 이 문제를 해결하기 위해 다음 단계를 따릅니다. -
패널이 있고 첫 번째 행의 평균이 다음과 같다고 가정합니다. Average of first row is: Column1 0.274124 dtype: float64 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 사전 키로 데이터 값을 Column1으로 설정하고 값은 pd.DataFrame(np.random.randn(5, 3)) data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))} 패널에 데이터를 할당하고 p로 저장
해결책 데이터 프레임이 있고 행과 열의 평균 절대 편차가 다음과 같다고 가정합니다. mad of columns: Column1 0.938776 Column2 0.600000 dtype: float64 mad of rows: 0 0.500 1 0.900 2 0.650 3 0.900 4 0.750 5 0.575 6 1.325
데이터 프레임이 있고 분포의 모양을 수량화한 결과는 다음과 같다고 가정합니다. 첨도:Column1 -1.526243Column2 1.948382dtype:float64asymmetry 분포 - 왜도:Column1 -0.280389Column2 1.309355dtype:float64 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 데이터 프레임 정의 df.kurt(axis=0)를 적용하여 분포의 모양을 계산합니다. df.kurt(축=0) df.skew(axis=0)를 적용하여 축-0에 대한 편향되지 않
데이터 프레임과 최소 및 최대 임계값의 트림에 대한 결과가 있다고 가정합니다. 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 데이터 프레임 정의 df.clip 함수를 내부(lower=30)에 적용하여 최소 임계값 계산, df.clip(lower=30) 내부에 df.clip 함수를 적용(상단=50)하여 최대 임계값 계산 df.clip(상단=50) 최소 및 최대 임계값 제한이 있는 클리핑된 데이터 프레임 적용, df.clip(lower=30,upper=50) 예시 더 나은 이해를 위해
데이터 프레임이 있고 테이블 방식 함수의 결과는 다음과 같다고 가정합니다. 테이블 와이즈 함수:Id Mark0 6.0 85.01 7.0 95.02 8.0 75.03 9.0 90.04 10.0 95.0 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 데이터 프레임 정의 두 개의 인수를 사용하여 사용자 정의 함수 avg를 만들고 결과를 (a+b/2)로 반환합니다. 아래에 정의되어 있습니다. def avg(a,b):반환(a+b/2) pipe() 함수를 적용하여 첫 번째 값 내에서 avg()로 테이블 단위
Id와 Age 열의 상위 2와 하위 2 값 사이의 백분율 변경에 대한 데이터 프레임 및 결과가 있다고 가정합니다. Id and Age-top 2 values Id Age 0 NaN NaN 1 1.0 0.0 Id and Age-bottom 2 values Id Age 3 0.000000 -0.071429 4 0.666667 0.000000 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다 - 데이터 프레임 정의 슬라이싱 [
데이터 프레임의 모든 열에 있는 요소의 길이에 대한 결과는 다음과 같습니다. Dataframe is: Fruits City 0 Apple Shimla 1 Orange Sydney 2 Mango Lucknow 3 Kiwi Wellington Length of the elements in all columns Fruits City 0 5 6