입력 - DataFrame이 있고 지정에 따라 레코드를 그룹화한다고 가정합니다. - Designation architect 1 programmer 2 scientist 2 해결책 이를 해결하기 위해 다음과 같은 접근 방식을 따릅니다. DataFrame 정의 Designation 컬럼에 groupby 방식을 적용하고 아래와 같이 개수를 계산한다. df.groupby(['Designation']).count() 예 더 나은 이해를 위해 다음 구
입력 - 계열 및 기본 부동 분위수가 있다고 가정합니다. value is 3.0 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 시리즈 정의 분위수 기본값 .5를 계열에 할당하고 결과를 계산합니다. 아래에 정의되어 있습니다. data.quantile(.5) 예시 더 나은 이해를 위해 전체 구현을 살펴보겠습니다. − import pandas as pd l = [10,20,30,40,50] data = pd.Series(l) print(data.quantile(.5)) 출력 30.0
입력 - DataFrame이 있고 첫 번째 열을 이동하고 누락된 값을 채우는 결과는 다음과 같다고 가정합니다. one two three 0 1 10 100 1 2 20 200 2 3 30 300 enter the value 15 one two three 0 15 1 10 1 15 2 20 2 15 3 30 해결책 이를 해결하기 위해 다음과 같은 접근 방식을 따릅니다. DataFrame 정의
입력 - DataFrame이 있고 인덱스와 열의 전치 결과는 다음과 같다고 가정합니다. Transposed DataFrame is 0 1 0 1 4 1 2 5 2 3 6 해결책 1 DataFrame 정의 중첩 목록 이해를 설정하여 2차원 목록 데이터의 각 요소를 반복하고 결과에 저장합니다. result = [[data[i][j] for i in range(len(data))] for j in range(len(data[0])) 결과를 DataFrame으로 변환, df2 = pd.DataFrame
부울 연산에 대한 시리즈와 결과가 있다고 가정합니다. 그리고 연산 is:0 True1 True2 Falsedtype:boolOr 연산 is:0 True1 True2 Truedtype:boolXor 연산 is:0 False1 False2 Truedtype:bool 해결책 이를 해결하기 위해 다음과 같은 접근 방식을 따릅니다. 시리즈 정의 부울 및 nan 값으로 시리즈 생성 아래에 정의된 시리즈의 각 요소에 대해 비트 및 연산에 대해 boolean True 수행, series_and =pd.Series([True,
학생 기록이 있는 sqlite3 데이터베이스가 있고 모든 데이터를 읽은 결과는 다음과 같다고 가정합니다. Id Name 0 1 stud1 1 2 stud2 2 3 stud3 3 4 stud4 4 5 stud5 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 새 연결을 정의합니다. 아래에 나와 있습니다. con = sqlite3.connect("db.sqlite3") 아래 함수를 사용하여 데이터베이스에서 SQL 데이터 읽기, pd.read_sql_query() 연결이
데이터 프레임이 있다고 가정합니다. one two three 0 12 13 5 1 10 6 4 2 16 18 20 3 11 15 58 새 행과 열에 최소값을 저장한 결과는 -입니다. Add new column to store min value one two three min_value 0 12 13 5 5 1 10 6 4 4 2 16 &nbs
데이터 프레임이 있다고 가정합니다. 0 1 2 0 10 20 30 1 40 50 60 2 70 80 90 데이터 프레임의 대각선으로 1을 대체한 결과는 -입니다. 0 1 2 0 1 20 30 1 40 1 60 2 70 80 1 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 데이터 프레임 정의 모든 행과 열에 액세스하기 위해 중첩 for 루프 생성, for i in range(len(df)): for j in range(len(df)): 대각선과 일치하는 조건을 확인하고 일
데이터 프레임이 있다고 가정합니다. col1 col2 0 o e 1 e e 2 i u 3 e o 4 i i 5 u o 6 e a 7 u o 8 a u 9 e a 일치하는 인덱스 및 개수에 대한 결과는 다음과 같습니다. index is col1 col2 1 e  
두 개의 데이터 프레임이 있다고 가정합니다. first dataframe is id country 0 1 India 1 2 UK 2 3 US 3 4 China second dataframe is id City 0 1 Chennai 1 11 Cambridge 2 22 Chicago 3 4 Chengdu 동일한 열을 기준으로 병합한 결과는 다음과 같습니다. Merging data based on same column - id id country City
데이터 프레임이 있다고 가정합니다. DataFrame은 다음과 같습니다. id 표시 age0 1 70 121 2 60 132 3 40 123 4 50 134 5 80 125 6 90 136 7 60 12 임의의 홀수 인덱스 행을 선택한 결과는 다음과 같습니다. 임의의 홀수 인덱스 행:id 4mark 50age 13 해결책 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 데이터 프레임 정의 홀수 인덱스 값을 추가하려면 빈 목록 만들기 모든 인덱스에 액세스하려면 for 루프를 만듭니다. 아래에 정의되어 있습니다.
다음 시리즈가 있다고 가정합니다. Series is: 0 1 1 22 2 3 3 4 4 22 5 5 6 22 가장 많이 반복되는 요소의 결과는 다음과 같습니다. Repeated element is: 22 해결책 이 문제를 해결하기 위해 다음과 같은 접근 방식을 따릅니다. 시리즈 정의 초기 개수를 0으로 설정하고 max_count 값을 시리즈 첫 번째 요소 값
데이터 프레임이 있다고 가정합니다. one two three 0 1 2 3 1 4 5 6 단일 열을 제거한 결과는 다음과 같습니다. two three 0 2 3 1 5 6 둘 이상의 열 이후에 제거한 결과는 three 0 3 1 6 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 해결책 1 데이터 프레임 정의 아래 방법을 사용하여 특
데이터 프레임과 마지막 두 행을 교환한 결과가 있다고 가정합니다. Before swapping Name Age Maths Science English 0 David 13 98 75 79 1 Adam 12 59 96 45 2 Bob 12 66 55 &
float를 int로 변환한 결과인 데이터 프레임이 있다고 가정합니다. Before conversion Name object Age int64 Maths int64 Science int64 English int64 Result float64 dtype: object After conversion Name object Age int64 M
데이터 프레임과 시리즈의 모든 데이터를 섞은 결과가 있다고 가정합니다. The original series is 0 1 1 2 2 3 3 4 4 5 dtype: int64 The shuffled series is : 0 2 1 1 2 3 3 5 4 4 dtype: int64 해결책 1 시리즈를 정의
암스트롱 숫자를 필터링하기 위한 시리즈와 결과가 있다고 가정합니다. original series is 0 153 1 323 2 371 3 420 4 500 dtype: int64 Armstrong numbers are:- 0 153 2 371 dtype: int64 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 시리즈를 정의하십시오. 빈 목록을 만들고 f
알파벳과 숫자를 분리하는 시리즈와 결과가 있다고 가정하고 데이터 프레임에 다음과 같이 저장하십시오. series is: 0 abx123 1 bcd25 2 cxy30 dtype: object Dataframe is 0 1 0 abx 123 1 bcd 25 2 cxy 30 이 문제를 해결하기 위해 다음과 같은 접근 방식을 따릅니다. 해결책 시리즈를 정의하십시오. Apple 시리즈 추출 방법은 정규식 패턴을 사용하여 알파
데이터 프레임과 데이터 프레임을 여러 시트로 내보내기에 대한 결과가 있다고 가정합니다. 이 문제를 해결하기 위해 다음 단계를 따릅니다. - 해결책 Excel 변환을 사용하기 위해 xlsxwriter 모듈 가져오기 데이터 프레임을 정의하고 df에 할당 생성하고자 하는 엑셀 이름 안에 pd.ExcelWriter 함수를 적용하고 엔진을 xlsxwriter로 설정 excel_writer = pd.ExcelWriter('pandas_df.xlsx', engine='xlsxwriter')
csv 파일에 다음 데이터가 있다고 가정하고 pandas.csv로 저장합니다. pandas.csv Id,Data 1,11 2,22 3,33 4,44 5,55 6,66 7,77 8,88 9,99 10,100 마지막 두 레코드의 합계에 대한 결과는 다음과 같습니다. Sum of last two rows: Id 9 Data 99 해결책 1 csv 파일에서 저장된 데이터에 접근하여 아래의 방법으로 데이터로 저장합니다. data = pd.read_csv('pandas.csv') 데이터