세상이 더 많은 비정형 데이터를 수용함에 따라 데이터 구조가 중첩된 JSON과 같이 깊이 중첩될 수 있는 다양한 형식의 데이터를 접하게 됩니다. Python은 내부 키를 외부 키와 연결하여 데이터를 평면화함으로써 중첩 데이터 구조를 처리하는 기능이 있습니다. 이 기사에서는 중첩된 사전을 가져와서 병합합니다.
재귀적 접근 사용
이 접근 방식에서 우리는 사전의 각 항목을 재귀적으로 처리하는 함수를 설계합니다. 사전을 전달하고 출력 사전에 대한 자리 표시자, 키 및 구분 기호를 매개변수로 디자인합니다. isinstance를 사용하여 다음 항목 자체가 사전인지 확인한 다음 사전일 경우 재귀 호출을 통해 전달합니다.
예시
dictA = {
"id": "0001",
"name": "hotdog",
"image":
{
"url": "images/0001.jpg",
"thumbnail":
{
"url": "images/thumbnails/0001.jpg",
"height,width": "2x4"
}
}
}
def dict_flatten(in_dict, dict_out=None, parent_key=None, separator="_"):
if dict_out is None:
dict_out = {}
for k, v in in_dict.items():
k = f"{parent_key}{separator}{k}" if parent_key else k
if isinstance(v, dict):
dict_flatten(in_dict=v, dict_out=dict_out, parent_key=k)
continue
dict_out[k] = v
return dict_out
final_dict = dict_flatten(dictA)
print(final_dict) 출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
{
'id': '0001',
'name': 'hotdog',
'image_url': 'images/0001.jpg',
'image_thumbnail_url': 'images/thumbnails/0001.jpg',
'image_thumbnail_height,width': '2x4'
} 체리피커 사용
사전을 입력받아 직접 사용할 수 있는 모듈입니다. 기본 구분 기호는 -.
입니다.예시
from cherrypicker import CherryPicker
dictA = {
"id": "0001",
"name": "hotdog",
"image":
{
"url": "images/0001.jpg",
"thumbnail":
{
"url": "images/thumbnails/0001.jpg",
"height,width": "2x4"
}
}
}
picker = CherryPicker(dictA)
print(picker.flatten().get()) 출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
{
'id': '0001',
'name': 'hotdog',
'image_url': 'images/0001.jpg',
'image_thumbnail_url': 'images/thumbnails/0001.jpg',
'image_thumbnail_height,
width': '2x4'
}