URL 처리 Python 모듈(urllib)

<시간/>

Python 언어는 웹 프로그래밍에 광범위하게 사용됩니다. 우리가 웹사이트를 검색할 때 URL 또는 Uniform Resource Locator라고도 하는 웹 주소를 사용합니다. Python에는 URL 호출을 처리하고 URL 방문 결과를 전달할 수 있는 내장 자료가 있습니다. 이 기사에서는 urllib라는 모듈을 볼 것입니다. . 또한 URL에서 결과를 가져오는 데 도움이 되는 이 모듈에 있는 다양한 기능을 볼 것입니다.

urllib 설치

python 환경에 urllib를 설치하기 위해 pip를 사용하여 아래 명령어를 사용합니다.

pip install urllib

위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -

URL 열기

request.urlopen 메소드는 URL을 방문하고 그 내용을 파이썬 환경으로 가져오는 데 사용됩니다.

예시

가져오기 urllib.requestaddress =urllib.request.urlopen('https://www.tutorialspoint.com/')print(address.read())

출력

위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -

b'\r\n\r\n

urllib.parse

URL을 구문 분석하여 유효한지 여부를 확인할 수 있습니다. 검색 옵션에 쿼리 문자열을 전달할 수도 있습니다. 응답의 유효성을 확인할 수 있으며 유효한 경우 전체 응답을 인쇄할 수 있습니다.

예시

가져오기 urllib.requestimport urllib.parseurl='https://tutorialspoint.com'values={'q':'python'}data =urllib.parse.urlencode(values)data =data.encode('utf- 8') # 데이터는 다음이어야 합니다. 사전>

출력

위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -

b'q=python'b'\r\n

urllib.parse.urlsplit

urlsplit을 사용하여 url을 가져온 다음 추가 데이터 조작에 사용할 수 있는 부분으로 분할할 수 있습니다. 예를 들어 URL이 SSL 인증되었는지 여부를 프로그래밍 방식으로 판단하려면 urlsplit을 적용하고 체계 값을 가져와 결정합니다. 아래 예에서는 제공된 URL의 다른 부분을 확인합니다.X

출력

가져오기 urllib.parseurl='https://tutorialspoint.com/python'value =urllib.parse.urlsplit(url)print(value)

위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -

SplitResult(scheme='https', netloc='tutorialspoint.com', path='/python', query='', fragment='')