웹에서 리소스를 다운로드할 수 있는 방법은 많습니다. 브라우저 외에 wget과 같은 도구를 사용하여 다른 작업을 수행하는 동안 웹에서 리소스를 다운로드할 수도 있습니다. 이 기사에서는 Mac에서 wget을 다운로드하고 사용하는 방법을 보여줍니다.
wget(및 용도)은 무엇입니까?
모르는 사람을 위해 wget은 지정된 URL에서 리소스를 다운로드하는 데 도움이 되는 오픈 소스 비대화형 명령줄 유틸리티입니다. 비대화형이기 때문에 wget은 백그라운드에서 또는 로그인하기 전에도 작동할 수 있습니다.
GNU 팀의 프로젝트이며 인터넷 연결이 좋지 않은 경우에 좋습니다. 즉, 최적이 아닌 조건에서도 견고합니다.
wget을 설치하면 명령을 실행하고 파일의 대상을 지정합니다. 다음에 이 작업을 수행하는 방법을 보여드리겠습니다.
Mac에 wget을 설치하는 방법
wget을 설치하기 전에 패키지 관리자가 필요합니다. wget은 macOS와 함께 제공되지 않지만 사용 가능한 최고의 Mac 패키지 관리자인 Homebrew를 사용하여 다운로드하고 설치할 수 있습니다.
1. Homebrew 다운로드 및 설치
Homebrew를 설치하려면 먼저 터미널 창을 열고 다음 명령을 실행하십시오.
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
이것은 curl
을 사용합니다. macOS에 사전 설치된 Ruby 설치 내에서 제공되는 파일을 다운로드하는 명령입니다.
Enter 키를 누르면 명령을 실행하기 위해 설치 프로그램은 어떤 일이 일어날지에 대한 명시적인 세부 정보를 제공합니다.
확인 후 설치 프로그램이 실행됩니다.
2. 명령줄에서 wget 설치
다음으로 Homebrew를 사용하여 wget을 설치하려고 합니다. 터미널에서 다시 실행:
brew install wget
설치 프로그램이 실시간 진행 상황 업데이트를 제공하며 여기서 해야 할 일은 거의 없습니다. 프로세스는 간단하고 자동화되어 있습니다. 하지만 이미 Homebrew가 설치되어 있는 경우 brew update
를 실행해야 합니다. 모든 공식의 최신 사본을 얻으려면
터미널에 새 메시지가 표시되면 Mac에서 wget을 사용하여 리소스를 다운로드할 준비가 된 것입니다.
wget을 사용하여 웹 리소스를 다운로드하는 방법
wget을 사용하여 URL에서 원격 리소스를 다운로드하려면 다음 구조를 사용하는 것이 좋습니다.
wget -O path/to/local.copy https://example.com/url/to/download.html
그러면 URL에 지정된 파일이 컴퓨터에 지정된 위치에 저장됩니다.
-O
를 제외하면 "flag", 다운로드 위치는 현재 작업 디렉토리입니다.
예를 들어 다운로드 폴더에 웹페이지를 다운로드하려고 합니다.
wget -O /Users/[your-username]/Downloads/status.html https://www.w3.org/Status.html
-O
없이도 동일한 작업을 수행하려면 플래그, 디렉토리를 변경해야 합니다(cd downloads
) wget을 실행하기 전에:
wget /Users/[your-username]/Downloads/status.html https://www.w3.org/Status.html
다운로드 진행률에 대한 전체 세부 정보를 얻을 수 있지만 wget이 얼마나 빠른지 이 정보는 실시간 업데이트가 아니라 다운로드 요약과 유사합니다.
재귀 디렉토리 다운로드 방법
wget으로 전체 디렉토리 트리를 다운로드하려면 -r
을 사용해야 합니다. /--recursive
및 -np
/--no-parent
플래그:
wget -e robots=off -r -np https://www.w3.org/History/19921103-hypertext/hypertext/
이렇게 하면 wget이 지정된 디렉토리 내의 문서에서 찾은 모든 링크를 따라갑니다. 여기에서 지정된 전체 URL 경로를 재귀적으로 다운로드합니다.
또한 -e robots=off
에 유의하십시오. 명령. 이것은 robots.txt 파일의 제한을 무시합니다. 일반적으로 단축 다운로드를 방지하려면 robots.txt를 비활성화하는 것이 좋습니다.
wget과 함께 추가 플래그 사용
wget은 다른 많은 추가 플래그를 사용하기 때문에 유연한 도구라는 것을 알게 될 것입니다. 다운로드에 대한 특정 요구 사항이 있는 경우 유용합니다.
다운로드 프로세스 제어 및 로그 생성에 중점을 둔 두 가지 영역을 살펴보겠습니다.
wget이 리소스를 다운로드하는 방법 제어
다운로드 프로세스를 설정하는 데 도움이 되는 플래그가 많이 있습니다. 다음은 가장 유용한 몇 가지입니다.
wget -X /absolute/path/to/directory
원격 서버의 특정 디렉토리를 제외합니다.wget -nH
"호스트 이름" 디렉토리를 제거합니다. 즉, 기본 도메인 이름을 건너뜁니다. 예를 들어, wget은www.w3.org
를 건너뜁니다. 이전 예에서 폴더를 만들고History
로 시작합니다. 대신 디렉토리.wget --cut-dirs=#
파일 다운로드를 시작하기 전에 URL 아래로 지정된 수의 디렉토리를 건너뜁니다. 예:-nH --cut-dirs=1
"ftp.xemacs.org/pub/xemacs/"의 지정된 경로를 단순히 "/xemacs/"로 변경하고 로컬 다운로드에서 비어 있는 상위 디렉토리의 수를 줄입니다.wget -R index.html
/wget --reject index.html
지정된 파일 이름과 일치하는 모든 파일을 건너뜁니다. 이 경우 모든 인덱스 파일을 제외합니다. 별표(*)는 "*.png"와 같은 와일드카드입니다. PNG 확장자를 가진 모든 파일을 건너뜁니다.wget -i file
입력 파일에서 대상 URL을 지정합니다. 이 입력 파일은 HTML 형식이어야 하며, 그렇지 않으면--force-html
을 사용해야 합니다. HTML을 구문 분석하는 플래그입니다.wget -nc
/wget --no-clobber
대상에 이미 존재하는 파일을 덮어쓰지 않습니다.wget -c
/wget --continue
부분적으로 다운로드된 파일의 다운로드를 계속합니다.wget -t 10
실패하기 전에 리소스 다운로드를 최대 10번 시도합니다.
wget은 나중에 참조할 수 있도록 로그를 생성할 수 있으므로 다운로드 프로세스를 제어하는 것 이상을 수행할 수 있습니다.
로깅 수준 조정
다음 플래그를 wget을 사용할 때 받는 출력을 부분적으로 제어하는 방법으로 고려할 수도 있습니다.
wget -d
디버깅 출력을 활성화합니다.wget -o path/to/log.txt
로그인 표준 출력을 표시하는 대신 지정된 디렉토리에 대한 로깅 출력을 활성화합니다.wget -q
오류 메시지를 포함하여 wget의 모든 출력을 끕니다.wget -v
명시적으로 wget의 기본 상세 출력을 활성화합니다.wget --no-verbose
로그 메시지를 끄지만 오류 메시지를 표시합니다.
다운로드하는 동안 무슨 일이 일어나는지 알고 싶을 때가 종종 있으므로 이러한 플래그를 다른 플래그만큼 많이 사용하지 않을 수 있습니다. 그래도 다운로드 배치가 많고 문제를 해결할 수 있는지 확인하려는 경우 로그가 있거나 출력이 부족한 것이 유효한 접근 방식입니다.
결론
브라우저나 다른 GUI를 사용하여 웹 페이지 및 기타 리소스를 다운로드할 수 있지만 명령줄을 사용하면 시간을 절약할 수 있습니다. wget과 같은 도구는 브라우저보다 훨씬 강력하고 신속합니다. wget의 기능에 대한 전체 설명은 wget의 GNU 매뉴얼 페이지를 참조하십시오.
wget이 작동하지 않는 경우 Wi-Fi 연결 문제를 진단해야 할 때일 수 있습니다. Mac에서 wget을 사용하여 웹 리소스를 다운로드하시겠습니까? 아래 댓글 섹션에서 생각을 공유하세요!