웹 스크래핑은 자동화된 방법을 사용하여 웹 사이트에서 데이터, 정보 또는 이미지를 추출하는 행위입니다. 완전 자동에서 복사하여 붙여넣는 것으로 생각하십시오.
우리는 앱을 작성하거나 사용하여 원하는 웹 사이트로 이동하고 해당 웹 사이트에서 원하는 특정 항목의 복사본을 만듭니다. 전체 웹사이트를 다운로드하는 것보다 훨씬 정확합니다.
다른 도구와 마찬가지로 웹 스크래핑은 선이나 악을 위해 사용될 수 있습니다. 웹 사이트를 스크랩하는 더 좋은 이유 중 일부는 콘텐츠, 가격 비교 쇼핑 또는 모니터링 주식 시장 정보를 기반으로 검색 엔진에서 순위를 매기는 것입니다. 일종의 연구 도구로 사용할 수도 있습니다.
Excel로 웹사이트를 스크랩하려면 어떻게 해야 합니까?
믿거 나 말거나 Excel은 적어도 Excel 2003 이후로 오랫동안 웹 사이트에서 데이터를 추출하는 기능을 가지고 있습니다. 웹 스크래핑은 대부분의 사람들이 생각하지 않는 것입니다. aspreadsheet 프로그램을 사용하여 작업을 수행하는 것은 말할 것도 없습니다. . 하지만 놀라울 정도로 쉽고 강력합니다. Microsoft Office 키보드 단축키 모음을 만들어 수행하는 방법을 알아보겠습니다.
스크레이핑할 사이트 찾기
가장 먼저 할 일은 정보를 얻고자 하는 특정 웹 페이지를 찾는 것입니다. 소스로 이동하여 https://support.office.com/에서 검색해 보겠습니다. "자주 사용하는 단축키"라는 검색어를 사용하겠습니다. Outlook, Excel, Word 등과 같은 특정 앱의 이름을 사용하여 더 구체적으로 만들 수 있습니다. 쉽게 돌아갈 수 있도록 결과 페이지를 북마크에 추가하는 것이 좋습니다.
검색 결과 "Windows용 Excel의 바로 가기 키"를 클릭합니다. 해당 페이지에서 Excel 버전 목록을 찾아 최신 버전을 클릭합니다. . 이제 우리는 최신의 최고와 협력하고 있습니다.
검색 결과 페이지로 돌아가서 다른 모든 Office 앱에 대한 결과를 자체 탭에서 열고 책갈피에 추가할 수 있습니다. 이 운동을 위해서라도 좋은 생각입니다. 이것은 대부분의 사람들이 Office 바로 가기 수집을 중단하지만 우리는 수집하지 않는 곳입니다. 언제 어디서나 원하는 작업을 수행할 수 있도록 Excel에 저장하겠습니다.
Excel 열기 및 긁기
Excel을 열고 새 통합 문서를 시작합니다. 통합 문서를 Office 바로 가기로 저장 . OneDrive가 있는 경우 자동 저장 할 수 있도록 여기에 저장합니다. 기능이 작동합니다.
통합 문서가 저장되면 데이터 탭.
데이터 탭의 리본에서 웹에서를 클릭합니다. .
웹에서 마법사 창이 열립니다. 여기에 데이터를 스크랩하려는 웹 사이트의 웹 주소 또는 URL을 입력합니다. 웹 브라우저로 전환하고 복사합니다. URL.
URL을 URL에 붙여넣습니다. 웹에서 마법사의 필드입니다. 기본에서 이것을 사용하도록 선택할 수 있습니다. 또는 고급 방법. 고급 모드는 웹사이트에서 데이터에 액세스하는 방법에 대한 더 많은 옵션을 제공합니다. 이 연습에서는 기본 모드만 필요합니다. 확인을 클릭합니다. .
이제 Excel에서 웹 사이트에 연결을 시도합니다. 몇 초 정도 걸릴 수 있습니다. 표시되는 경우 진행률 창이 표시됩니다.
내비게이터 창이 열리고 왼쪽에 웹사이트의 테이블 목록이 표시됩니다. 하나를 선택하면 오른쪽에 테이블 미리보기가 표시됩니다. 자주 사용하는 단축키 를 선택합시다. 표.
WebView를 클릭할 수 있습니다. 탭을 클릭하여 실제 웹사이트를 확인하고 원하는 테이블을 찾아봐야 하는 경우 찾으면 클릭하면 가져오기를 위해 선택됩니다.
이제 로드를 클릭합니다. 버튼을 클릭하십시오. 우리가 선택할 수 있는 다른 옵션이 있습니다. 더 복잡하고 첫 번째 스크래핑을 수행하는 범위를 벗어납니다. 그들이 거기에 있다는 것을 명심하십시오. Excel의 웹 스크래핑 기능은 매우 강력합니다.
웹 테이블은 몇 초 후에 Excel에 로드됩니다. 왼쪽에 숫자 1인 데이터가 표시됩니다. 아래 그림에 있습니다. 숫자 2 쿼리 강조표시 웹 사이트에서 데이터를 가져오는 데 사용됩니다. 통합 문서에 여러 쿼리가 있는 경우 여기에서 사용할 쿼리를 선택합니다.
데이터가 스프레드시트에 Exceltable로 제공됩니다. 데이터를 필터링하거나 정렬할 수 있도록 이미 설정되어 있습니다.
Outlook, Word, Access, PowerPoint 및 기타 Office 앱에 대해 원하는 Office 바로 가기가 있는 다른 모든 웹 페이지에 대해 이 프로세스를 반복할 수 있습니다.
스크랩된 데이터를 Excel에서 최신 상태로 유지
보너스로 Excel에서 스크랩한 데이터를 최신 상태로 유지하는 방법을 배울 것입니다. 이것은 Excel이 데이터 스크래핑에 얼마나 강력한지를 보여주는 좋은 방법입니다. 그래도 엑셀이 할 수 있는 가장 기본적인 스크래핑만 하고 있습니다.
이 예에서는 https://www.cnbc.com/stocks/와 같은 주식 정보 웹 페이지를 사용하겠습니다.
이전에 수행한 작업을 수행하고 주소 표시줄에서 새 URL을 복사하여 붙여넣습니다.
네비게이터 창으로 이동하여 사용 가능한 테이블을 볼 수 있습니다. 주요 미국 주가 지수를 선택하겠습니다.
데이터가 스크랩되면 다음 스프레드시트가 표시됩니다.
오른쪽에 주요 미국 주가 지수에 대한 쿼리가 표시됩니다. 강조 표시되도록 선택합니다. 표 도구에 있는지 확인 탭 및 디자인 지역. 그런 다음 새로고침 아래의 아래쪽 화살표를 클릭합니다. 그런 다음 연결 속성을 클릭합니다. .
QueryProperties 창의 사용 아래 탭에서 이 정보가 새로 고쳐지는 방식을 제어할 수 있습니다. 새로 고침할 특정 기간을 설정하거나 다음에 통합 문서를 열 때 새로 고치거나 백그라운드에서 다시 새로 고치거나 이들의 조합을 설정할 수 있습니다. 제거할 대상을 선택했으면 확인을 클릭합니다. 창을 닫고 계속하십시오.
그게 다야! 이제 Excel 스프레드시트에서 주가, 스포츠 경기 결과 또는 자주 변경되는 기타 데이터를 추적할 수 있습니다. Excel 방정식과 함수에 능숙하다면 데이터로 원하는 거의 모든 작업을 수행할 수 있습니다.
주식 동향을 파악하거나 직장에서 판타지 스포츠 풀을 운영하거나 날씨를 추적하려고 할 수 있습니다. 누가 알아? 당신의 상상력과 인터넷에서 구할 수 있는 데이터가 유일한 한계입니다.