웹 사이트에서 엑셀로 데이터를 가져 오는 방법?

월드 와이드 웹은 거대한 유용한 데이터를 포함하는 것으로 잘 알려져있다. 그러나,우리는 분석의 어떤 종류를 하기 전에 마이크로소프트 엑셀로 자료를 수입해야 한다. 이러한 종류의 작업을 완료하는 데 사용할 수 있는 두 가지 방법이 있습니다.

수동으로 웹에서 외부 데이터 가져 오기

이 웹 페이지에서 최고 돈벌이 영화에 대한 수익을 다운로드 할 것을 가정,여기에 쉽게 수행하는 방법을 보여줍니다.

마이크로 소프트 엑셀을 열고 데이터 탭을 클릭,외부 데이터 가져 오기 그룹에서 웹에서 클릭. 새 웹 쿼리 대화 상자가 나타나면 웹 주소(http://www.the-numbers.com/movie/records/All-Time-Worldwide-Box-Office)를 주소 필드에 복사하고 이동 버튼을 클릭하십시오. 엑셀은 그림 1.1 과 같이 웹 페이지를 다운로드하기 시작합니다. 당신은 아래 그림과 유사 스크립트 오류 경고 상자를 얻을 것이다 경우 그냥 아니오를 클릭. 상자가 사라지고 가져 오기 프로세스에 영향을 미치지 않습니다.

웹에서 엑셀로 데이터 가져오기 그림 1.1

그림 1.1

새 웹 쿼리 대화 상자의 오른쪽 위 모서리에 있는 노란색 상자에 화살표가 있습니다. 그것을 클릭하면 테이블 앞에 유사한 아이콘을 표시할지 여부를 결정할 수 있습니다. 예를 들어,그림 1.2 의 왼쪽 패널에 있는 표 옆에 화살표 아이콘이 없습니다. 당신이 아이콘을 표시하는 화살표 버튼을 클릭 한 후(오른쪽 패널)아이콘이있을 것입니다.

웹에서 엑셀로 데이터 가져오기 그림 1.2

그림 1.2

선택할 테이블 옆의 화살표 아이콘을 클릭합니다. 그림 1.3 의 왼쪽 패널에 표시된 아이콘과 표가 변경됩니다. 가져오기를 클릭하면 데이터 가져오기 대화 상자가 표시됩니다. 데이터를 넣고 확인을 클릭 할 범위(열에서 열 시간을 통해 우리의 경우)를 입력합니다.

웹에서 엑셀로 데이터 가져오기 그림 1.3

그림 1.3

확인을 클릭하면 데이터를 엑셀로 가져옵니다. 표 내의 모든 셀을 마우스 오른쪽 버튼으로 클릭하고 새로 고침을 선택하면 엑셀이 웹 페이지에서 가장 최근의 데이터를 가져옵니다.

웹에서 엑셀로 데이터 가져오기 그림 1.4

그림 1.4

그리고 당신은 당신이 원하는 방식으로 갱신 할 쿼리 데이터를 설정할 수 있습니다. 테이블 내의 모든 셀을 마우스 오른쪽 버튼으로 클릭하고 데이터 범위 속성을 선택하십시오. 프롬프트된 외부 데이터 범위 속성 대화 상자에서 새로 고침 컨트롤 설정을 변경하여 스타일을 변경할 수 있습니다. 예를 들어 60 분마다 또는 파일을 열 때 새로 고칠 쿼리를 지정할 수 있습니다.

웹에서 엑셀로 데이터 가져오기 그림 1.5

엑셀 웹에서 데이터 가져 오기 그림 1.5

웹 페이지에서 데이터를 스크래핑하는 데 사용할 수 있습니다. 첫 번째 접근 방식과 비교할 때 훨씬 더 유용하지만 어렵습니다. 또한,당신은 어떻게 데이터를 긁어 학습 하기 전에 무엇을 이해 해야 합니다. 이 웹 사이트에서는 웹 사이트에 대한 기본 지식을 배우는 것이 좋습니다. 여기에서 웹 스크래핑과 관련된 거의 모든 것을 배울 수 있습니다. 이 기사는 두 가지 예만 보여줍니다.

한 웹 페이지에서 데이터 스크랩

이 웹 페이지에서 회사 이름,이메일 주소 및 연락처 이름을 추출한다고 가정합니다. 이 웹 페이지를 열면 하단에 연락처 블록이 있음을 알 수 있습니다. 그림 2.1 은 컨택 블록 및 해당 소스 코드를 보여줍니다. 빨간 상자에 있는 정보는 우리가 필요로 하고 싶은 무슨이다. 그리고 녹색 밑줄을 가진 사람들은 정확히 우리가 추출해야 할 것입니다.

웹에서 엑셀로 데이터 가져오기 그림 2.1

그림 2.1

다음 코드는 위에서 요청한 정보를 추출하여 첫 번째 워크시트에 넣는 데 도움이 됩니다.

소스 코드
이 문제를 해결하려면 다음 단계를 수행하십시오.응용 프로그램")'브라우저 창을 보지 않겠습니다.보이는=거짓'웹 페이지를 엽니 다."http://www.austrade.gov.au/SupplierDetails.aspx?ORGID=ORG8160044431&folderid=1736"를 탐색하십시오.1142>>4 또는 즉.회사 이름 검색,이메일 주소&연락처 정보를 설정합니다.문서.자세한 내용은 연락처 세부 정보 차단을 참조하십시오.이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(1).예를 들어,두 개의 셀(1,1)을 두 개의 셀(1,1)으로 나눈 값(1,1)을 두 개의 셀(1,1)으로 나눈 값(1,1)입니다.: ")(1), "<이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(1).이 예제에서는 다음과 같은 방법을 사용할 수 있습니다.(34) & ">")(0) 이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(1).이 예제에서는 다음과 같은 방법을 사용할 수 있습니다.: ")(1), "<(0)이 경우 끝작업책.워크 시트(1).세포(4,1)=즉.위치이 작업 책을 찾으십시오.저장 설정 즉=아무것도 설정 연락처 제이=아무것도 종료 하위

“즉.문서.”클래스 이름–연락처-세부 정보 블록 어두운 모든 요소를 가져올 수 있습니다. 이 웹 페이지에는 거의 모든 속성과 메서드가 나열되어 있습니다. 당신은 당신의 자신의 문제에 대한 적절한 하나를 선택할 수 있습니다.이 속성을 사용하면 다음과 같은 내용을 설정할 수 있습니다. 우리의 경우,클래스 이름”연락처-세부 블록 어두운”와 요소의 내용을 반환하고 변수로 설정 . 콘텐츠(그림 2.2)는’‘에 의해 프롬프트될 수 있습니다.

웹에서 엑셀로 데이터 가져오기 그림 2.2

그림 2.2

당신은 텍스트가 잘 구성되어 있음을 볼 수 있습니다. 그래서 분할 함수를 사용하여 필요한 것을 추출 할 수 있습니다. 예를 들어,”<피>회사 이름:(1)”는”<페이지>회사 이름:”다음에 전체 텍스트를 반환 할 수 있습니다. 이 새로 반환 된 텍스트의 경우”<브롬”을 구분 기호로 사용하여 첫 번째”<브롬”앞에 텍스트를 가져올 수 있습니다. 요약하면,분할 기능은 거의 모든 것을 추출하는 데 사용할 수있는 유연한 도구입니다. 다른 유용한 기능으로는 렌,등받이,왼쪽,오른쪽,중간 및 교체가 있습니다. 나는 여기서 자세히 논의하지 않을 것이다.

그림 2 에서 확인을 클릭 한 후.2,요청 된 데이터는 엑셀 워크 시트에 웹에서 가져올 수 있습니다. 예를 들어 셀 대답 1 은 회사 이름을 포함하고 셀 대답 4 는 회사 웹 페이지 주소를 포함합니다.

웹에서 엑셀로 데이터 가져오기 그림 2.3

그림 2.3

통합 문서를 저장하기 전에 아래 코드를 추가하여 셀에 하이퍼링크를 추가할 수 있습니다.

소스 코드
'하이퍼링크 워크북을 추가합니다.워크 시트(1).하이퍼 링크.이 작업을 추가하십시오.워크 시트(1).세포(4,1),이작업.워크 시트(1).세포(4, 1)

당신이 셀을 클릭하면 대답 4,당신은 웹 페이지를 다시 방문 할 수 있습니다. 이 기능은 특히 많은 회사의 데이터를 검색해야 할 때 유용합니다. 하이퍼 링크를 클릭하여 해당 웹 페이지를 다시 방문하고 나중에 검토하는 동안 정보를 수동으로 추가하거나 업데이트 할 수 있습니다.

웹에서 엑셀로 데이터 가져오기 그림 2.4

그림 2.4

웹 페이지와 상호 작용

위의 예는 하나의 정적 웹 페이지에서 데이터를 검색하는 방법을 보여줍니다. 그러나 더 자주보다,우리는 많은 양의 데이터를 검색하기 위해 웹 페이지와 상호 작용 한 추출해야합니다. 그림 3.1 을 보십시오. 그것은 위의 예제의 웹 페이지에 도착하는 방법을 보여줍니다. 많은 산업이 있고 각 산업마다 많은 회사가 있다는 것을 알 수 있습니다. 예를 들어,농업 산업에는 651 개의 회사가 있습니다. 우리가 모든 기업에서 모든 회사의 교신 정보를 추출하고 싶은 경우에 우리는 무엇을 해야 하는가?

웹에서 엑셀로 데이터 가져오기 그림 3.1

그림 3.1

음,중요한 점은 어떻게 우리가 수동으로 할 것과 같은 웹 페이지와 상호 작용 할 수 있다는 것입니다. 의 예를 들어,의 장점을 보자. 일반적으로,우리는 엑셀 농업 관련 사업을 클릭 할 수 있기를 바랍니다(그림의 상단 패널 3.1)따라서 두 번째 웹 페이지로 우리를 직접 즉 트리거. 두 번째 웹 페이지(그림 3.1 의 하단 패널)에서 엑셀은 그림 2.1 과 같은 페이지로 안내하여 그림 2.1 의 연락처 정보를 검색 할 수 있습니다.

비주얼 베이직 에디터에 다음 코드를 입력하고 코드를 제출 한 후,당신은 당신의 즉,열린 것을 볼 수 있습니다. 첫 번째 웹 페이지 다음에 두 번째 웹 페이지가 나타납니다. 여기에서 드롭다운 목록 요소를 가져오고,옵션을 선택하고,옵션을 선택한 후 이벤트를 트리거하는 방법을 배웁니다. “엠=즉.문서.이 문제를 해결하는 방법은 무엇입니까?길이-1″은 총 옵션 수를 제공합니다. 다음 루프에 사용할 수 있습니다.

소스 코드
이 문제를 해결하려면 다음 단계를 수행하십시오.응용 프로그램")'브라우저 창을 보자.보이는=참'웹 페이지를 엽니 다."http://www.austrade.gov.au/international/buy#"을 탐색하십시오.바쁜 응용 프로그램.루프 응용 프로그램.대기(지금+시간 값("00:00:10")) '1 부-드롭 다운 목록을 선택하고 하나의 옵션을 선택한 후 이벤트를 트리거합니다.문서.이 방법은 다음과 같습니다.문서.이 문제를 해결하는 방법은 무엇입니까?길이-1 선택옵 제이(0).이 방법은 다음과 같습니다.이 문제를 해결하려면 다음 단계를 수행하십시오.1142>>4 또는 즉.사용 중=진정한 응용 프로그램입니다.루프 응용 프로그램.대기(지금+시간 값("00:00:10")) 서브 종료

코드의이 부분은 엑셀 이름을 클릭 한 후 그림 2.1 에 표시된 웹 페이지로 안내 할 수 있습니다. 모든 회사 이름은”이름”의 클래스 이름으로 요소에 포함됩니다. 이 객체에는 두 개의 객체가 있습니다. 예를 들어,검색 제이(1).클릭은 리들리 코퍼레이션(멜버른)의 웹 페이지를 방문 할 수 있습니다.

소스 코드
'2 부-회사 이름 집합 검색 제이를 선택하십시오.문서.다음 예제에서는 다음과 같이 설명합니다.클릭'즉 동안로드하는 동안 기다립니다.1142>>4 또는 즉.사용 중=참 이벤트 루프

마지막으로,여기에 당신에게,즉 개방 웹 페이지를 검색하고 데이터를 추출하는 과정을 표시 할 수있는 전체 코드입니다. 추출된 데이터는 그림 2.4 와 동일합니다.

소스 코드
이 문제를 해결하려면 다음 단계를 수행하십시오.응용 프로그램")'브라우저 창을 보자.보이는=참'웹 페이지를 엽니 다."http://www.austrade.gov.au/international/buy#"을 탐색하십시오.바쁜 응용 프로그램.루프 응용 프로그램.대기(지금+시간 값("00:00:10")) '1 부-드롭 다운 목록을 선택하고 하나의 옵션을 선택한 후 이벤트를 트리거합니다.문서.이 방법은 다음과 같습니다.문서.이 문제를 해결하는 방법은 무엇입니까?길이-1 선택옵 제이(0).이 방법은 다음과 같습니다.이 문제를 해결하려면 다음 단계를 수행하십시오.1142>>4 또는 즉.사용 중=진정한 응용 프로그램입니다.루프 응용 프로그램.대기(지금+시간 값("00:00:10")) '2 부-회사 이름 집합 검색 제이를 선택하십시오.문서.다음 예제에서는 다음과 같이 설명합니다.클릭'즉 동안로드하는 동안 기다립니다.1142>>4 또는 즉.회사 이름 검색,이메일 주소&연락처 정보 설정 연락처=즉.문서.자세한 내용은 연락처 세부 정보 차단을 참조하십시오.이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(1).예를 들어,두 개의 셀(1,1)을 두 개의 셀(1,1)으로 나눈 값(1,1)을 두 개의 셀(1,1)으로 나눈 값(1,1)입니다.: ")(1), "<이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(1).이 예제에서는 다음과 같은 방법을 사용할 수 있습니다.(34) & ">")(0) 이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(1).이 예제에서는 다음과 같은 방법을 사용할 수 있습니다.: ")(1), "<(0)이 경우 끝작업책.워크 시트(1).세포(4,1)=즉.하이퍼링크 워크북을 추가합니다.워크 시트(1).하이퍼 링크.이 작업을 추가하십시오.워크 시트(1).세포(4,1),이작업.워크 시트(1).셀(4,1)엔드 서브

사실,우리가해야 할 일은 모든 산업에서 모든 기업에 대한 연락처 정보를 추출하는 것입니다,따라서,우리는이 작업을 완료하기 위해 루프 문에 대한 사용을 할 필요가있다. 다음은 전체 코드입니다. 그리고 당신은 또한 모든 회사에 대한 연락처 정보를 검색에서 코드를 찾을 수 있습니다.이 문서의 끝에 다운로드할 수 있습니다.

소스 코드
이 문제를 해결하려면 다음 단계를 수행하십시오.응용 프로그램")'브라우저 창을 보자.보이는=거짓'웹 페이지를 엽니 다."http://www.austrade.gov.au/international/buy#"을 탐색하십시오.바쁜 응용 프로그램.루프 응용 프로그램.대기(지금+시간 값("00:00:10")) 이 작업을 수행하는 방법은 다음과 같습니다.문서.이 방법은 다음과 같습니다.문서.이 문제를 해결하는 방법은 무엇입니까?길이-1 선택옵 제이(0).이 방법은 다음과 같습니다.이 문제를 해결하려면 다음 단계를 수행하십시오.1142>>4 또는 즉.사용 중=진정한 응용 프로그램입니다.루프 응용 프로그램.대기(지금+시간 값("00:00:10")) 100000000000위치=즉.문서.이 예제에서는 다음과 같이 설명합니다.이 문제를 해결하기 위해 몇 가지 간단한 단계를 수행 할 수 있습니다.이동(울)다른 예.이 작업을 수행하는 방법은 다음과 같습니다.바쁜 응용 프로그램.이 작업을 수행 할 때 다음 작업을 수행 할 수 있습니다.문서.나는 내가 원하는 것을 가지고 있다고 생각한다.클릭'즉 동안로드하는 동안 기다립니다.1142>>4 또는 즉.회사 이름 검색,이메일 주소&연락처 정보 설정 연락처=즉.문서.자세한 내용은 연락처 세부 정보 차단을 참조하십시오.이 작업을 수행 할 수 있습니다.워크 시트(익스).이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(익스).이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(익스).예를 들어,두 개의 셀 중 하나를 분할 할 수 있습니다.: ")(1), "<이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(익스).이 예제에서는 다음과 같은 방법을 사용할 수 있습니다.(34) & ">")(0) 이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(익스).이 예제에서는 다음과 같은 방법을 사용할 수 있습니다.: ")(1), "<(0)이 경우 끝작업책.워크 시트(익스).세포(에이,6)=즉.위치 예.고백 즉 동안 않습니다.바쁜 응용 프로그램.이 작업을 수행 할 때 다음 작업을 수행 할 수 있습니다.문서.나는 내가 원하는 것을 가지고 있다고 생각한다.클릭'즉 동안로드하는 동안 기다립니다.1142>>4 또는 즉.회사 이름 검색,이메일 주소&연락처 정보 설정 연락처=즉.문서.자세한 내용은 연락처 세부 정보 차단을 참조하십시오.이 작업을 수행 할 수 있습니다.워크 시트(익스).이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(익스).이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(익스).예를 들어,두 개의 셀 중 하나를 분할 할 수 있습니다.: ")(1), "<이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(익스).이 예제에서는 다음과 같은 방법을 사용할 수 있습니다.(34) & ">")(0) 이 작업을 수행하는 방법은 다음과 같습니다.워크 시트(익스).이 예제에서는 다음과 같은 방법을 사용할 수 있습니다.: ")(1), "<(0)이 경우 끝작업책.워크 시트(익스).세포(에이,6)=즉.위치이 작업 책을 찾으십시오.워크 시트(익스).하이퍼 링크.이 작업을 추가하십시오.워크 시트(익스).세포(에이,6),이작업 책.워크 시트(익스).세포(에이,6)즉.고백 즉 동안 않습니다.바쁜 응용 프로그램.이 작업을 수행 할 수 있습니다.다음 저장 제이 세트 즉=아무것도 설정 접촉 제이=아무것도 다음 아이디어 엔드 서브

내가 설명해야 할 유일한 요점은 그림 3.2 에 나와 있습니다. 하나의 웹에는 25 개의 회사 만 나열 할 수 있습니다. 회사의 총 수가 25 보다 큰 경우,하나 이상의 페이지가있을 것입니다. 그림 3.2 는 첫 페이지 다음에 페이지의 주소를 얻는 규칙이 있음을 보여줍니다. 첫 번째 페이지의 연결 주소”&페이지=”와 실제 페이지 번호의 결과입니다. 마지막 페이지 이전의 모든 페이지에 대해 총 개체 수는 25 입니다. “예.문서.이 예제에서는 다음과 같이 설명합니다.한 산업 내의 총 회사 수를 반환 할 수 있습니다. 우리의 경우 651 이 될 것입니다. “지능(어린 아이/25)+1″당신에게 페이지의 총 수를 얻을 수 있습니다. 그리고”최대=(어린 아이 모드 25)–1″마지막 페이지에 회사의 최대 수를 반환 할 수 있습니다. 여기서 멈추고 이 아이디어를 코드에 적용하는 방법을 알아내도록 하겠습니다. 코드를 파악하는 것이 훨씬 더 좋은 방법입니다. 당신은 질문이있는 경우에는 코멘트를 남길 수 있습니다.

웹에서 엑셀로 데이터 가져오기 그림 3.2

그림 3.2

여기에 당신에게 최종 엑셀의 일부를 보여줍니다. 한 산업 내의 모든 회사에 대한 연락처 정보는 하나의 워크 시트에 함께 배치됩니다.

웹에서 엑셀로 데이터 가져오기 그림 3.3

그림 3.3

  • 어떻게 자동으로 엑셀 웹 사이트에서 데이터를 추출?
  • 워드에서 엑셀로 데이터 가져 오기(문장,단락,표,주석)
  • 6 최고의 엑셀 프로그래밍 책(초보자를위한&고급 사용자)
  • 엑셀 프로그래밍 알아보기&매크로(무료 튜토리얼–단계별)
  • 엑셀 코딩 팁

작업 파일 다운로드

아래 링크에서 작업 파일을 다운로드합니다.

웹에서 엑셀로 데이터를 가져옵니다.

Leave a Reply

이메일 주소는 공개되지 않습니다.