중복 콘텐츠를 확인하는 방법

중복 콘텐츠를 찾는 방법

이 어려운 검색 엔진이 쿼리에 대한 순위 버전을 결정 할 수 있도록 할 수 있으므로 중복 콘텐츠는 웹 사이트에서 최소화되어야한다.

‘중복 콘텐츠 페널티’는 검색 엔진 최적화의 신화이지만,매우 유사한 콘텐츠는 크롤링 비효율을 유발하고 페이지 랭크를 희석 시키며 통합,제거 또는 개선 될 수있는 콘텐츠의 표시 일 수 있습니다.

중복 및 유사 콘텐츠는 웹의 자연스러운 부분이라는 것을 기억할 가치가 있습니다. 그러나 규모면에서 더 문제가 될 수 있습니다.

중복 콘텐츠를 방지하면 검색 엔진에 남겨두기보다는 색인이 생성되고 순위가 매겨진 내용을 제어 할 수 있습니다. 크롤링 예산 낭비를 제한하고 색인 생성 및 링크 신호를 통합하여 순위를 지정할 수 있습니다.

이 튜토리얼은 모두 정확한 중복 콘텐츠를 찾기 위해 비명 개구리 서구 거미를 사용하는 방법을 안내합니다,일부 텍스트가 웹 사이트에 페이지 사이에 일치 거의 중복 콘텐츠.

검색 엔진 최적화 거미를 포함한 모든 도구에 의해 식별 중복 콘텐츠는 맥락에서 검토 할 필요가있다. 우리의 비디오를 시청하거나 아래의 가이드를 계속 읽으십시오.

이 웹 사이트는 귀하가 웹 사이트를 탐색하는 동안 귀하의 경험을 향상시키기 위해 쿠키를 사용합니다.이 쿠키들 중에서 필요에 따라 분류 된 쿠키는 웹 사이트의 기본적인 기능을 수행하는 데 필수적이므로 브라우저에 저장됩니다 첫 번째 2 단계는 라이센스에서만 사용할 수 있습니다. 무료 사용자 인 경우 가이드의 3 번으로 건너 뜁니다.

1)’구성>내용>중복’을 통해’근처 중복’을 사용

기본적으로 검색 엔진 최적화 거미는 자동으로 정확한 중복 페이지를 식별합니다. 그러나’중복 근처’를 식별하려면 각 페이지의 콘텐츠를 저장할 수있는 구성을 활성화해야합니다.

검색엔진 최적화 스파이더는 유사성 임계값이 낮은 콘텐츠를 찾기 위해 조정할 수 있는 90%유사성 일치를 가진 가까운 중복을 식별합니다.

근처 중복

검색 엔진 최적화 스파이더는 또한 단지(정확한 거의 중복 모두)중복’색인’페이지를 확인합니다.

즉,두 개의 주소가 동일하지만 하나가 다른 하나(따라서’색인을 사용할 수 없음’)로 표준화되면 이 옵션이 비활성화되지 않는 한 보고되지 않습니다.

크롤링 예산 문제를 찾는 데 관심이 있다면’색인 가능한 페이지 만 중복 확인’옵션을 선택 취소하면 잠재적 인 크롤링 낭비 영역을 찾을 수 있습니다.

2)’구성>콘텐츠>영역’을 통해 분석할’콘텐츠 영역’조정

거의 중복된 분석에 사용되는 콘텐츠를 구성할 수 있습니다. 새 크롤링의 경우 기본 설정을 사용하고 나중에 분석에 사용된 콘텐츠를 보고 고려할 수 있는 경우 이를 구체화하는 것이 좋습니다.

검색 엔진 최적화 스파이더가 자동으로 본체 내용에 초점을 탐색 및 바닥 글 요소를 모두 제외합니다. 따라서 필요한 경우 분석에 사용되는 콘텐츠 영역을 구체화할 수 있습니다. 당신이 선택할 수 있는’또는’제외의 HTML 태그는 클래스고에 Id 를 분석합니다.

예를 들어,비명을 지르는 개구리 웹 사이트에는 탐색 요소 외부의 모바일 메뉴가 있으며,이 메뉴는 기본적으로 콘텐츠 분석 내에 포함됩니다. 이것이 많은 문제는 아니지만,이 경우 페이지의 본문 텍스트에 초점을 맞추기 위해 클래스 이름’모바일 메뉴__드롭 다운’을’클래스 제외’상자에 입력 할 수 있습니다.

중복 콘텐츠 영역 근처

이렇게 하면 중복 콘텐츠 분석 알고리즘에 포함된 메뉴가 제외됩니다. 이 나중에 더.3)웹 사이트 크롤링

검색 엔진 최적화 거미를 열고’거미 입력’상자에 크롤링하고자하는 웹 사이트에 입력하거나 복사하고’시작’을 누르십시오.

사이트 크롤링 중복 콘텐츠

크롤링이 완료되고 100%에 도달할 때까지 기다리지만 일부 세부 정보를 실시간으로 볼 수도 있습니다.

4)’콘텐츠’탭에서 중복보기

콘텐츠 탭에는’정확한 중복’및’가까운 중복’과 관련된 2 개의 필터가 있습니다.

콘텐츠 탭 중복 콘텐츠 필터

크롤링 중에’정확한 중복’만 실시간으로 볼 수 있습니다. 이 데이터로 채워질 수 있도록’근처 중복’포스트’크롤링 분석’을 통해 크롤링의 끝에서 계산이 필요합니다.

오른쪽’개요’창에는 크롤링 후 분석을 데이터로 채워야 하는 필터에 대해'(크롤링 분석 필요)’메시지가 표시됩니다.

중복 근처 크롤링 분석

5)’크롤링 분석>시작’을 클릭하여’중복 근처’필터

를 클릭하여’중복 근처’필터,’가장 가까운 유사성 일치’및’아니요. 중복 항목’열 근처,당신은 단지 크롤링의 끝에서 버튼을 클릭해야합니다.

근처 중복에 대한 크롤링 분석

그러나 이전에’크롤링 분석’을 구성한 경우’크롤링 분석>구성’에서’근처 중복’이 체크되어 있는지 다시 확인할 수 있습니다.

이 단계를 더 빠르게 수행하려면 크롤링 후 분석이 필요한 다른 항목을 선택 취소할 수도 있습니다.

크롤링 분석이 완료되면’분석’진행률 표시줄이 100%가 되고 필터에'(크롤링 분석 필요)’메시지가 더 이상 표시되지 않습니다.거의 중복에 대한 크롤링 분석 완료

이제 채워진 거의 중복 필터와 열을 볼 수 있습니다.

6)보기’내용’탭&’정확한’&’근처’중복 필터

포스트 크롤링 분석을 수행 한 후’근처 중복’필터,’가장 가까운 유사성 일치’및’아니오. 중복 항목 근처에 열이 채워집니다. 선택한 유사성 임계값을 초과하는 콘텐츠만 데이터가 포함되고 나머지는 공백으로 유지됩니다. 이 경우,비명 개구리 웹 사이트는 두 가지가 있습니다.

중복 페이지

더 큰 웹 사이트를 크롤링하면 더 많은 것을 알 수 있습니다.다음과 같이 필터링할 수 있습니다–

  • 이 필터는 각 페이지에 대한’해시’값을 계산하고’해시’열에서 볼 수있는 알고리즘을 사용하여 서로 동일한 페이지를 표시합니다. 이 검사는 페이지의 전체 페이지에 대해 수행됩니다. 그것은 정확히 같은 해시 값이 일치하는 모든 페이지를 표시합니다. 정확한 중복 페이지는 페이지 랭크 신호의 분할 및 순위 예측 불가능으로 이어질 수 있습니다. 내부적으로 연결되어 있는 단일 정식 버전만 있어야 합니다. 다른 버전은 링크되어서는 안되며 정식 버전으로 301 리디렉션되어야합니다.
  • 중복 근처-이 필터는 민해시 알고리즘을 사용하여 구성된 유사성 임계값을 기반으로 유사한 페이지를 표시합니다. 임계값은’구성>스파이더>콘텐츠’에서 조정할 수 있으며 기본적으로 90%로 설정됩니다. ‘가장 가까운 유사성 일치’열은 다른 페이지와의 가장 높은 유사성 비율을 표시합니다. ‘아니오. 중복 항목 근처 열은 유사성 임계값을 기준으로 페이지와 유사한 페이지 수를 표시합니다. 이 알고리즘은 정확한 중복과 같은 전체 텍스트가 아닌 페이지의 텍스트에 대해 실행됩니다. 이 분석에 사용된 콘텐츠는’구성>콘텐츠>영역’에서 구성할 수 있습니다. 페이지는 100%유사성을 가질 수 있지만 정확한 중복이 아닌’거의 중복’일 수 있습니다. 이는 정확한 중복이 두 번 플래그가 지정되지 않도록 가까운 중복으로 제외되기 때문입니다. 유사성 점수도 반올림되므로 99.5%이상이 100%로 표시됩니다.

일부 페이지의 내용이 매우 유사할 수 있는 정당한 이유가 많기 때문에 중복 페이지 근처를 수동으로 검토해야 합니다.

그러나 거의 중복된 것으로 플래그된 링크는 사용자에 대한 고유한 값으로 인해 별도의 페이지로 존재해야 하는지,또는 콘텐츠를 보다 심층적이고 독특하게 만들기 위해 제거,통합 또는 개선해야 하는지를 고려하도록 검토되어야 한다.’정확한 중복’의 경우,그것은 단지 필터를 사용하여 상단 창에서 볼 쉽게–그들은 함께 그룹화하고 같은’해시’값을 공유 할 수 있습니다.

정확한 중복 페이지

위의 스크린 샷에서 각 페이지는 후행 슬래시 및 비 후행 슬래시 버전으로 인해 해당 정확한 중복이 있습니다.

‘중복 항목 근처’의 경우 하단의’중복 세부 정보’탭을 클릭하면 하단 창 창에’중복 항목 근처 주소’와 발견 된 각 중복 항목의 유사성이 채워집니다.

중복 정보 탭

중복 세부 정보 탭

‘중복 세부 정보’탭의 오른쪽에는 페이지에서 발견 된 가까운 중복 콘텐츠가 표시되고 각’근처 중복 주소’를 클릭하면 페이지 간의 차이점을 강조 표시합니다.

중복 콘텐츠 차이점

중복 세부 정보 탭에 중복 콘텐츠 분석에 포함되지 않으려는 중복 콘텐츠가 있는 경우 크롤링 분석을 다시 실행합니다.

8)대량 내보내기 중복

정확한 중복과 가까운 중복 모두’대량 내보내기>콘텐츠>정확한 중복’및’가까운 중복’내보내기를 통해 대량으로 내보낼 수 있습니다.

대량 내보내기 중복 페이지

최종 팁! 유사성 임계값 구체화&콘텐츠 영역,&크롤링 분석 다시 실행

크롤링 후 거의 중복 유사성 임계값과 거의 중복 분석에 사용되는 콘텐츠 영역을 모두 조정할 수 있습니다.

그런 다음 크롤링 분석을 다시 실행하여 웹 사이트를 다시 크롤링하지 않고도 비슷한 콘텐츠를 찾을 수 있습니다.

중복 콘텐츠 임계값 근처 구체화

앞에서 설명한 바와 같이,비명을 지르는 개구리 웹 사이트는 탐색 요소 외부의 모바일 메뉴를 가지며,이 메뉴는 기본적으로 콘텐츠 분석 내에 포함됩니다. 모바일 메뉴는’중복 세부 정보’탭의 콘텐츠 미리보기에서 볼 수 있습니다.

중복 콘텐츠 근처 사전 콘텐츠 설정 구체화

‘구성>콘텐츠>영역’아래의’클래스 제외’상자에서’모바일 메뉴__드롭 다운’을 제외하면 모바일 메뉴가 콘텐츠 미리보기 및 중복에 가까운 분석에서 제거됩니다.

근처 중복 콘텐츠 설정 정제

다시 크롤링 할 필요없이,주요 콘텐츠 영역에 가까운 중복 콘텐츠의 식별을 미세 조정할 때 정말 도움이 될 수 있습니다.

요약

위의 가이드는 귀하의 웹사이트에 대 한 중복 콘텐츠 검사기로 서 스파이더를 사용 하는 방법을 설명 해야 합니다. 가장 정확한 결과를 얻으려면 분석을 위해 콘텐츠 영역을 구체화하고 다른 페이지 그룹에 대한 임계 값을 조정하십시오.

또한 우리의 비명 개구리 서구 거미 자주 묻는 질문과 도구에 대한 자세한 내용은 전체 사용자 설명서를 읽어 보시기 바랍니다.

당신은 검색 엔진 최적화 거미의 중복 콘텐츠 도구를 개선하기 위해 더 쿼리,의견이나 제안이 있다면 그냥 지원을 통해 연락.

Leave a Reply

이메일 주소는 공개되지 않습니다.