Miten tarkistaa päällekkäistä sisältöä

Miten löytää päällekkäistä sisältöä

päällekkäistä sisältöä tulisi minimoida koko verkkosivuilla, koska se voi vaikeuttaa hakukoneiden päättää, mikä versio sijoitetaan kyselyn.

vaikka ”päällekkäinen sisältörangaistus” on myytti SEO: ssa, hyvin samankaltainen sisältö voi aiheuttaa indeksoinnin tehottomuutta, laimentaa PageRankia ja olla merkki sisällöstä, jota voitaisiin konsolidoida, poistaa tai parantaa.

on syytä muistaa, että päällekkäiset ja vastaavat sisällöt ovat luonnollinen osa verkkoa, mikä ei useinkaan ole ongelma hakukoneille, jotka suunnittelunsa mukaisesti kanonisoivat URL-osoitteet ja suodattavat ne tarvittaessa. Mittakaavaltaan se voi kuitenkin olla ongelmallisempi.

päällekkäisen sisällön estäminen antaa sinulle kontrollin siitä, mitä indeksoidaan ja asetetaan paremmuusjärjestykseen – sen sijaan, että jättäisit sen hakukoneille. Voit rajoittaa ryömiä budjettijätettä ja vahvistaa indeksointi-ja linkkisignaaleja auttaaksesi paremmuusjärjestyksessä.

tämä opetusohjelma opastaa, kuinka voit käyttää Screaming Frog SEO Spideriä löytääksesi sekä tarkan päällekkäisen sisällön että lähes päällekkäisen sisällön, jossa jokin teksti täsmää verkkosivuston sivujen välillä.

minkä tahansa työkalun tunnistama sisältö, mukaan lukien SEO Spider, on tarkistettava kontekstissa. Katso videomme tai jatka alla olevan oppaan lukemista.

Aloita lataamalla SEO Spider, joka on ilmainen jopa 500 URL-osoitteen indeksointiin. Ensimmäiset 2 vaihetta ovat saatavilla vain lisenssillä. Jos olet vapaa käyttäjä, siirry oppaan numeroon 3.

1) Ota käyttöön ”Near Duplicates” kautta ”Config > Content > Duplicates”

oletuksena SEO Spider tunnistaa automaattisesti tarkat kaksoiskappaleet. Kuitenkin, tunnistaa ”lähellä kaksoiskappaleita” kokoonpano on otettava käyttöön, jolloin se voi tallentaa sisällön kunkin sivun.

SEO Spider tunnistaa lähes kaksoiskappaleet 90%: n samankaltaisuudella, jota voidaan säätää löytämään sisältöä matalammalla samankaltaisuuskynnyksellä.

 lähellä kaksoiskappaleita

SEO Spider tarkistaa myös vain ”Indeksoitavat” sivut kaksoiskappaleiden varalta (sekä tarkat että lähellä olevat kaksoiskappaleet).

tämä tarkoittaa, että jos sinulla on kaksi URL-osoitetta, jotka ovat samat, mutta toinen on kanonisoitu toiseen (ja siten ”ei – indeksoitavissa”), tätä ei ilmoiteta-ellei tämä asetus ole pois käytöstä.

jos olet kiinnostunut crawl-budjettiongelmien löytämisestä, poista ”tarkista vain Indeksoitavat sivut kaksoiskappaleita varten” – valinta, koska tämä voi auttaa löytämään mahdollisia ryömintäjätteitä.

2) Säädä ”Content Area” analyysiä varten ”Config > Content > Area”

voit määrittää lähes päällekkäiseen analyysiin käytetyn sisällön. Uutta ryömintää varten suosittelemme, että käytät oletusasetusta ja tarkennat sitä myöhemmin, kun analyysissä käytetty sisältö on nähtävissä ja harkittu.

SEO Spider sulkee automaattisesti pois sekä navigaattorin että alatunnistimen elementit keskittyäkseen päärungon sisältöön. Kuitenkin, ei jokainen sivusto on rakennettu käyttämällä näitä HTML5 elementtejä, joten voit tarkentaa sisällön alue käytetty analyysi tarvittaessa. Voit valita’ include ’tai’ exclude ’ HTML-tunnisteet, luokat ja tunnukset analyysissä.

esimerkiksi Screaming Frog-sivustolla on nav-elementin ulkopuolinen mobiilivalikko, joka sisältyy oletusarvoisesti sisältöanalyysiin. Vaikka tämä ei ole paljon ongelma, tässä tapauksessa, auttaa keskittymään päärungon tekstin sivun sen luokan nimi ’mobile-menu__pudotusvalikosta’ voidaan syöttää ’Sulje luokat’ ruutuun.

lähes päällekkäisen sisällön alue

tämä sulkee pois valikon sisällyttämisen päällekkäisen sisällön analysointialgoritmiin. Lisää tästä myöhemmin.

3) ryömi verkkosivuilla

avaa SEO Spider, kirjoita tai kopioi verkkosivuilla haluat ryömiä ”kirjoita URL spider” – ruutuun ja paina ”Käynnistä”.

ryömi sivusto, jossa on päällekkäistä sisältöä

odota, kunnes ryömintä päättyy ja saavuttaa 100%, mutta voit myös tarkastella joitakin yksityiskohtia reaaliajassa.

4) Näytä kaksoiskappaleet välilehdessä ”sisältö”

sisältö-välilehdessä on 2 suodatinta, jotka liittyvät päällekkäiseen sisältöön, ”tarkat kaksoiskappaleet” ja ”lähellä kaksoiskappaleita”.

content Tab Duplicate Content Filters

vain ”exact duplicates” on käytettävissä reaaliaikaisesti ryöminnän aikana. ”Lähellä kaksoiskappaleita” on laskettava ryöminnän lopussa jälkianalyysin avulla, jotta siihen voidaan syöttää tietoja.

oikean käden ”yleiskatsaus” – ruudussa näkyy ”(Indeksointianalyysi vaaditaan) ” – Sanoma suodattimia vastaan, jotka edellyttävät indeksoinnin jälkeistä analyysiä, jotta tietoja voidaan käyttää.

near Duplicates Crawl Analysis

5) Click ’Crawl Analysis > Start’ to Populate ’Near Duplicates’ Filter

to populate the ’Near Duplicates’ filter, the ’near Similarity Match’ and ’No. Lähellä kaksoiskappaleiden sarakkeet, sinun tarvitsee vain napsauttaa painiketta lopussa ryömiä.

Ryömintäanalyysi lähellä kaksoiskappaleita

kuitenkin, Jos olet määrittänyt ”Ryömintäanalyysin” aiemmin, voit tarkistaa uudelleen kohdasta ”Ryömintäanalyysi > määritä”, että ”lähellä kaksoiskappaleita” on rastittu.

voit myös poistaa valinnan muista kohteista, jotka vaativat myös ryöminnän jälkeistä analysointia, jotta tämä vaihe olisi nopeampi.

Indeksianalyysin Asetukset lähellä Dups: ää

kun indeksianalyysi on valmis, ”analyysin” etenemispalkki on 100% eikä suodattimilla ole enää ”(Indeksianalyysi vaaditaan) ” – sanomaa.

 Ryömintäanalyysi suoritettu lähes kaksoiskappaleiden

osalta voit nyt tarkastella asuttua lähes kaksoiskappaleista suodatinta ja sarakkeita.

6) View ’Content’ Tab & ’Exact’ & ’Near’ Duplicates Filtterit

after performed Post crawl analysis, the ’Near Duplicates’ filter, the ’near Similarity Match’ and ’No. Lähellä kaksoiskappaleiden sarakkeita asutetaan. Vain URL-osoitteet, joiden sisältö ylittää valitun samankaltaisuuskynnyksen, sisältävät tietoja, muut jäävät tyhjiksi. Tässä tapauksessa Screaming Frog-sivustolla on vain kaksi.

päällekkäiset sivut

suuremman verkkosivun, kuten BBC: n, ryömintä paljastaa paljon enemmän.

lähellä päällekkäisyyksiä BBC: llä

voit suodattaa seuraavan–

  • tarkat kaksoiskappaleet-tämä suodatin näyttää sivut, jotka ovat identtisiä keskenään käyttäen MD5-algoritmia, joka laskee ”hash” – arvon kullekin sivulle ja voidaan nähdä ”hash” – sarakkeessa. Tämä tarkistus suoritetaan sivun koko HTML-koodia vastaan. Se näyttää kaikki sivut, joilla on täsmälleen samat hash-arvot. Tarkat päällekkäiset sivut voivat johtaa PageRankin signaalien jakamiseen ja arvaamattomuuteen rankingissa. URL-osoitteesta pitäisi olla vain yksi kanoninen versio, joka on olemassa ja joka on linkitetty sisäisesti. Muihin versioihin ei pitäisi liittää, ja ne tulisi ohjata 301 kanoniseen versioon.
  • lähellä kaksoiskappaleita-tämä suodatin näyttää samankaltaiset sivut määritetyn samankaltaisuuskynnyksen perusteella minhash-algoritmin avulla. Raja – arvoa voidaan säätää kohdassa ”Config > Spider > Content”, ja se on oletusarvoisesti asetettu 90 prosenttiin. Sarake ”lähin samankaltaisuus ottelu” näyttää suurimman samankaltaisuuden prosenttiosuuden toisen sivun kanssa. Ei. Near Duplicatesin sarake näyttää sivun kanssa samankaltaisuuden raja-arvon perusteella vastaavan sivumäärän. Algoritmi ajetaan sivun tekstiä vastaan, eikä täyttä HTML: ää, kuten tarkkoja kaksoiskappaleita. Tässä analyysissä käytetty sisältö voidaan määrittää kohdassa ”Config > Content > Area”. Sivujen samankaltaisuus voi olla 100%, mutta ne voivat olla vain ”Lähellä kaksoiskappaletta” tarkan kaksoiskappaleen sijaan. Tämä johtuu siitä, että tarkat kaksoiskappaleet on suljettu pois lähikopioina, jotta niitä ei merkittäisi kahteen kertaan. Samankaltaisuus pisteet ovat myös pyöristetty, joten 99.5% tai korkeampi näkyy 100%.

lähes päällekkäiset sivut on tarkistettava käsin, koska on monia perusteltuja syitä, joiden vuoksi jotkin sivut ovat sisällöltään hyvin samankaltaisia, kuten sellaisten tuotteiden vaihtelut, joiden hakumäärä on niiden tietyn ominaisuuden ympärillä.

lähikopioiksi merkittyjä URL-osoitteita tulisi kuitenkin tarkastella uudelleen, jotta voitaisiin harkita, pitäisikö niiden olla olemassa erillisinä sivuina, koska ne ovat käyttäjälle ainutkertaisia, vai pitäisikö ne poistaa, konsolidoida tai parantaa, jotta sisällöstä tulisi syvällisempää ja yksilöllisempää.

7) Näytä päällekkäisiä URL – osoitteita välilehden ”Duplicate Details” kautta

jos haluat ”exact duplicates”, on helpompaa vain tarkastella niitä yläikkunassa suodattimen avulla-koska ne on ryhmitelty yhteen ja niillä on sama ”hash” – arvo.

Exact Duplicate Pages

yllä olevassa kuvakaappauksessa jokaisella URL-osoitteella on vastaava tarkka kaksoiskappale perään viivan ja ei-perään viivan version vuoksi.

jos kyseessä on ”near duplicates”, Napsauta alalaidassa olevaa ”Duplicate Details” -välilehteä, jossa on ”near duplicate address” ja jokaisen havaitun lähes duplicate-URL-osoitteen samankaltaisuus.

päällekkäiset tiedot-välilehti

esimerkiksi, jos yläikkunasta on löydetty 4 lähikopiota URL-osoitteelle, nämä kaikki ovat katsottavissa.

päällekkäiset tiedot-välilehti

välilehden ”päällekkäiset tiedot” oikeanpuoleinen puoli näyttää sivuilta löydetyn lähes päällekkäisen sisällön ja korostaa sivujen välisiä eroja, Kun napsautat kutakin ”lähellä päällekkäistä osoitetta”.

päällekkäiset sisällölliset erot

jos päällekkäiset tiedot-välilehdessä on päällekkäistä sisältöä, jota et halua osallistua päällekkäisen sisällön analysointiin, sulje pois tai sisällytä HTML-elementtejä, luokkia tai tunnuksia (kuten kohdassa 2 korostetaan), & suorita indeksointi uudelleen.

8) Bulk Export kaksoiskappaleet

sekä tarkat että likikopiot voidaan viedä irtotavarana ”Bulk Export > Content > Exact Duplicates ”-ja ”Near Duplicates” – vientinä.

Bulk Export Kaksoiskappaleet

Final Tip! Tarkenna Samankaltaisuuskynnystä & sisältöalue, & Uudelleenajo-Ryömintäanalyysi

ryöminnän jälkeen voit säätää sekä lähes päällekkäisen samankaltaisuuden raja-arvoa että lähes päällekkäisen analyysin sisältöaluetta.

voit sitten suorittaa ryömintäanalyysin uudelleen löytääksesi enemmän tai vähemmän samanlaista sisältöä – indeksoimatta verkkosivustoa uudelleen.

Refine Near Duplicate Content kynnysarvo

kuten aiemmin todettiin, Screaming Frog-sivustolla on navigaatioelementin ulkopuolinen mobiilivalikko, joka sisältyy oletuksena sisältöanalyysiin. Mobiilivalikko näkyy sisällön esikatselussa ’duplicate details’ – välilehdessä.

near Duplicate Content Pre Content Settings Refinement

jättämällä pois ”mobile-menu__dropdown ”kohdassa” Exclude Classes ”kohdassa” Config > Content > Area ” mobiilivalikko poistetaan sisällön esikatselusta ja lähes päällekkäisestä analyysistä.

Near Duplicate Content Settings Refined

tämä voi todella auttaa, kun lähes päällekkäisen sisällön tunnistamista pääsisältöalueille hienosäädetään ilman tarvetta ryömiä uudelleen.

Yhteenveto

yllä olevassa oppaassa tulisi havainnollistaa, miten SEO-hämähäkkiä käytetään verkkosivujesi sisällön tarkistajana. Tarkimpia tuloksia varten Tarkenna sisältöaluetta analysoitavaksi ja säädä kynnysarvoja eri sivuryhmille.

lue myös Screaming Frog SEO Spider FAQ ja täydellinen käyttöopas saadaksesi lisätietoa työkalusta.

jos sinulla on kysyttävää, palautetta tai ehdotuksia SEO Spiderin päällekkäisen sisältötyökalun parantamiseksi, ota yhteyttä tuen kautta.

Leave a Reply

Sähköpostiosoitettasi ei julkaista.