Torno anche oggi a parlare di contenuti duplicati, con questa bella immagine che illustra in 4 punti (Discovers, Discards, Dissects e Determines) il processo con cui il motore di ricerca discrimina un contenuto originale (rispetto a quello duplicato).
Eccovi (tradotte in italiano) le 4 operazioni che esegue il search engine:
- Scoprire Quando il bot del motore di ricerca scopre un nuovo contenuto, lo compara con gli altri materiali giร in suo possesso, per determinare se รจ duplicato o meno.
- Scartare Inizialmente, elimina tutte le pagine provenienti da link farm, siti MFA (Made For AdSense) e indirizzi IP blacklistati.
- Separare Successivamente, divide fra “buone e cattive” le singole pagine in base agli inbound link, al link juice e alla qualitร dei siti dai quali provengono i link.
- Determinare Infine, esaminando l’anzianitร del documento e la tipologia dei link (=se sono attuali o meno), determina la pagina che puรฒ essere considerata come “generatore” del contenuto (ovvero l’originale).
Fonte: How A Search Engine Determines Duplicate Content