Farë është një sit scraper? - Përgjigja e Semalt

Një faqe scraper është faqja e internetit që kopjon përmbajtjen nga bloget dhe faqet e internetit të tjera duke përdorur disa teknika të scraping në internet. Kjo përmbajtje është pasqyruar me qëllim të gjenerimit të të ardhurave, qoftë përmes reklamimit ose duke shitur të dhënat e përdoruesit. Faqet e ndryshme të scraper ndryshojnë sipas formave dhe llojeve, duke filluar nga faqet e internetit të përmbajtjes së spamit deri tek grumbullimi i çmimeve dhe dyqanet e blerjeve në internet.
Motorë të ndryshëm kërkimi, posaçërisht Google, mund të konsiderohen si faqet e kruese. Ata mbledhin përmbajtje nga shumë faqe interneti, e ruajnë atë në një bazë të dhënash, indeksojnë dhe paraqesin përmbajtjen e nxjerrë ose të gërvishtur për përdoruesit në internet. Në fakt, shumica e përmbajtjeve të shkruara ose të ekstraktuara nga motorët e kërkimit kanë të drejtat e autorit.
Bërë për reklama:
Disa nga faqet e scraper janë krijuar për të fituar para në internet duke përdorur programe të ndryshme reklamimi. Në rrethana të tilla, ata emërohen si Made for faqet e internetit të AdSense ose MPJ. Termi nënçmues i referohet faqeve që nuk kanë ndonjë vlerë shlyerëse që presin të tërheqin, joshnin dhe angazhojnë vizitorët në faqet e internetit të përcaktuara për të marrë klikime në reklama. Uebfaqet dhe bloget e Made for AdSense konsiderohen si spam i fuqishëm i motorit të kërkimit. Ata hollojnë rezultatet e kërkimit me rezultate më pak se të kënaqshme. Disa site scraper janë të njohura që lidhen me faqe të tjera të internetit dhe synojnë të përmirësojnë renditjen e motorit të kërkimit përmes rrjeteve private të blogut. Para se Google të azhurnojë algoritmet e tij të kërkimit, lloje të ndryshme të faqeve scraper kanë qenë të famshme në mesin e ekspertëve dhe kapitalit të zi SEO SEO. Ata e përdorën këtë informacion për spamdexing dhe kryen një sërë funksionesh.

ligjshmëria:
Sitet e scraper njihen se shkelin ligjet e të drejtave të autorit. Edhe marrja e përmbajtjes nga faqet me burim të hapur është shkelje e të drejtave të autorit, nëse bëhet në atë mënyrë që nuk respekton asnjë licencë. Për shembull, licencat për dokumente falas të GNU-së dhe licencat Creative Commons ShareAlike u përdorën në Wikipedia dhe kërkuan që ri-botuesi i Wikipedia të duhej të informonte lexuesit se përmbajtja ishte kopjuar nga enciklopedia.
teknika:
Teknika ose metoda në të cilat janë në shënjestër faqet e internetit të scraper ndryshojnë nga një burim në tjetrin. Për shembull, faqet e internetit me sasi të madhe të të dhënave ose përmbajtjeve të tilla si elektronika e konsumit, linjat ajrore dhe dyqanet e departamenteve, mund të synohen në mënyrë rutinore nga konkurrentët. Konkurrentët e tyre dëshirojnë të qëndrojnë të informuar në lidhje me çmimet aktuale dhe vlerat e tregut të një marke. Një lloj tjetër i scraper tërheq copa dhe teksti nga faqet që renditen lartë për fjalë kyçe specifike. Ata kanë tendencë të përmirësojnë gradën e tyre në faqen e rezultateve të motorit të kërkimit (SERP) dhe piggyback në radhët e faqes origjinale të faqes. Burimet RSS janë gjithashtu të prekshme për kruese. Scraper janë zakonisht të lidhur me fermat e lidhjeve dhe perceptohen kur një faqe scraper lidhet me të njëjtën faqe përsëri dhe përsëri.
Rrëmbimi i domenit:
Programuesit që kishin krijuar site scraper mund të blejnë fushat e skaduara për t'i ripërdorur ato për qëllime SEO. Një praktikë e tillë lejon që ekspertët e SEO të përdorin të gjitha linjat lidhëse të këtij emri domain. Disa nga spammers përpiqen të përputhen me temat e vendeve të skaduara dhe / ose të kopjojnë të gjithë përmbajtjen nga Arkivi i tij i Internetit, duke ruajtur origjinalitetin dhe dukshmërinë e asaj faqe. Shërbimet e pritjes shpesh ofrojnë lehtësirën për të gjetur emrat e një domeni të skaduar, dhe hakerat ose spammers përdorin këtë informacion për të zhvilluar faqet e tyre të internetit.