Jakub Senko píše:SeznamPrWebu píše:
kontrola počtu článků vs počet idndexovaných článků. (jak je psáno vyžadaju více práce - maximálně nyní lze zobrazit počet zaindexovaných stránek seznamu/googlu)
1. Dalo by sa to jednoducho tak, že keby ste boli veľký web, kde by každý PR web chcel mať odkaz, tak si poviete, že prijímate export dát cez povedzme nejaké xml na serveri PR webu. Tam by sa dalo vložiť hocičo, a vytvoriť ešte plugin pre WP, ktorý to automatický urobí za užívateľa a máš to. Samozrejme kontrolovať, čo ho niekto negeneruje ručne a nepravdivo...
SeznamPrWebu píše:
průměrný počet follow odkazů, který je na stránce s článkem. Měné follow odkazů = více přenosu ranků (to asi nebude nikdy)
2. Dalo by sa to tak, že by ste nejakým simple crawlerom prehľadali hlavnú stránku a vyfiltrovali externé odkazy, ktoré nemajú rel=nofollow + pre istotu si uložili aj počet externých odkazov aj s nofollow a vypisovali to. Dá sa to vybrať jednoducho napríklad cez
simple html domSeznamPrWebu píše:
funkčnost si hlídáme, weby co nejedou vyřazujeme z DB (je však pravda že web může jet, ale nikdo se již o něj nestará a članky neschvaluje, pokusíme se na to nějak zaměřit)
3. Lenže akonáhle tam bude väčší počet webov, tak to neuhliadnete. Radšej sledujte pravidelne cez cron skript RSS, a vyberajte dátum posledného článku. Aj ke menší ako povedzme mesiac dozadu, tak vyraďte web zo zobrazovnia, ale nie z DB (čo ak sa zase rozbehne - môže sa teda automaticky pridať späť). To už ale záleží na výkone servera (ak by bolo veľa takých webov, čo sa nezobrazujú, ale sú v DB, tak sa preťažuje server čítaním RSS).