Le Trustrank est une procédure pour mesurer la qualité des sites Web. Elle fut publié en 2004 par Gyongyi, Garcia-Molina et Pedersen. Le fond de l´idée est assez semblable à celui de l´algorithme du Pagerank - prendre la structure des liens contenus pour générer une mesure pour la qualité d´une page. L´algorithme peut être vu comme un développement supplémentaire de la procédure du Pagerank. Quoi qu´il en soit, un supplément n´est pas toujours aussi une amélioration.
Le point de départ de l´algorithme est la séléction manuelle de bonnes pages (pages dites de confiance). Ces pages sont la source de confiance. La confiance peut être transférée à d´autres pages en liant vers elles (hyperliens). La confiance est propagée de la même manière que le Pagerank.
En supplément on peut séléctionner des sources de spam. Ceci donnera une mesure négative (Pagerank inversé) qui sera propagée à l´inverse et est une mesure de mauvaises pages (spam).
Pour l´algorithme du classement les deux mesures peuvent être prises en compte.
La matrice M (analogue à l´algorithme du Pagerank) est donnée par:
- Tij = 1 / Cj (si la page j a un lien vers la page i)
- Tij = 0 (sinon)
Le Trustrank inversé est donné par:
avec
La matrice de transition inversée Tinv est définie par:
- Tij = 1 / nj (si la page i a un lien vers la page j)
- Tij = 0 (sinon)
A l´opposé de la matrice de transition normale qui est définie par les liens entrants, Tinv est la fonction de liens sortants. C´est pourquoi cette mesure pour spam se propage à l´inverse. Ce qui veut dire que sont mauvaises les pages qui donnent des liens vers de mauvaises pages; pendant que sont bonnes les pages vers lesquelles sont donnés des liens venant de bonnes pages.