Ответ 1
Современный способ вычисления PageRank основан на структуре Google Pregel. Я почти уверен, что сейчас у них есть что-то более сложное, но это последнее опубликованное усилие.
Подробнее об этом читайте в исследовательском блоге. Или прочитайте опубликованную статью здесь.
Я работаю над версией Bulk Synchronous Parallel под названием Apache Hama. Существует также Apache Giraph, который исключительно фокусируется на графиках и множестве других.
Как упоминается mfrankli, существует также инфраструктура MapReduce (например, Apache Hadoop), которая может быть использована для вычисления PageRank, но она не эффективна для итеративных алгоритмов.
Примечательно, что оба решения (MapReduce и BSP) являются пакетными решениями, поэтому они могут использоваться для пересчета PageRank для полного веб-графика. Поскольку обновления Google намного быстрее, чем пакетные алгоритмы, вы можете ожидать, что они часто пересчитывают PageRank на подграфах.