Ответ 1
Нет, он не будет сканировать содержимое AJAX по умолчанию.
http://code.google.com/web/ajaxcrawling/ содержит инструкции о том, как сделать контент AJAX crawlable, но это явные шаги, которые вам нужно предпринять, это не автоматическое
На домашней странице моего сайта я использую функцию jQuery ajax, чтобы вывести список последних действий пользователей.
Недавняя активность отображается на странице, и каждая строка последнего действия включает ссылку на профиль пользователя пользователя, выполнившего эту операцию.
Будет ли Google действительно делать вызов ajax, чтобы вытащить эту информацию и использовать ее при расчете потока сопутствующих ссылок/ссылок на сок страницы?
Я надеюсь, что он не, потому что страницы профиля пользователя не очень полезны для индекса Google, и я не хочу, чтобы все эти ссылки на страницы профиля пользователя разбавляли мой сок для ссылок на домашнюю страницу вытекают из других более важных связей.
Нет, он не будет сканировать содержимое AJAX по умолчанию.
http://code.google.com/web/ajaxcrawling/ содержит инструкции о том, как сделать контент AJAX crawlable, но это явные шаги, которые вам нужно предпринять, это не автоматическое
Возможно. Если вы хотите гарантировать, что Google не будет использовать ваши ответы JSON, поместите их в файл robots.txt. Это не безопасность; действительно, это первое место, где взломщик будет искать "интересные" страницы. И другие сканеры могут игнорировать его.
Google определенно сканирует контент на нашей странице, на который ссылается только запрос AJAX.
Мне интересно, просматривает ли Google источник страницы и ищет потенциально допустимые URL-адреса, и тестирует, есть ли у них контент.
Вот как выглядит наш запрос... который может дать некоторое представление о том, что происходит.
'$(document).ready(function() {
$("#theDiv").block({ message: 'Getting latest content...' });
$.ajax({
url: '/content/pages/articles?count=4&part=true',
success: function(data) {
$('#theDiv').html(data);
$("#theDiv").unblock();
}
});
});`
Да, Google сканирует динамический контент, созданный с помощью javascript. Он может распознавать DOM после загрузки, включая модификации тега заголовка. Он также может следовать за ссылками, созданными с помощью обработчика события onclick.
Читайте об этом здесь: http://searchengineland.com/tested-googlebot-crawls-javascript-heres-learned-220157
Он будет уважать nofollow, однако, для ваших профильных ссылок.
Теперь у Google есть возможность включить сканирование на страницах AJAX. Если ваши ссылки содержат "#!", Google изменит это на "? _escaped_fragment_ =" и запросит этот документ с вашего сервера. Однако, когда он показывает эту страницу в результатах поиска, она покажет исходный URL с помощью "#!".
http://code.google.com/web/ajaxcrawling/docs/learn-more.html
Сам Google не сканирует контент AJAX, но предложил схему обхода содержимого AJAX. Я написал статью, чтобы объяснить, как это работает. Он также включает очень простой код для демонстрации Google Crawling Scheme для контента AJAX. Найдите его здесь: http://www.tayyabali.com/seo-ajax-content-asp-net-code-to-crawl-ajax
Вот некоторая информация об обходе AJAX от создателей плагина JQuery Address.
Для пользователей Ruby есть камень, который обрабатывает это относительно безболезненно.... google_ajax_crawler Github repo здесь, напишите об использовании его для backbonejs на thecodeabode
за последний месяц google остановился для поддержки ajax! https://googlewebmastercentral.blogspot.fr/2015/10/deprecating-our-ajax-crawling-scheme.html