Почему Google не предлагает частичный поиск? Это потому, что индекс будет слишком большим?
Google/GMail/и т.д.. не предлагает частичный или префиксный поиск (например, материал *), хотя это может быть очень полезно. Часто я не нахожу почту в GMail, потому что я не помню точное выражение.
Я знаю, что это происходит и такое, но это не то же самое, особенно если мы говорим о других языках, кроме английского.
Почему Google не добавляет такую функцию? Это потому, что индекс взорвется? Но базы данных предлагают частичный поиск, поэтому, безусловно, есть хорошие алгоритмы для решения этой проблемы.
В чем проблема?
Ответы
Ответ 1
Google фактически не сохраняет текст, который он ищет. В нем хранятся условия поиска, ссылки на страницу и где на странице существует термин. Эта структура данных индексируется в смысле традиционной базы данных. Я бы сказал, что использование подстановочных знаков сделает индекс индекса довольно медленным, и, как говорит разработчик, не очень полезно.
Ответ 2
Google выполняет поиск частичных слов. Однако Gmail не работает. Поскольку вы спрашиваете, в чем проблема, мой ответ - это отсутствие усилий. У этой проблемы есть решение, которое позволяет искать по постоянному времени и линейному пространству, но не очень кэш-памяти: Suffix Trees. Suffix Arrays - еще один вариант, который более удобен для кэширования и долгого времени.
Ответ 3
Это возможно через Документы Google - следуйте этой статье:
http://www.labnol.org/internet/advanced-gmail-search/21623/
Ответ 4
Поиск кода Google может выполнять поиск на основе регулярных выражений, поэтому они знают, как это сделать. Разумеется, количество данных, которые должен индексировать Code Search, является крошечным по сравнению с веб-поиском. Использование поиска регулярных выражений или подстановочных знаков в веб-поиске увеличило бы размер индекса и снизило бы производительность до нецелесообразных уровней.
Ответ 5
Секрет поиска чего-либо в Google заключается в том, чтобы ввести комбинацию поисковых терминов (или цитат из фраз), которые, скорее всего, будут находиться в содержимом, который вы ищете, но вряд ли появляетесь вместе в несвязанном контенте. Подстановочное выражение делает противоположное этому. Просто введите условия, которые вы ожидаете от подстановочного знака, и помните, что Google будет действовать для вас. Еще в те времена, когда компьютеры бегали на парах, у Lycos (iirc) был образец соответствия, но они отключили его несколько лет назад. Я предполагаю, что он загружал слишком много своих серверов.
Ответ 6
Потому что вы не можете разумно получить то, что подразумевается под автомобилем *:
Автомобили?
Ковры?
Морковь?
Алгоритмы Google сравнивают тексты документов, а также внешние входящие ссылки для определения того, что представляет собой документ. С помощью этих подстановочных знаков все эти алгоритмы попадают в нежелательные