Автозаполнение с использованием Hibernate Search
Я пытаюсь создать лучшую функцию автозаполнения для своего веб-сайта. Я хочу использовать Hibernate Search для этого, но, насколько я экспериментировал, он находит только полные слова для меня.
Итак, мой вопрос: можно ли искать только некоторые символы?
например. пользователь вводит 3 буквы и использует поиск в спящем режиме, чтобы показать ему все слова моих объектов db, которые содержат эти 3 буквы?
PS. прямо сейчас я использую "подобный" запрос для этого... но мой db вырос много, и я хочу также расширить функциональность поиска по сравнению с другими таблицами...
Ответы
Ответ 1
Вы можете индексировать это поле, используя NGramFilter, как предложено здесь. Для достижения наилучших результатов вы должны использовать EdgeNgramFilter от Apache Solr, который создает ngrams с начала края термина и может использоваться в режиме спящего режима в качестве хорошо.
Ответ 2
Основное изменение
Через год я смог улучшить исходный код, который я опубликовал, чтобы создать это:
Мой проиндексированный объект:
@Entity
@Indexed
@AnalyzerDef(name = "myanalyzer",
// Split input into tokens according to tokenizer
tokenizer = @TokenizerDef(factory = WhitespaceTokenizerFactory.class), //
filters = { //
// Normalize token text to lowercase, as the user is unlikely to care about casing when searching for matches
@TokenFilterDef(factory = LowerCaseFilterFactory.class),
// Index partial words starting at the front, so we can provide Autocomplete functionality
@TokenFilterDef(factory = NGramFilterFactory.class, params = { @Parameter(name = "maxGramSize", value = "1024") }),
// Close filters & Analyzerdef
})
@Analyzer(definition = "myanalyzer")
public class Compound extends DomainObject {
public static String[] getSearchFields(){...}
...
}
Все @Field
обозначаются и сохраняются в индексе; требуется для этого:
@Field(index = Index.TOKENIZED, store = Store.YES)
@Transactional(readOnly = true)
public synchronized List<String> getSuggestions(final String searchTerm) {
// Compose query for term over all fields in Compound
String lowerCasedSearchTerm = searchTerm.toLowerCase();
// Create a fullTextSession for the sessionFactory.getCurrentSession()
FullTextSession fullTextSession = Search.getFullTextSession(getSession());
// New DSL based query composition
SearchFactory searchFactory = fullTextSession.getSearchFactory();
QueryBuilder buildQuery = searchFactory.buildQueryBuilder().forEntity(Compound.class).get();
TermContext keyword = buildQuery.keyword();
WildcardContext wildcard = keyword.wildcard();
String[] searchfields = Compound.getSearchfields();
TermMatchingContext onFields = wildcard.onField(searchfields[0]);
for (int i = 1; i < searchfields.length; i++)
onFields.andField(searchfields[i]);
TermTermination matching = onFields.matching(input.toLowerCase());
Query query = matching.createQuery();
// Convert the Search Query into something that provides results: Specify Compound again to be future proof
FullTextQuery fullTextQuery = fullTextSession.createFullTextQuery(query, Compound.class);
fullTextQuery.setMaxResults(20);
// Projection does not work on collections or maps which are indexed via @IndexedEmbedded
List<String> projectedFields = new ArrayList<String>();
projectedFields.add(ProjectionConstants.DOCUMENT);
List<String> embeddedFields = new ArrayList<String>();
for (String fieldName : searchfields)
if (fieldName.contains("."))
embeddedFields.add(fieldName);
else
projectedFields.add(fieldName);
@SuppressWarnings("unchecked")
List<Object[]> results = fullTextQuery.setProjection(projectedFields.toArray(new String[projectedFields.size()])).list();
// Keep a list of suggestions retrieved by search over all fields
List<String> suggestions = new ArrayList<String>();
for (Object[] projectedObjects : results) {
// Retrieve the search suggestions for the simple projected field values
for (int i = 1; i < projectedObjects.length; i++) {
String fieldValue = projectedObjects[i].toString();
if (fieldValue.toLowerCase().contains(lowerCasedSearchTerm))
suggestions.add(fieldValue);
}
// Extract the search suggestions for the embedded fields from the document
Document document = (Document) projectedObjects[0];
for (String fieldName : embeddedFields)
for (Field field : document.getFields(fieldName))
if (field.stringValue().toLowerCase().contains(lowerCasedSearchTerm))
suggestions.add(field.stringValue());
}
// Return the composed list of suggestions, which might be empty
return suggestions;
}
Там некоторые пререкания, которые я делаю в конце, обрабатывают поля @IndexedEmbedded. Если у вас их нет, вы можете просто упростить код, просто проецируя searchFields, а также не обрабатывая документ и встроенную обработку.
Как и раньше:
Надеюсь, это полезно для следующего человека, чтобы встретить этот вопрос. Если у кого-нибудь есть какие-либо критические замечания или улучшения в вышеприведенном коде, не стесняйтесь редактировать и делать, пожалуйста, дайте мне знать.
Edit3: проект, с которого был взят код, с тех пор был открыт; Вот соответствующие классы:
https://trac.nbic.nl/metidb/browser/trunk/metidb/metidb-core/src/main/java/org/metidb/domain/Compound.java
https://trac.nbic.nl/metidb/browser/trunk/metidb/metidb-core/src/main/java/org/metidb/dao/CompoundDAOImpl.java
https://trac.nbic.nl/metidb/browser/trunk/metidb/metidb-search/src/main/java/org/metidb/search/text/Autocompleter.java
Ответ 3
Ответ Тима блестящий и помог мне преодолеть трудную часть. Он работал только для одного запроса слова для меня. В случае, если кто-то хочет, чтобы он работал для поиска фразы. Просто замените все экземпляры "Term" соответствующими классами "Фраза". Вот строки замены для кода Tim, которые сделали трюк для меня.
// New DSL based query composition
//org.hibernate.search.query.dsl
SearchFactory searchFactory = fullTextSession.getSearchFactory();
QueryBuilder buildQuery = searchFactory.buildQueryBuilder().forEntity(MasterDiagnosis.class).get();
PhraseContext keyword = buildQuery.phrase();
keyword.withSlop(3);
//WildcardContext wildcard = keyword.wildcard();
String[] searchfields = MasterDiagnosis.getSearchfields();
PhraseMatchingContext onFields = keyword.onField(searchfields[0]);
for (int i = 1; i < searchfields.length; i++)
onFields.andField(searchfields[i]);
PhraseTermination matching = onFields.sentence(lowerCasedSearchTerm);
Query query = matching.createQuery();
// Convert the Search Query into something that provides results: Specify Compound again to be future proof