Обобщенная реализация Java-дерева суффикса

Я ищу реализацию Java обобщенного дерева суффикса (GST) со следующими функциями:

После создания GST из 1000 строк я хотел бы узнать, сколько из этих 1000 строк содержит некоторые другие строки '.

Поиск должен быть тихим быстро, так как мне нужно применить поиск примерно на 100 000 строк-кандидатов средней длины 10.

Ответы

Ответ 3

Я создал дерево суффиксов в Java, которое позволяет вам легко добавлять собственные функции поиска и другие алгоритмы сопоставления. Мой блог, Суффикс Деревья в Java, содержит обзор, а также инструкции по загрузке последней версии. Моя реализация Java основана на Mark Nelson Быстрый поиск строк с деревьями суффикса.

Обновление 2016-06-18