Группировка в простой топологии агрегационной шторма

Я пытаюсь написать топологию, которая делает следующее:

На самом деле я хочу сделать еще немного обработки в коллекции.

Я тестировал его локально и выглядел так, как будто он работает. Тем не менее, я не уверен, правильно ли я установил группировки на болтах, и если это будет корректно работать при развертывании в реальном кластере штормов. Я был бы признателен, если кто-то сможет помочь в рассмотрении этой топологии и предложить любые ошибки, изменения или улучшения.

Ответы

Ответ 1

Из того, что я вижу, это выглядит хорошо. Дьявол в деталях. Я не уверен, что делает ваш агрегатор, но если он делает какие-либо предположения о передаваемых значениях, то вы должны рассмотреть соответствующую группировку полей. Это может не сделать такой большой разницы, поскольку вы используете подсказку по умолчанию parallelism 1, но если вы решите масштабировать с помощью нескольких экземпляров совокупного болта, то подразумеваемые логические допущения, которые вы делаете, могут потребовать группировку без тасования.

Ответ 2

Привет, как только вы пытаетесь подписаться на несколько ключевых слов, вы столкнетесь с проблемами. Я предлагаю, чтобы ваш носик также испускал исходное ключевое слово, которое было использовано для фильтрации.

Затем вместо того, чтобы делать shuffleGrouping, я бы сделал fieldGrouping

builder.setBolt("sampleaggregate", new SampleAggregatorBolt())
            .shuffleGrouping("spout", new Fields("keyword"));

Таким образом, вы убедитесь, что результаты одного ключевого слова попадают на один и тот же болт каждый раз. Таким образом, вы можете правильно вычислить агрегаты. Если вы опускаете поля Grouping Storm, можете создать экземпляр любого количества вашего совокупного болта и отправить любые сообщения от носика в любой экземпляр совокупного болта, который в конечном итоге привел бы к неправильным результатам.