Подсчитайте различные значения, используя elasticsearch
Я изучаю эластичный поиск и хотел бы подсчитать разные значения. Пока я могу считать значения, но не разные.
Вот пример данных:
curl http://localhost:9200/store/item/ -XPOST -d '{
"RestaurantId": 2,
"RestaurantName": "Restaurant Brian",
"DateTime": "2013-08-16T15:13:47.4833748+01:00"
}'
curl http://localhost:9200/store/item/ -XPOST -d '{
"RestaurantId": 1,
"RestaurantName": "Restaurant Cecil",
"DateTime": "2013-08-16T15:13:47.4833748+01:00"
}'
curl http://localhost:9200/store/item/ -XPOST -d '{
"RestaurantId": 1,
"RestaurantName": "Restaurant Cecil",
"DateTime": "2013-08-16T15:13:47.4833748+01:00"
}'
И что я пробовал до сих пор:
curl -XPOST "http://localhost:9200/store/item/_search" -d '{
"size": 0,
"aggs": {
"item": {
"terms": {
"field": "RestaurantName"
}
}
}
}'
Вывод:
{
"took": 0,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 3,
"max_score": 0.0,
"hits": []
},
"aggregations": {
"item": {
"buckets": [
{
"key": "restaurant",
"doc_count": 3
},
{
"key": "cecil",
"doc_count": 2
},
{
"key": "brian",
"doc_count": 1
}
]
}
}
}
Как я могу получить счетчик cecil
как 1 вместо 2
Ответы
Ответ 1
Вы должны использовать параметр кардинальности, упомянутый @coder, который вы можете найти в документе.
$ curl -XGET "http://localhost:9200/store/item/_search" -d'
{
"aggs" : {
"restaurant_count" : {
"cardinality" : {
"field" : "RestaurantName",
"precision_threshold": 100,
"rehash": false
}
}
}
}'
Это сработало для меня...
Ответ 2
Использование может использовать мощность здесь: http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/search-aggregations-metrics-cardinality-aggregation.html
Ответ 3
Нет поддержки для отдельного подсчета в ElasticSearch, хотя существует не детерминированный подсчет. В результате используйте агрегирование терминов и счетчиков. См. Граф, отличный от эластичного поиска вопрос.