Агрегация терминов ElasticSearch
Я пытаюсь выполнить агрегацию терминов, используя эластичный поиск данных ниже со следующим запросом, вывод разбивает имена на токены (см. Вывод ниже). Поэтому я попытался сопоставить os_name как multi_field, и теперь я не могу запросить его. Возможно ли иметь индекс без токенов? например, "Fedora Core"?
запрос:
GET /temp/example/_search
{
"size": 0,
"aggs": {
"OS": {
"terms": {
"field": "os_name"
}
}
}
}
данные:
...
{
"_index": "temp",
"_type": "example",
"_id": "3",
"_score": 1,
"_source": {
"title": "system3",
"os_name": "Fedora Core",
"os_version": 18
}
},
{
"_index": "temp",
"_type": "example",
"_id": "1",
"_score": 1,
"_source": {
"title": "system1",
"os_name": "Fedora Core",
"os_version": 20
}
},
{
"_index": "temp",
"_type": "example",
"_id": "2",
"_score": 1,
"_source": {
"title": "backup",
"os_name": "Yellow Dog",
"os_version": 6
}
}
...
выход:
...
{
"key": "core",
"doc_count": 2
},
{
"key": "fedora",
"doc_count": 2
},
{
"key": "dog",
"doc_count": 1
},
{
"key": "yellow",
"doc_count": 1
}
...
назначение:
PUT /temp
{
"mappings": {
"example": {
"properties": {
"os_name": {
"type": "string"
},
"os_version": {
"type": "long"
},
"title": {
"type": "string"
}
}
}
}
}
2 ответов
На самом деле вы должны изменить свое отображение, как это
"os_name": {
"type": "string",
"fields": {
"raw": {
"type": "string",
"index": "not_analyzed"
}
}
},
и ваш aggs должен быть изменен на:
GET /temp/example/_search
{
"size": 0,
"aggs": {
"OS": {
"terms": {
"field": "os_name.raw"
}
}
}
}
одно из решений, которое будет работать, - установить поле в not_analyzed
(подробнее об этом в документы для атрибута "index").
Это решение не будет анализировать входные данные вообще, в зависимости от ваших требований вы можете установить пользовательский анализатор, например, чтобы не разделить слова, но в нижнем регистре, чтобы получить нечувствительные к регистру результаты.
curl -XDELETE localhost:9200/temp
curl -XPUT localhost:9200/temp -d '
{
"mappings": {
"example": {
"properties": {
"os_name": {
"type": "string",
"index" : "not_analyzed"
},
"os_version": {
"type": "long"
},
"title": {
"type": "string"
}
}
}
}
}'
curl -XPUT localhost:9200/temp/example/1 -d '
{
"title": "system3",
"os_name": "Fedora Core",
"os_version": 18
}'
curl -XPUT localhost:9200/temp/example/2 -d '
{
"title": "system1",
"os_name": "Fedora Core",
"os_version": 20
}'
curl -XPUT localhost:9200/temp/example/3 -d '
{
"title": "backup",
"os_name": "Yellow Dog",
"os_version": 6
}'
curl -XGET localhost:9200/temp/example/_search?pretty=true -d '
{
"size": 0,
"aggs": {
"OS": {
"terms": {
"field": "os_name"
}
}
}
}'
выход:
{
"took" : 1,
"timed_out" : false,
"_shards" : {
"total" : 5,
"successful" : 5,
"failed" : 0
},
"hits" : {
"total" : 3,
"max_score" : 0.0,
"hits" : [ ]
},
"aggregations" : {
"OS" : {
"buckets" : [ {
"key" : "Fedora Core",
"doc_count" : 2
}, {
"key" : "Yellow Dog",
"doc_count" : 1
} ]
}
}
}