группа в mongo, исключая значения null
у меня есть запрос mongo, который выполняет групповую операцию над документами.
я почти получил ожидаемые результаты, за исключением того, что я хочу уточнить результаты без пустых или нулевых значений.
В настоящее время мой запрос выглядит так:
db.productMetadata.aggregate([{$group:{"_id":{"color":"$productAttribute.colour","gender":"$productAttribute.gender"},"count" : {$sum : 1}}}]);
и результаты выглядят примерно так:
{ "_id" : { "color" : "BLUE", "gender" : "MEN" }, "count" : 1 }
{ "_id" : { }, "count" : 4 }
{ "_id" : { "color" : "NA", "gender" : "WOMEN" }, "count" : 1 }
{ "_id" : { "color" : "BLACK", "gender" : "MEN" }, "count" : 1 }
{ "_id" : { "color" : "BROWN", "gender" : "WOMEN" }, "count" : 1 }
{ "_id" : { "gender" : "MEN" }, "count" : 2 }
{ "_id" : { "color" : "BEIGE", "gender" : "MEN" }, "count" : 1 }
{ "_id" : { "color" : "BROWN", "gender" : "MEN" }, "count" : 1 }
Я хочу удалить строки, если какое-либо из значений группы по полю пусто или равно null в фактических данных БД.
исключенные результаты должно выглядеть примерно так:
{ "_id" : { "color" : "BLUE", "gender" : "MEN" }, "count" : 1 }
{ "_id" : { "color" : "NA", "gender" : "WOMEN" }, "count" : 1 }
{ "_id" : { "color" : "BLACK", "gender" : "MEN" }, "count" : 1 }
{ "_id" : { "color" : "BROWN", "gender" : "WOMEN" }, "count" : 1 }
{ "_id" : { "color" : "BEIGE", "gender" : "MEN" }, "count" : 1 }
{ "_id" : { "color" : "BROWN", "gender" : "MEN" }, "count" : 1 }
2 ответов
вам нужно дополнительный $match
шаг конвейера, который будет фильтровать входящие документы на основе встроенного поля "$productAttribute.colour"
существующий и не null:
db.productMetadata.aggregate([
{
"$match": {
"productAttribute.colour": { "$exists": true, "$ne": null }
}
},
{
$group:{
"_id": {
"color": "$productAttribute.colour",
"gender": "$productAttribute.gender"
},
"count": {
$sum : 1
}
}
}
]);
Возможно, вам следует использовать $match: {'color': {$exists: true}} перед операцией $group. С sparse index он будет работать довольно быстро. И вообще не храните поля "null" в коллекциях, что уменьшит размер БД и увеличит скорость поиска для редкие индексы (меньше документов в индексе -> больше скорость)