группа в mongo, исключая значения null

у меня есть запрос mongo, который выполняет групповую операцию над документами.

я почти получил ожидаемые результаты, за исключением того, что я хочу уточнить результаты без пустых или нулевых значений.

В настоящее время мой запрос выглядит так:

db.productMetadata.aggregate([{$group:{"_id":{"color":"$productAttribute.colour","gender":"$productAttribute.gender"},"count" : {$sum : 1}}}]);

и результаты выглядят примерно так:

{ "_id" : { "color" : "BLUE", "gender" : "MEN" }, "count" : 1 }
{ "_id" : {  }, "count" : 4 }
{ "_id" : { "color" : "NA", "gender" : "WOMEN" }, "count" : 1 }
{ "_id" : { "color" : "BLACK", "gender" : "MEN" }, "count" : 1 }
{ "_id" : { "color" : "BROWN", "gender" : "WOMEN" }, "count" : 1 }
{ "_id" : { "gender" : "MEN" }, "count" : 2 }
{ "_id" : { "color" : "BEIGE", "gender" : "MEN" }, "count" : 1 }
{ "_id" : { "color" : "BROWN", "gender" : "MEN" }, "count" : 1 }

Я хочу удалить строки, если какое-либо из значений группы по полю пусто или равно null в фактических данных БД.

исключенные результаты должно выглядеть примерно так:

{ "_id" : { "color" : "BLUE", "gender" : "MEN" }, "count" : 1 }
{ "_id" : { "color" : "NA", "gender" : "WOMEN" }, "count" : 1 }
{ "_id" : { "color" : "BLACK", "gender" : "MEN" }, "count" : 1 }
{ "_id" : { "color" : "BROWN", "gender" : "WOMEN" }, "count" : 1 }
{ "_id" : { "color" : "BEIGE", "gender" : "MEN" }, "count" : 1 }
{ "_id" : { "color" : "BROWN", "gender" : "MEN" }, "count" : 1 }

2 ответов


вам нужно дополнительный $match шаг конвейера, который будет фильтровать входящие документы на основе встроенного поля "$productAttribute.colour" существующий и не null:

db.productMetadata.aggregate([
    {
        "$match": {
            "productAttribute.colour": { "$exists": true, "$ne": null }
        }
    },
    {
        $group:{
            "_id": {
                "color": "$productAttribute.colour",
                "gender": "$productAttribute.gender"
            },
            "count": {
                $sum : 1
            }
        }
    }        
]);

Возможно, вам следует использовать $match: {'color': {$exists: true}} перед операцией $group. С sparse index он будет работать довольно быстро. И вообще не храните поля "null" в коллекциях, что уменьшит размер БД и увеличит скорость поиска для редкие индексы (меньше документов в индексе -> больше скорость)