Как фильтровать массив объектов по значениям свойств элемента с помощью jq?

мне нравится фильтровать файлы json с помощью jq не:

jq . some.json

учитывая json, содержащий массив объектов:

{
  "theList": [
    {
      "id": 1,
      "name": "Horst"
    },
    {
      "id": 2,
      "name": "Fritz"
    },
    {
      "id": 3,
      "name": "Walter"
    },
    {
      "id": 4,
      "name": "Gerhart"
    },
    {
      "id": 5,
      "name": "Harmut"
    }
  ]
}

Я хочу отфильтровать этот список, чтобы показать только элементы с идентификатором, имеющим значение 2 и 4, поэтому ожидаемый результат:

{
  "id": 2,
  "name": "Fritz"
},
{
  "id": 4,
  "name": "Gerhart"
}

как фильтровать json с помощью jq? Я играл с select и map, но не получил ни одного из них, чтобы работать, например:

$ jq '.theList[] | select(.id == 2) or select(.id == 4)' array.json
true

4 ответов


документы:

jq '.[] | select(.id == "second")' 

вход [{"id": "first", "val": 1}, {"id": "second", "val": 2}]

выход {"id": "second", "val": 2}

Я думаю, что вы можете сделать что-то вроде этого:

jq '.theList[] | select(.id == 2 or .id == 4)' array.json

вы могли бы использовать select внутри map.

.theList | map(select(.id == (2, 4)))

или более компактно:

[ .theList[] | select(.id == (2, 4)) ]

хотя написано таким образом, немного неэффективно, так как выражение дублируется для каждого сравниваемого значения. Он будет более эффективным и, возможно, более читаемым, написанным таким образом:

[ .theList[] | select(any(2, 4; . == .id)) ]

используя select(.id == (2, 4)) здесь, как правило, неэффективно (см. ниже).

если ваш jq имеет IN/1, тогда его можно использовать для достижения более эффективного решения:

.theList[] | select( .id | IN(2,3))

если ваш jq не имеет IN/1, то можно определить его следующим образом:

def IN(s): first(select(s == .)) // false;

эффективность

один из способов увидеть неэффективность-использовать debug. Следующее выражение, например, приводит к 10 вызовам debug, тогда как только 9 проверяет равенство действительно необходимо:

.theList[] | select( (.id == (2,3)) | debug )

["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",true]
{
  "id": 2,
  "name": "Fritz"
}
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",true]
{
  "id": 3,
  "name": "Walter"
}
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",false]

/1

в принципе, используя index/1 должно быть эффективным, но на момент написания (октябрь 2017) его реализация, хотя и быстрая (она написана на C), неэффективна.


вот решение, использующее показатели:

.theList | [ .[map(.id)|indices(2,4)[]] ]