Извлечь подмножество пар ключ-значение из объекта словаря Python?

У меня есть большой объект словаря, который имеет несколько пар ключ-значение (около 16), но меня интересуют только 3 из них. Каков наилучший способ (самый короткий/эффективный/элегантный) для достижения этого?

лучшее, что я знаю:

bigdict = {'a':1,'b':2,....,'z':26} 
subdict = {'l':bigdict['l'], 'm':bigdict['m'], 'n':bigdict['n']}

Я уверен, что есть более элегантный способ, чем этот. Идеи?

9 ответов


вы можете попробовать:

dict((k, bigdict[k]) for k in ('l', 'm', 'n'))

... или в Python 3 Python версии 2.7 или более поздней версии (спасибо Фабио Диниз для указания на то, что он работает в 2.7 тоже):

{k: bigdict[k] for k in ('l', 'm', 'n')}

Обновление: As Håvard S указывает, я предполагаю, что вы знаете, что ключи будут в словаре-см. ответ если вы не в состоянии сделать такое предположение. Альтернативно, как тимбо указывает в комментариях, если вы хотите ключ, который отсутствует в bigdict на карте None, вы можете сделать:

{k: bigdict.get(k, None) for k in ('l', 'm', 'n')}

если вы используете Python 3, и вы только хотите, чтобы ключи в новом dict, которые фактически существуют в исходном, вы можете использовать тот факт, что объекты view реализуют некоторые операции набора:

{k: bigdict[k] for k in bigdict.keys() & {'l', 'm', 'n'}}

немного короче, по крайней мере:

wanted_keys = ['l', 'm', 'n'] # The keys you want
dict((k, bigdict[k]) for k in wanted_keys if k in bigdict)

interesting_keys = ('l', 'm', 'n')
subdict = {x: bigdict[x] for x in interesting_keys if x in bigdict}

этот ответ использует понимание словаря, подобное выбранному ответу, но не будет за исключением отсутствующего элемента.

версия python 2:

{k:v for k, v in bigDict.iteritems() if k in ('l', 'm', 'n')}

версия python 3:

{k:v for k, v in bigDict.items() if k in ('l', 'm', 'n')}

немного сравнения скорости для всех упомянутых методов:

Python 2.7.11 |Anaconda 2.4.1 (64-bit)| (default, Jan 29 2016, 14:26:21) [MSC v.1500 64 bit (AMD64)] on win32
In[2]: import numpy.random as nprnd
keys = nprnd.randint(1000, size=10000)
bigdict = dict([(_, nprnd.rand()) for _ in range(1000)])

%timeit {key:bigdict[key] for key in keys}
%timeit dict((key, bigdict[key]) for key in keys)
%timeit dict(map(lambda k: (k, bigdict[k]), keys))
%timeit dict(filter(lambda i:i[0] in keys, bigdict.items()))
%timeit {key:value for key, value in bigdict.items() if key in keys}
100 loops, best of 3: 3.09 ms per loop
100 loops, best of 3: 3.72 ms per loop
100 loops, best of 3: 6.63 ms per loop
10 loops, best of 3: 20.3 ms per loop
100 loops, best of 3: 20.6 ms per loop

Как и ожидалось: словарные понимания-лучший вариант.


может быть:

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n']])

Python 3 даже поддерживает следующее:

subdict={a:bigdict[a] for a in ['l','m','n']}

обратите внимание, что вы можете проверить на наличие в словаре следующим образом:

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n'] if x in bigdict])

респ. для python 3

subdict={a:bigdict[a] for a in ['l','m','n'] if a in bigdict}

вы также можете использовать map (который является очень полезная функция, чтобы узнать в любом случае):

sd = dict(map(lambda k: (k, l.get(k, None)), l))

пример:

large_dictionary = {'a1':123, 'a2':45, 'a3':344} list_of_keys = ['a1', 'a3'] small_dictionary = dict(map(lambda key: (key, large_dictionary.get(key, None)), list_of_keys))

PS. Я одолжил .получить (ключ, нет) из предыдущего ответа:)


хорошо, это то, что беспокоило меня несколько раз, так что спасибо Джаеш за то, что спросил.

ответы выше кажутся таким же хорошим решением, как и любые, но если вы используете это во всем своем коде, имеет смысл обернуть функциональность IMHO. Кроме того, здесь возможны два варианта использования: один, где вы заботитесь о том, все ли ключевые слова находятся в исходном словаре. и там, где ты этого не делаешь. Было бы неплохо относиться к обоим одинаково.

Итак, за мои два Пенни стоит, я предлагаю написать подкласс словаря, например

class my_dict(dict):
    def subdict(self, keywords, fragile=False):
        d = {}
        for k in keywords:
            try:
                d[k] = self[k]
            except KeyError:
                if fragile:
                    raise
        return d

Теперь вы можете вытащить под-словарь с

orig_dict.subdict(keywords)

примеры использования:

#
## our keywords are letters of the alphabet
keywords = 'abcdefghijklmnopqrstuvwxyz'
#
## our dictionary maps letters to their index
d = my_dict([(k,i) for i,k in enumerate(keywords)])
print('Original dictionary:\n%r\n\n' % (d,))
#
## constructing a sub-dictionary with good keywords
oddkeywords = keywords[::2]
subd = d.subdict(oddkeywords)
print('Dictionary from odd numbered keys:\n%r\n\n' % (subd,))
#
## constructing a sub-dictionary with mixture of good and bad keywords
somebadkeywords = keywords[1::2] + 'A'
try:
    subd2 = d.subdict(somebadkeywords)
    print("We shouldn't see this message")
except KeyError:
    print("subd2 construction fails:")
    print("\toriginal dictionary doesn't contain some keys\n\n")
#
## Trying again with fragile set to false
try:
    subd3 = d.subdict(somebadkeywords, fragile=False)
    print('Dictionary constructed using some bad keys:\n%r\n\n' % (subd3,))
except KeyError:
    print("We shouldn't see this message")

Если вы запустите весь приведенный выше код, вы увидите (что-то вроде) следующий вывод (извините за форматирование):

оригинальный словарь:
{"a": 0, "c": 2, "b": 1, "e": 4, "d": 3, "g": 6, "f": 5, "i": 8, "h": 7, "k": 10, "j": 9, "m": 12, "l": 11, 'o': 14, 'n': 13, 'q': 16, 'p': 15, 's': 18, 'r': 17, 'u': 20, "t": 19, "w": 22, "v": 21, "y": 24, "x": 23, "z": 25}

словарь из нечетных нумерованных ключей:
{"a": 0, "c": 2, "e": 4, "g": 6, "i": 8, "k": 10, "m": 12, "o": 14, "q": 16, "s": 18, "u": 20, "w": 22, "y": 24}

subd2 работ не удается:
оригинальный словарь не содержит некоторых ключей

словарь, построенный с использованием некоторых плохие ключи:
{'b': 1, 'd': 3, 'f': 5, 'h': 7, 'j': 9, 'l': 11, 'n': 13, 'p': 15, 'r': 17, 't': 19, 'v': 21, 'x': 23, 'z': 25}


еще один (я предпочитаю ответить Марк Longair х)

di = {'a':1,'b':2,'c':3}
req = ['a','c','w']
dict([i for i in di.iteritems() if i[0] in di and i[0] in req])