Как превратить список во вложенный dict в Python

нужно повернуть x:

X = [['A', 'B', 'C'], ['A', 'B', 'D']]

В Y:

Y = {'A': {'B': {'C','D'}}}

более конкретно, мне нужно создать дерево папок и файлов из списка абсолютные пути, который выглядит так:

paths = ['xyz/123/file.txt', 'abc/456/otherfile.txt']

где, каждый путь split("/") на ['A', 'B', 'C'] в Примере псевдо.

поскольку это представляет файлы и папки, очевидно, на том же уровне (индекс массива) одноименные строки не могут повторяться.

4 ответов


X = [['A', 'B', 'C'], ['A', 'B', 'D'],['W','X'],['W','Y','Z']]
d = {}

for path in X:
    current_level = d
    for part in path:
        if part not in current_level:
            current_level[part] = {}
        current_level = current_level[part]

это оставляет нас с D, содержащей {'A': {'B': {'C': {}, 'D': {}}}, 'W': {'Y': {'Z': {}}, 'X': {}}}. Любой элемент, содержащий пустой словарь, является либо файлом, либо пустым каталогом.


предполагая, что {'C', 'D'} означает set(['C', 'D']) и Ваша версия Python поддерживает dict comprehension и set comprehension, вот уродливое, но рабочее решение:

>>> tr = [[1, 2, 3], [1, 2, 4], [5, 6, 7]]
>>> {a[0]: {b[1]: {c[2] for c in [y for y in tr if y[1] == b[1]]} for b in [x for x in tr if x[0] == a[0]]} for a in tr}
{1: {2: set([3, 4])}, 5: {6: set([7])}}

что касается вашего примера:

>>> X = [['A', 'B', 'C'], ['A', 'B', 'D']]
>>> {a[0]: {b[1]: {c[2] for c in [y for y in X if y[1] == b[1]]} for b in [x for x in X if x[0] == a[0]]} for a in X}
{'A': {'B': set(['C', 'D'])}}

но, пожалуйста, не используйте его в реальных приложениях :)

обновление: вот один, который работает с произвольными глубинами:

>>> def todict(lst, d=0):
...     print lst, d
...     if d > len(lst):
...         return {}
...     return {a[d]: todict([x for x in X if x[d] == a[d]], d+1) for a in lst}
...
>>> todict(X)
{'A': {'B': {'C': {}, 'D': {}}}}

Это должно быть довольно близко к тому, что вам нужно:

def path_to_dict(path):
    parts = path.split('/')

    def pack(parts):
        if len(parts) == 1:
            return parts
        elif len(parts):
            return {parts[0]: pack(parts[1:])}
        return parts

    return pack(parts)

if __name__ == '__main__':
    paths = ['xyz/123/file.txt', 'abc/456/otherfile.txt']
    for path in paths:
        print '%s -> %s' % (path, path_to_dict(path))

результаты:

xyz/123/file.txt -> {'xyz': {'123': ['file.txt']}}
abc/456/otherfile.txt -> {'abc': {'456': ['otherfile.txt']}}

в вашей постановке проблемы есть логическая несогласованность. Если ты действительно хочешь ... ['xyz/123/file.txt', 'abc/456/otherfile.txt']

изменить на {'xyz': {'123': 'file.txt}, 'abc': {'456': 'otherfile.txt'}}

тогда вы должны ответить, как путь ' abc.txt ' без ведущей папки будет вставлен в эту структуру данных. Будет ли ключ словаря верхнего уровня пустой строкой ''?