Чтение файла Turtle/N3 RDF с Python

Я пытаюсь закодировать некоторые ботанические данные в Черепаха формат, и прочитайте эти данные из Python, используя RDFLib. Однако у меня проблемы, и я не уверен, потому ли это, что моя черепаха деформирована, или я злоупотребляет RDFLib.

мои тестовые данные:

@PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@PREFIX p: <http://www.myplantdomain.com/plant/description> .
p:description a rdfs:Property .
p:name a rdfs:Property .
p:language a rdfs:Property .
p:value a rdfs:Property .
p:gender a rdfs:Property .
p:inforescence a rdfs:Property .
p:color a rdfs:Property .
p:sense a rdfs:Property .
p:type a rdfs:Property .
p:fruit a rdfs:Property .
p:flower a rdfs:Property .
p:dataSource a rdfs:Property .
p:degree a rdfs:Property .
p:date a rdfs:Property .
p:person a rdfs:Property .
p:c2a7b9a3-c54a-41f5-a3b2-155351b3590f
    p:description [
        p:name [
            p:kingdom "Plantae" ;
            p:division "Pinophyta" ;
            p:class "Pinopsida" ;
            p:order "Pinales" ;
            p:family "Pinaceae" ;
            p:genus "Abies" ;
            p:species "A. alba" ;
            p:language "latin" ;
            p:given_by [
                p:person p:source/Philip_Miller ;
                p:start_date "1923-1-2"^^<http://www.w3.org/2001/XMLSchema#date>
            ]
        ] ;
        p:name [
            p:language "english" ;
            p:value "silver fir"
        ] ;
        p:flower [
            p:gender "male"@en ;
            p:inflorescence "catkin"@en ;
            p:color "brown"@en ;
            p:color "yellow"@en ;
            p:sense "straight"@en
        ] ;
        p:flower [
            p:gender "female"@en ;
            p:inflorescence "catkin"@en ;
            p:color "pink"@en ;
            p:color "yellow"@en ;
            p:sense "straight"@en
        ] ;
        p:fruit [
            p:type "cone"@en ;
            p:color "brown"@en
        ]
    ] .

и мой Python-это:

import rdflib
g = rdflib.Graph()
#result = g.parse('trees.ttl') 
#result = g.parse('trees.ttl', format='ttl')
result = g.parse('trees.ttl', format='n3')
print len(g)
for stmt in g:
    print stmt

что дает мне ошибки:

ValueError: Found @PREFIX when expecting a http://www.w3.org/2000/10/swap/grammar/n3#document . todoStack=[['http://www.w3.org/2000/10/swap/grammar/n3#document', []]]

Я пробовал изменять параметры parse (), но все это дает мне ошибку. Я почти не нашел примеров того, как разбирать черепаху. Что я делаю не так?

1 ответов


Я думаю, что первая проблема-это w / the верхний PREFIX-- Если вы заглавными буквами тех, он получает мимо этой точки. Не уверен, что это ошибка в rdflib или в черепахе .ttl, а Валидатор Черепаха онлайн демо, кажется, согласен, что это проблема с .ttl (говорит Validation failed: The @PREFIX directive is not supported, line 1 col 0. но эта проблема исчезнет, если вы поместите их в нижний регистр).

как только вы прошли это препятствие, ни парсер не любит часть вокруг p:given_by [:"ожидается плохой синтаксис (' ]') в ^ in:"... per rdflib; Turtle Validator говорит

Validation failed: Expecting a period, semicolon, comma, close-bracket, or close-brace but found '/', line 31 col 33.

поэтому он особенно не любит p:source/Philip_Miller часть.

из этих двух вопросов (кто знает, есть ли другие...!) Я думаю, вы можете заключить, что этот источник N3 (.ttl файл, который вы публикуете) сломан, и обратите внимание на любую систему составила этот файл в первую очередь, и почему он делает его таким многократно сломанным способом.