Чтение файла Turtle/N3 RDF с Python
Я пытаюсь закодировать некоторые ботанические данные в Черепаха формат, и прочитайте эти данные из Python, используя RDFLib. Однако у меня проблемы, и я не уверен, потому ли это, что моя черепаха деформирована, или я злоупотребляет RDFLib.
мои тестовые данные:
@PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@PREFIX p: <http://www.myplantdomain.com/plant/description> .
p:description a rdfs:Property .
p:name a rdfs:Property .
p:language a rdfs:Property .
p:value a rdfs:Property .
p:gender a rdfs:Property .
p:inforescence a rdfs:Property .
p:color a rdfs:Property .
p:sense a rdfs:Property .
p:type a rdfs:Property .
p:fruit a rdfs:Property .
p:flower a rdfs:Property .
p:dataSource a rdfs:Property .
p:degree a rdfs:Property .
p:date a rdfs:Property .
p:person a rdfs:Property .
p:c2a7b9a3-c54a-41f5-a3b2-155351b3590f
p:description [
p:name [
p:kingdom "Plantae" ;
p:division "Pinophyta" ;
p:class "Pinopsida" ;
p:order "Pinales" ;
p:family "Pinaceae" ;
p:genus "Abies" ;
p:species "A. alba" ;
p:language "latin" ;
p:given_by [
p:person p:source/Philip_Miller ;
p:start_date "1923-1-2"^^<http://www.w3.org/2001/XMLSchema#date>
]
] ;
p:name [
p:language "english" ;
p:value "silver fir"
] ;
p:flower [
p:gender "male"@en ;
p:inflorescence "catkin"@en ;
p:color "brown"@en ;
p:color "yellow"@en ;
p:sense "straight"@en
] ;
p:flower [
p:gender "female"@en ;
p:inflorescence "catkin"@en ;
p:color "pink"@en ;
p:color "yellow"@en ;
p:sense "straight"@en
] ;
p:fruit [
p:type "cone"@en ;
p:color "brown"@en
]
] .
и мой Python-это:
import rdflib
g = rdflib.Graph()
#result = g.parse('trees.ttl')
#result = g.parse('trees.ttl', format='ttl')
result = g.parse('trees.ttl', format='n3')
print len(g)
for stmt in g:
print stmt
что дает мне ошибки:
ValueError: Found @PREFIX when expecting a http://www.w3.org/2000/10/swap/grammar/n3#document . todoStack=[['http://www.w3.org/2000/10/swap/grammar/n3#document', []]]
Я пробовал изменять параметры parse (), но все это дает мне ошибку. Я почти не нашел примеров того, как разбирать черепаху. Что я делаю не так?
1 ответов
Я думаю, что первая проблема-это w / the верхний PREFIX
-- Если вы заглавными буквами тех, он получает мимо этой точки. Не уверен, что это ошибка в rdflib или в черепахе .ttl
, а Валидатор Черепаха онлайн демо, кажется, согласен, что это проблема с .ttl
(говорит Validation failed: The @PREFIX directive is not supported, line 1 col 0.
но эта проблема исчезнет, если вы поместите их в нижний регистр).
как только вы прошли это препятствие, ни парсер не любит часть вокруг p:given_by [
:"ожидается плохой синтаксис (' ]') в ^ in:"... per rdflib; Turtle Validator говорит
Validation failed: Expecting a period, semicolon, comma, close-bracket, or close-brace but found '/', line 31 col 33.
поэтому он особенно не любит p:source/Philip_Miller
часть.
из этих двух вопросов (кто знает, есть ли другие...!) Я думаю, вы можете заключить, что этот источник N3 (.ttl
файл, который вы публикуете) сломан, и обратите внимание на любую систему составила этот файл в первую очередь, и почему он делает его таким многократно сломанным способом.