Распознавание именованных сущностей в Spacy

Я пытаюсь найти именованные сущности для предложения, как показано ниже

import spacy.lang.en
parser = spacy.lang.en.English()
ParsedSentence = parser(u"Alphabet is a new startup in China")
for Entity in  ParsedSentence.ents:  
    print (Entity.label, Entity.label_, ' '.join(t.orth_ for t in Entity))

Я ожидаю получить результат "алфавит", "Китай", но в результате я получаю пустой набор. Что я здесь делаю не так?--2-->

1 ответов


согласно spacy документация для распознавания сущности имени вот способ извлечения сущности имени

import spacy
nlp = spacy.load('en') # install 'en' model (python3 -m spacy download en)
doc = nlp("Alphabet is a new startup in China")
print('Name Entity: {0}'.format(doc.ents))

результат
Name Entity: (China,)
Чтобы " алфавит "был идентифицирован как название компании, добавьте" The "перед ним, поэтому он будет идентифицирован как "существительное"

doc = nlp("The Alphabet is a new startup in China")
print('Name Entity: {0}'.format(doc.ents))

Name Entity: (Alphabet, China)