Cloud Vision API - PDF OCR

Я только что протестировал API Google Cloud Vision для чтения текста, если он существует, в изображении.

до сих пор я устанавливал сервер Maven и сервер Redis. Я просто следую инструкциям на этой странице.

https://github.com/GoogleCloudPlatform/cloud-vision/tree/master/java/text

до сих пор я смог протестировать.jpg-файлы, можно ли это сделать с помощью TIFF-файлов или pdf??

Я использую следующие команда:

java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar     com.google.cloud.vision.samples.text.TextApp ../../data/text/

внутри текстового каталога у меня есть файлы в формате jpg.

затем, чтобы прочитать преобразованный файл, я не знаю, как это сделать, просто я запускаю следующую команду

java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp

и я получаю сообщение введите слово или фразу для поиска в преобразованных файлов. Есть ли способ увидеть весь документ преобразованным?

спасибо!

3 ответов


к сожалению, форматы PDF и TIFF в настоящее время не поддерживаются для Cloud Vision.

принятые форматы: (взяты из doc)

  • в формате JPEG
  • обычного PNG8
  • PNG24
  • GIF
  • анимированный GIF (только первый кадр)
  • BMP
  • файлы WebP
  • RAW
  • ICO

https://cloud.google.com/vision/docs/pdf

Я знаю, что этот вопрос старый, но теперь Google Vision выпустила поддержку PDF!


On 6 апреля 2018 поддержка PDF и TIFF файлы в обнаружении текста документа был добавлен в Google Cloud Vision API (см. Заметки).

по данным документация:

  • API Vision может обнаруживать и транскрибировать текст из PDF и TIFF файлы, хранящиеся в Google Cloud Storage.

  • обнаружение текста документа из PDF и TIFF должно быть запрошено с помощью asyncBatchAnnotate функция, которую выполняет асинхронный запрос и предоставляет свой статус, используя операционные ресурсы.

  • выход из запроса PDF/TIFF записывается в файл JSON, созданный в указанном Google Cloud Storage bucket.

пример:

1) Загрузите файл в Google Cloud Хранение

enter image description here

2) сделайте запрос POST для выполнения обнаружения текста документа PDF/TIFF

запрос:

POST https://vision.googleapis.com/v1p2beta1/files:asyncBatchAnnotate
Authorization: Bearer <your access token>

{
  "requests":[
    {
      "inputConfig": {
        "gcsSource": {
          "uri": "gs://<your bucket name>/input.pdf"
        },
        "mimeType": "application/pdf"
      },
      "features": [
        {
          "type": "DOCUMENT_TEXT_DETECTION"
        }
      ],
      "outputConfig": {
        "gcsDestination": {
          "uri": "gs://<your bucket name>/output/"
        },
        "batchSize": 1
      }
    }
  ]
}

ответ:

{
  "name": "operations/9b1f9d773d216406"
}

3) сделайте запрос GET, чтобы проверить, если обнаружение текста документа сделано

запрос:

GET https://vision.googleapis.com/v1/operations/9b1f9d773d216406
Authorization: Bearer <your access token>

ответ:

{
    "name": "operations/9b1f9d773d216406",
    "metadata": {
        "@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.OperationMetadata",
        "state": "RUNNING",
        "updateTime": "2018-06-17T20:18:09.117787733Z"
    },
    "done": true,
    "response": {
        "@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.AsyncBatchAnnotateFilesResponse",
        "responses": [
            {
                "outputConfig": {
                    "gcsDestination": {
                        "uri": "gs://<your bucket name>/output/"
                    },
                    "batchSize": 1
                }
            }
        ]
    }
}

4) проверьте результаты в указанном Google Cloud Storage папка

enter image description here