Cloud Vision API - PDF OCR

Question

Cloud Vision API - PDF OCR

Я только что протестировал API Google Cloud Vision для чтения текста, если он существует, в изображении.

до сих пор я устанавливал сервер Maven и сервер Redis. Я просто следую инструкциям на этой странице.

https://github.com/GoogleCloudPlatform/cloud-vision/tree/master/java/text

до сих пор я смог протестировать.jpg-файлы, можно ли это сделать с помощью TIFF-файлов или pdf??

Я использую следующие команда:

java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar     com.google.cloud.vision.samples.text.TextApp ../../data/text/

внутри текстового каталога у меня есть файлы в формате jpg.

затем, чтобы прочитать преобразованный файл, я не знаю, как это сделать, просто я запускаю следующую команду

java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp

и я получаю сообщение введите слово или фразу для поиска в преобразованных файлов. Есть ли способ увидеть весь документ преобразованным?

спасибо!

9

google-cloud-vision

автор: Christian Salvador

3 ответов

автор: uzerzero · Accepted Answer · 2017-05-16 12:47:35

к сожалению, форматы PDF и TIFF в настоящее время не поддерживаются для Cloud Vision.

принятые форматы: (взяты из doc)

в формате JPEG
обычного PNG8
PNG24
GIF
анимированный GIF (только первый кадр)
BMP
файлы WebP
RAW
ICO

автор: vokuheila · Accepted Answer · 2018-04-07 00:00:46

https://cloud.google.com/vision/docs/pdf

Я знаю, что этот вопрос старый, но теперь Google Vision выпустила поддержку PDF!

автор: Milan Hlinák · Accepted Answer · 2018-06-17 20:57:46

On 6 апреля 2018 поддержка PDF и TIFF файлы в обнаружении текста документа был добавлен в Google Cloud Vision API (см. Заметки).

по данным документация:

API Vision может обнаруживать и транскрибировать текст из PDF и TIFF файлы, хранящиеся в Google Cloud Storage.
обнаружение текста документа из PDF и TIFF должно быть запрошено с помощью asyncBatchAnnotate функция, которую выполняет асинхронный запрос и предоставляет свой статус, используя операционные ресурсы.
выход из запроса PDF/TIFF записывается в файл JSON, созданный в указанном Google Cloud Storage bucket.

пример:

1) Загрузите файл в Google Cloud Хранение

2) сделайте запрос POST для выполнения обнаружения текста документа PDF/TIFF

запрос:

POST https://vision.googleapis.com/v1p2beta1/files:asyncBatchAnnotate
Authorization: Bearer <your access token>

{
  "requests":[
    {
      "inputConfig": {
        "gcsSource": {
          "uri": "gs://<your bucket name>/input.pdf"
        },
        "mimeType": "application/pdf"
      },
      "features": [
        {
          "type": "DOCUMENT_TEXT_DETECTION"
        }
      ],
      "outputConfig": {
        "gcsDestination": {
          "uri": "gs://<your bucket name>/output/"
        },
        "batchSize": 1
      }
    }
  ]
}

ответ:

{
  "name": "operations/9b1f9d773d216406"
}

3) сделайте запрос GET, чтобы проверить, если обнаружение текста документа сделано

запрос:

GET https://vision.googleapis.com/v1/operations/9b1f9d773d216406
Authorization: Bearer <your access token>

ответ:

{
    "name": "operations/9b1f9d773d216406",
    "metadata": {
        "@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.OperationMetadata",
        "state": "RUNNING",
        "updateTime": "2018-06-17T20:18:09.117787733Z"
    },
    "done": true,
    "response": {
        "@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.AsyncBatchAnnotateFilesResponse",
        "responses": [
            {
                "outputConfig": {
                    "gcsDestination": {
                        "uri": "gs://<your bucket name>/output/"
                    },
                    "batchSize": 1
                }
            }
        ]
    }
}

4) проверьте результаты в указанном Google Cloud Storage папка