Cloud Vision API - PDF OCR
Я только что протестировал API Google Cloud Vision для чтения текста, если он существует, в изображении.
до сих пор я устанавливал сервер Maven и сервер Redis. Я просто следую инструкциям на этой странице.
https://github.com/GoogleCloudPlatform/cloud-vision/tree/master/java/text
до сих пор я смог протестировать.jpg-файлы, можно ли это сделать с помощью TIFF-файлов или pdf??
Я использую следующие команда:
java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp ../../data/text/
внутри текстового каталога у меня есть файлы в формате jpg.
затем, чтобы прочитать преобразованный файл, я не знаю, как это сделать, просто я запускаю следующую команду
java -cp target/text-1.0-SNAPSHOT-jar-with-dependencies.jar com.google.cloud.vision.samples.text.TextApp
и я получаю сообщение введите слово или фразу для поиска в преобразованных файлов. Есть ли способ увидеть весь документ преобразованным?
спасибо!
3 ответов
к сожалению, форматы PDF и TIFF в настоящее время не поддерживаются для Cloud Vision.
принятые форматы: (взяты из doc)
- в формате JPEG
- обычного PNG8
- PNG24
- GIF
- анимированный GIF (только первый кадр)
- BMP
- файлы WebP
- RAW
- ICO
https://cloud.google.com/vision/docs/pdf
Я знаю, что этот вопрос старый, но теперь Google Vision выпустила поддержку PDF!
On 6 апреля 2018 поддержка PDF и TIFF файлы в обнаружении текста документа был добавлен в Google Cloud Vision API (см. Заметки).
по данным документация:
API Vision может обнаруживать и транскрибировать текст из PDF и TIFF файлы, хранящиеся в Google Cloud Storage.
обнаружение текста документа из PDF и TIFF должно быть запрошено с помощью asyncBatchAnnotate функция, которую выполняет асинхронный запрос и предоставляет свой статус, используя операционные ресурсы.
выход из запроса PDF/TIFF записывается в файл JSON, созданный в указанном Google Cloud Storage bucket.
пример:
1) Загрузите файл в Google Cloud Хранение
2) сделайте запрос POST для выполнения обнаружения текста документа PDF/TIFF
запрос:
POST https://vision.googleapis.com/v1p2beta1/files:asyncBatchAnnotate
Authorization: Bearer <your access token>
{
"requests":[
{
"inputConfig": {
"gcsSource": {
"uri": "gs://<your bucket name>/input.pdf"
},
"mimeType": "application/pdf"
},
"features": [
{
"type": "DOCUMENT_TEXT_DETECTION"
}
],
"outputConfig": {
"gcsDestination": {
"uri": "gs://<your bucket name>/output/"
},
"batchSize": 1
}
}
]
}
ответ:
{
"name": "operations/9b1f9d773d216406"
}
3) сделайте запрос GET, чтобы проверить, если обнаружение текста документа сделано
запрос:
GET https://vision.googleapis.com/v1/operations/9b1f9d773d216406
Authorization: Bearer <your access token>
ответ:
{
"name": "operations/9b1f9d773d216406",
"metadata": {
"@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.OperationMetadata",
"state": "RUNNING",
"updateTime": "2018-06-17T20:18:09.117787733Z"
},
"done": true,
"response": {
"@type": "type.googleapis.com/google.cloud.vision.v1p2beta1.AsyncBatchAnnotateFilesResponse",
"responses": [
{
"outputConfig": {
"gcsDestination": {
"uri": "gs://<your bucket name>/output/"
},
"batchSize": 1
}
}
]
}
}
4) проверьте результаты в указанном Google Cloud Storage папка