Защита PDF с помощью PDFBox

Im действительно борется с документацией для PDFBox. Для такой популярной библиотеки информация кажется немного тонкой на земле (для меня!).

в любом случае проблема Im, связанная с защитой PDF. На данный момент все, что я хочу контролировать права доступа пользователей. в частности, я хочу запретить пользователю изменять PDF-файл.

Если я опущу код разрешения доступа, все работает отлично. Я читаю в PDF из внешний ресурс. Затем я читаю и заполняю поля, добавляя некоторые изображения перед сохранением нового PDF. Все работает отлично.

проблема возникает, когда я добавляю следующий код для управления доступом:

/* Secure the PDF so that it cannot be edited */
try {
    String ownerPassword = "DSTE$gewRges43";
    String userPassword = "";

    AccessPermission ap = new AccessPermission();
    ap.setCanModify(false);

    StandardProtectionPolicy spp = new StandardProtectionPolicy(ownerPassword, userPassword, ap);
    pdf.protect(spp);
} catch (BadSecurityHandlerException ex) {
    Logger.getLogger(PDFManager.class.getName()).log(Level.SEVERE, null, ex);
}

когда я добавляю этот код, весь текст и изображения полосатые из исходящего pdf. Поля все еще присутствуют в документе, но все они пусты, а также весь текст и изображения, которые являются частью исходного PDF и которые были добавлены динамически в код пропал.

обновление: Хорошо, насколько я могу судить, проблема исходит от ошибки, связанной с полями формы. Я собираюсь попробовать другой подход без полей формы и посмотреть, что он дает.

1 ответов


Я нашел решение этой проблемы. Казалось бы, если PDF поступает из внешнего источника, иногда PDF защищен или зашифрован.

Если вы получаете пустой вывод При загрузке PDF-документа из внешнего источника и добавляете защиту, вы, вероятно, работаете с зашифрованным документом. У меня есть система обработки потока, работающая над PDF-документами. Поэтому следующий код работает для меня. Если вы просто работаете с PDF-входами, вы можете интегрировать следующее код с вашим потоком.

public InputStream convertDocument(InputStream dataStream) throws Exception {
    // just acts as a pass through since already in pdf format
    PipedOutputStream os = new PipedOutputStream();
    PipedInputStream is = new PipedInputStream(os);

    System.setProperty("org.apache.pdfbox.baseParser.pushBackSize", "2024768"); //for large files

    PDDocument doc = PDDocument.load(dataStream, true);

    if (doc.isEncrypted()) { //remove the security before adding protections
        doc.decrypt("");
        doc.setAllSecurityToBeRemoved(true);
    }
    doc.save(os);
    doc.close();
    dataStream.close();
    os.close();
    return is;
}

теперь возьмите возвращенный InputStream и используйте его для своего приложения безопасности;

   PipedOutputStream os = new PipedOutputStream();
   PipedInputStream is = new PipedInputStream(os);

   System.setProperty("org.apache.pdfbox.baseParser.pushBackSize", "2024768");
   InputStream dataStream = secureData.data();

   PDDocument doc = PDDocument.load(dataStream, true);
   AccessPermission ap = new AccessPermission();
   //add what ever perms you need blah blah...
   ap.setCanModify(false);
   ap.setCanExtractContent(false);
   ap.setCanPrint(false);
   ap.setCanPrintDegraded(false);
   ap.setReadOnly();

   StandardProtectionPolicy spp = new StandardProtectionPolicy(UUID.randomUUID().toString(), "", ap);

   doc.protect(spp);

   doc.save(os);
   doc.close();
   dataStream.close();
   os.close();

теперь это должно вернуть правильный документ без пустого вывода!

трюк состоит в том, чтобы сначала удалить шифрование!