O que é PDF?
Em 1991, um dos fundadores da Adobe, o doutor John Warnock, iniciou um projeto chamado de “O projeto Camelot”. A intenção era criar um formato de arquivo onde todo mundo pudesse visualizar em qualquer computador. Em 1992 o Camelot se tornou o formato PDF.
PDF(Formato de Documento Portável) É um formato de arquivo criado pela empresa Adobe Systems. Essa é a mesma empresa que criou o famoso programa Photoshop.
Esse formato de arquivo foi criado com a intensão de ser portátil e independente de dispositivo ou resolução de tela.
Um arquivo pdf pode conter textos, imagens ou gráficos.
Um arquivo pdf pode ser visualizado usando alguns programas, como o
- adobe reader
- o navegador Chrome
- Foxit Reader
O que é PDF/A ?
PDF/A(Formato de Documento Portátil Arquivável). É uma variação do PDF e foi desenvolvido para arquivamento a longo prazo.
PDF/A é um dos poucos tipos de arquivos que garante ao usuário que será aberto e visualizado após muitos anos, da mesma forma como o deixou/viu no passado e sem perder a sua estrutura
O que Há de Diferente no Formato PDF/A?
O que faz um arquivo no formato PDF/A se manter visível/legível por muito tempo são 3 características
- Completude: O Arquivo PDF/A é completo; Tudo o que é necessário para vermos está dentro dele, como texto, imagens, gráficos, fontes e informações de cores. Assim, não é permitido anexos ao arquivo, e é proibido fontes externas. Porém, é aceito o uso de anotações que aponte para outro arquivo(exemplo, hiperlinks).
- Auto Documentado: Dentro dos arquivos em formato PDF/A existem informações descritivas, ou seja, informações sobre o arquivo. Informação sobre o autor do documento, a data de criação, o local etc.
A essas informações que descrevem o arquivo chamamos de Metadados. temos em nosso site alguns artigos sobre metadados, veja aqui: https://gnulinuxbrasil.com.br/?s=metadado
Graças aos metadados podemos fazer buscas usando palavras-chave nas pastas, buscando pelo autor ou a data de criação do documento. Podemos ainda ao baixar um arquivo da internet ver quem o criou e quando. - Independência: O formato PDF/A é independente, não está vinculado ou obrigado a ser exibido em somente um certo dispositivo, computador, programa. Não é subordinado a versões ou empresas. PDF/A possui padrões de cores comuns a todos os programas e dispositivos, assim um pdf/a pode ser exibido ou impresso sem dificuldades.
Versões de PDF/A
Abbr. | Subtítulo | Publicado | padrão/Standard | Baseado em | Ref. |
---|---|---|---|---|---|
PDF/A-1 | Parte 1: Uso de PDF 1.4 | 2005-09-28 | ISO 19005-1 | PDF 1.4 (Adobe Systems, Referência PDF , 3ª edição) | [2] |
PDF/A-2 | Parte 2: Uso de ISO 32000-1 | 2011-06-20 | ISO 19005-2 | PDF 1.7 (ISO 32000-1:2008) | [3] |
PDF/A-3 | Parte 3: Uso de ISO 32000-1 com suporte para arquivos incorporados | 2012-10-15 | ISO 19005-3 | PDF 1.7 (ISO 32000-1:2008) | [4] |
Os Arquivos PDF/A possuem níveis de conformidade, o nível B e o Nível A.
- B é a inicial da palavra Básico: Arquivos PDF/A nesse nível requerem apenas os padrões mínimos para que sejam exibidos de forma apropriada e a longo prazo.
- A é a inicial da palavra Acessibilidade: esse nível A inclui os requisitos do nível B mais alguns outros de acessibilidade(para pessoas com algum grau de deficiência)
PDF/A-1
Essa parte 1 foi inicialmente publicada em 28 de setembro de 2005 e tem dois níveis de conformidades para arquivos pdf:
- PDF/A-1b = Nível básico de conformidade
- PDF/A-1a = Nível A de Acessibilidade para conformidade
O nível B requer apenas os padrões necessários para o documento seja exibido futuramente com o mesmo visual adequado de quando foi criado.
O nível A inclui todos os requerimentos do nível B e mais:
- Especificação de linguagem
- Estrutura hierárquica do documento
- Texto descritivos para imagens e símbolos. Por exemplo, uma imagem com descrições auxilia que programas leiam essas descrições para deficientes visuais.
- Todos os caracteres(letras, números, símbolos) sejam mapeados para Unicode.
O nível A tem a intenção de aumentar a acessibilidade para pessoas com alguma deficiência física. Assim, os programas/software pode ler o arquivo e auxiliar às pessoas de modo eficiente. Como exemplo de programas temos os programas leitores de tela para deficiente visual.
PDF/A-2
O padrão PDF/A-2 foi publicado em 20 de junho de 2011.
É baseado em pdf 1.7 e assim traz para o PDF/A algumas das novas funções disponíveis nas versões 1.5, 1.6 e 1.7 de arquivos pdf.
Lembrando que PDF/A-1 é baseado em pdf versão 1.4.
Novas funções adicionas ao PDF/A-2 são:
- compatibilidade com imagens compactadas com JPEG 2000
- Suporte para efeitos transparentes e camadas
- Incorpora fontes OpenType
- Preparado para receber assinaturas digitais PAdES(Assinaturas eletrônicas PDFs avançadas)
- Pode incorporar outros PDF/A. Lembrando que PDF/A não pode ficar dependente de arquivos ou itens externos, então incorporar tudo aquilo que seria externo é o aceito para o padrão.
Níveis para PDF/A-2
Nível B = o mesmo significado para PDF/A-1b
Nível A = o mesmo significado para PDF/A-1a
Nível U = além de ter o requisitado para o nível b o PDF/A-2u requer que todo o texto no documento tenha a referência(mapeamento) Unicode.
PDF/A-3
Padrão publicado em 15 de outubro de 2012.
Se difere de PDF/A-2 em apenas uma coisa: PDF/A-3 aceita incorporar uma quantidade muito maior de tipo de arquivos, como doc, xls, csv, xml etc.
Outros Pontos Importantes sobre PDF\A
- Vídeo e Áudios são proibidos
- JavaScript e inicialização de programas não são permitidos.
- Todas as fontes devem estar incorporadas dentro do PDF/A . Isso também vale para as chamadas fontes PostScripts(exemplo, Times e Helvetiva)
- Cores independentes de dispositivos
- criptografia é proibida
- Uso de padrões de metadados é um requisito
- LZW (Compressão sem Perda de qualidade) devido a restrições de propriedade intelectual.
- Imagens compactadas usando JPEG 2000 não são permitidas dentro de PDF\A-1. Isso poque PDF\A-1 é baseado em pdf 1.4 e JPEG 2000 foi introduzido apenas a partir do pdf 1.5.
Existem 3 formatos de PDF/A:
PDF/A-1 baseado em pdf 1.4,
PDF/A-2 baseado em pdf 1.7
PDF/A-3 baseado também em pdf 1.7Então, JPEG 2000 é permitido apenas em PDF/A-2 e PDF/A-3. - Objetos transparentes e camadas são permitidos apenas em PDF/A-2.
- Assinatura Digitais no padrão PAdES é suportada em PDF\A-2, mas não em PDF/A-1
- PDF/A-2 aceita incorporar outros arquivos PDF/A
- PDF/A-3 aceita que arquivos de qualquer formato sejam incorporados. Exemplo, arquivos xml, doc, pdf.
- Não se pode criar senha de segurança em arquivos PDF/A como é comum em arquivos PDFs. É habitual encontrarmos arquivos PDFs que só abrem se digitarmos uma senha. Mas PDF/A não pode ser dependente a uma fonte/intervenção externa. Isso nos dá a garantia de longo-prazo.
Como Criar um Arquivo no Formato PDF\A?
Diversos programas possibilitam a criação de PDF/A.
Não quero me aprofundar aqui, mas
- no word, quando clicamos em salvar e nos é apresentado a caixa de diálogo, podemos definir o tipo de arquivo para PDF, clicar no botão opções e em seguida escolher PDF/A.
- Temos também o pdfCreator, no qual podemos alterar o perfil de pdf para pdf/a.
- Temos o GhostScript. Uma liguagem onde podemos converter via linha de comando arquivos pdf para pdf/a. segue exemplo de código que faria isso:
gs -dPDFA -dBATCH -dNOPAUSE -sColorConversionStrategy=UseDeviceIndependentColor -sDEVICE=pdfwrite -dPDFACompatibilityPolicy=2 -sOutputFile=novo_arquivoPDFA_gerado.pdf ./arquivoPDF_a_ser_convertido.pdf
Validar um Arquivo PDF\A
Ao criar ou converter um arquivo para PDF\A é recomendado validarmos o arquivo e vermos se realmente está de acordo com as normas ou padrões.
Podemos validar o arquivo usando sites online como
Bastando enviar(upload) o arquivo para umas das páginas acima e clicar no botão validar correspondente. De acordo com o anunciando nessas páginas, o arquivo enviado é excluído assim que clicamos em validar. Não fica armazenado nos servidores.
Há outra opção que prefiro, que é usar um programa instalado em nosso computador para que a validação do PDF\A não possa depender de internet. O programa que recomendo aqui é o programa validador “verapdf“. Ele é multiplataforma, assim funcionando tanto no Linux, macOS e windows. O programa “verapdf” é feito em java e por isso precisaremos ter o java instalado.
Segue print de tela validando arquivo PDF/A com o programa verapdf
Conclusão
Quando houver uma conversão de arquivos para PDF/A é recomendado que se visualize o documento para verificar se há erros. Sim, erros na visualização é algo comum. De acordo com o artigo publicado no seguinte link: emerald.com, de 213 arquivos convertidos para PDF/A-1b, 11% foram gerados com algum tipo de erro, como perda de links, perda de conteúdo(caracteres não legíveis, textos apagados, parte do documento faltando). Esse teste usou 3 programas para conversão em massa: LuraTech PDF Compressor, Adobe Acrobat XI Pro e 3-HeightsTM Document Converter by PDF Tools.
Então, Atenção durante a criação/conversão de PDF/A!
Muito bom otima postagem
Obrigado pelo seu feedback.