Boa noite, primeiramente agradeço a todos, pois suas publicações me ajudaram muito. Um obrigado à Camila pelos vídeos.
Segui as sugestões acima e obtive sucesso ao utilizar o PDFparser, porém apesar da maioria dos arquivos concluírem com Êxito a extração de conteúdo alguns outros, por algum motivo me retornam o seguinte erro:
Exceção: TCPDF_PARSER ERROR: dados em PDF vazios. em TCPDF_PARSER-> Erro () (linha 790 /pdfparser/vendor/tecnick.com/tcpdf/tcpdf_parser.php).
Sendo assim, a execução do meu script é parada e o conteúdo não é copiado, ainda que eu utilize o @ para ignorar os erros no código.
Versão 9.4.005
Agradeço se puderem me ajudar, segue o código…
include sc_url_library(‘prj’,‘PDFParser’,‘pdfparser/vendor/autoload.php’);
// Include Composer autoloader if not already done.
//include ‘vendor/autoload.php’;
// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$arq=$local.$arquivo;
$pdf = $parser->parseFile($arq);
$text = @$pdf->getText();
$text=str_replace("’", ‘"’, $text);
echo $text;