#!/bin/bash # 检查是否提供了文件名 if [ "$#" -ne 1 ]; then echo "使用方法: $0 [PDF文件名]" exit 1 fi # 输入的 PDF 文件名 PDF_FILE="$1" # 使用 pdftk 解压 PDF 到文本 pdftk "$PDF_FILE" output uncompressed_$PDF_FILE uncompress # 使用 Perl 去除特殊字符 # 注意: 这里假设特殊字符已经正确插入 perl -pi -e 's/\x00\x32\x00\x37\x00\x30\x00\x35\x00\x35\x00\x38\x00\x20\x52\x18f%i`\)Tj//g' uncompressed_$PDF_FILE # 使用 pdftk 重新组合 PDF pdftk uncompressed_$PDF_FILE output recombined_$PDF_FILE compress # 清理临时文件 rm uncompressed_$PDF_FILE