PDF 处理技能

PDF 技能是一个全面的 PDF 文件处理解决方案，支持读取、提取、合并、拆分、加密以及 OCR 等多种操作。

文档自动化处理

当需要批量合并或拆分大量 PDF 文件时，该技能提供高效的 Python 库和命令行工具，实现自动化处理。

数据提取与分析

从 PDF 报告、发票、表格中提取文本和结构化数据，支持将表格导出为 Excel 格式进行分析。

扫描文档数字化

对扫描版 PDF 进行 OCR 文字识别，使图片型 PDF 转换为可搜索、可编辑的文本文档。

基础 PDF 操作

支持合并多个 PDF 文件、按页拆分文档、旋转页面、添加/删除水印、设置密码保护等常用操作，使用 pypdf 或命令行工具 qpdf 即可完成。

内容提取

使用 pdfplumber 从 PDF 中精确提取文本内容和表格数据，支持保留原始布局，可导出为结构化数据格式。

PDF 创建与表单填写

基于 reportlab 创建新的 PDF 文档，支持多页报告生成；支持填写 PDF 表单字段，实现自动化表单处理。

该技能支持读取和提取 PDF 文本/表格、合并/拆分 PDF、旋转页面、添加水印、创建新 PDF、填写表单、加密/解密、提取图片以及扫描 PDF 的 OCR 文字识别等操作。

可以使用 Python 的 pypdf 库或命令行工具 qpdf。Python 代码示例：创建 PdfWriter 对象，遍历每个 PDF 文件的页面并添加到 writer 中，最后保存为合并后的文件。

需要使用 OCR 技术。推荐方案是使用 pdf2image 将 PDF 转换为图片，然后使用 pytesseract 进行文字识别。安装依赖：pip install pytesseract pdf2image，同时需要安装系统级的 Tesseract 引擎。

根据任务不同推荐不同库：基础操作（合并/拆分/加密）用 pypdf；文本和表格提取用 pdfplumber；创建新 PDF 用 reportlab；命令行批量处理用 qpdf 或 pdftotext。

请参考 FORMS.md 文档。该技能支持使用 pdf-lib（JavaScript）或 pypdf（Python）填写 PDF 表单字段，具体实现方法详见表单处理指南。

是的，支持多种命令行工具。常用包括：qpdf（合并/拆分/旋转/解密）、pdftotext（文本提取）、pdftk（多功能工具）、pdfimages（提取图片）。这些工具适合在脚本中进行批量处理。

pdf