每当用户需要对PDF文件进行任何操作时,请使用此技能。这包括从PDF中读取或提取文本/表格、将多个PDF合并为一个、拆分PDF、旋转页面、添加水印、创建新PDF、填写PDF表单、加密/解密PDF、提取图像,以及对扫描版PDF进行OCR识别以使其可搜索。如果用户提及.pdf文件或要求生成此类文件,请使用此技能。
分类
文档处理安装
热度:110
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
下载并安装这个技能 https://openskills.cc/api/download?slug=anthropics-skills-pdf&locale=zh&source=copy
PDF 处理技能
技能概述
PDF 技能是一个全面的 PDF 文件处理解决方案,支持读取、提取、合并、拆分、加密以及 OCR 等多种操作。
适用场景
当需要批量合并或拆分大量 PDF 文件时,该技能提供高效的 Python 库和命令行工具,实现自动化处理。
从 PDF 报告、发票、表格中提取文本和结构化数据,支持将表格导出为 Excel 格式进行分析。
对扫描版 PDF 进行 OCR 文字识别,使图片型 PDF 转换为可搜索、可编辑的文本文档。
核心功能
支持合并多个 PDF 文件、按页拆分文档、旋转页面、添加/删除水印、设置密码保护等常用操作,使用 pypdf 或命令行工具 qpdf 即可完成。
使用 pdfplumber 从 PDF 中精确提取文本内容和表格数据,支持保留原始布局,可导出为结构化数据格式。
基于 reportlab 创建新的 PDF 文档,支持多页报告生成;支持填写 PDF 表单字段,实现自动化表单处理。
常见问题
PDF 技能支持哪些操作?
该技能支持读取和提取 PDF 文本/表格、合并/拆分 PDF、旋转页面、添加水印、创建新 PDF、填写表单、加密/解密、提取图片以及扫描 PDF 的 OCR 文字识别等操作。
如何合并多个 PDF 文件?
可以使用 Python 的 pypdf 库或命令行工具 qpdf。Python 代码示例:创建 PdfWriter 对象,遍历每个 PDF 文件的页面并添加到 writer 中,最后保存为合并后的文件。
怎么从扫描版 PDF 提取文字?
需要使用 OCR 技术。推荐方案是使用 pdf2image 将 PDF 转换为图片,然后使用 pytesseract 进行文字识别。安装依赖:
pip install pytesseract pdf2image,同时需要安装系统级的 Tesseract 引擎。Python 处理 PDF 用什么库?
根据任务不同推荐不同库:基础操作(合并/拆分/加密)用 pypdf;文本和表格提取用 pdfplumber;创建新 PDF 用 reportlab;命令行批量处理用 qpdf 或 pdftotext。
PDF 表单填写怎么做?
请参考 FORMS.md 文档。该技能支持使用 pdf-lib(JavaScript)或 pypdf(Python)填写 PDF 表单字段,具体实现方法详见表单处理指南。
支持命令行处理 PDF 吗?
是的,支持多种命令行工具。常用包括:qpdf(合并/拆分/旋转/解密)、pdftotext(文本提取)、pdftk(多功能工具)、pdfimages(提取图片)。这些工具适合在脚本中进行批量处理。