PDF Table Extraction API API ID: 11754

Extract structured tables from PDF files and return them as JSON, Excel, or CSV. Automatically detects single or multiple tables, supports multi-page PDFs, and delivers deterministic, machine-readable output for data pipelines and automation.

通过 MCP 从您的 AI 代理使用此 API

支持 OpenClaw、Claude Code/Desktop、Cursor、Windsurf、Cline 以及任何兼容 MCP 的 AI 客户端。

文档和设置

通过封装此 MCP 创建技能： https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

PDF Table Extraction API enables developers to reliably extract structured tabular data from PDF documents and convert it into machine-readable formats such as JSON, Excel, or CSV.

This API focuses exclusively on true table extraction, not general PDF text parsing. It automatically detects grid-based tabular structures within PDFs and ignores non-tabular content such as titles, headers, footers, and paragraphs. This makes it ideal for automation, ETL pipelines, data ingestion workflows, and backend systems that require clean, predictable output.

Key Capabilities

Detects and extracts one or multiple tables from a single PDF
Supports tables spanning multiple pages
Returns results in JSON, Excel (.xlsx), or CSV
Multiple tables are returned as:
- An array in JSON
- Separate worksheets in Excel
- Separate CSV files packaged in a ZIP archive
Deterministic output: same input always produces the same result
Optional confidence scores per table
Designed for automation and backend use cases

What This API Does

Identifies tabular data based on layout and structure
Preserves row and column alignment
Handles irregular tables, empty cells, and uneven rows
Returns structured output suitable for programmatic processing

What This API Does NOT Do

Does not extract free-form text outside tables
Does not perform OCR on scanned PDFs
Does not attempt semantic interpretation of table contents
Does not modify or enrich data values

Example Use Cases

Extract invoice line items from PDF documents
Convert financial reports into structured datasets
Ingest tabular data from customer-uploaded PDFs
Automate data pipelines from PDF sources
Replace manual copy-paste workflows

Output Formats

JSON

Tables returned as an array
Each table includes rows, page range, and confidence score

Excel (.xlsx)

One workbook per request
Each table placed in a separate worksheet

CSV

Each table exported as a separate CSV file
All CSV files returned in a ZIP archive

API Characteristics

Stateless and privacy-friendly
No data is stored after processing
Secure HTTPS-only communication
Suitable for production workloads

Limitations

Maximum PDF size limits apply
Text-based PDFs only (no OCR support)
Tables must be visually structured (grid or aligned rows)

Designed For Developers

This API is designed for developers who need reliable table extraction, predictable output, and clean integration into automated systems — without the complexity or cost of large enterprise document platforms.

Summary

If you need structured data from PDF tables — not text blobs, not images, and not manual cleanup — this API provides a fast, deterministic, and developer-friendly solution.

API 文档

端点

提取数据 Endpoint ID: 22299

从PDF文档中提取结构化的表格数据，并以机器可读的格式返回。自动检测PDF中的一个或多个表格，忽略非表格文本，并以JSON、Excel（多个工作表）或CSV格式输出干净数据。旨在用于自动化、数据管道和后端处理，具有确定性结果

                                                                            
POST https://pr180-testing.zylalabs.com/api/11754/pdf+table+extraction+api/22299/extract+data

提取数据 - 端点功能

对象	描述
`pages`	可选 Pages to extract. Examples: "all", "1,3-5", or [1,3,4,5]
`fileBase64`	可选 Base64-encoded PDF (alternative to multipart upload)
`请求体`	[必需] 文件二进制

剩余免费测试请求：3 / 3。

输入参数

pages

outputFormat

strategy

mergeTablesAcrossPages

confidenceScores

fileBase64

API 示例响应

{"tables":[{"tableIndex":0,"pageRange":[1,1],"rows":[["Lorem ipsum","","","","","","","",""],["condimentum.","Vivamus","dapibus","sodales","ex,","vitae","malesuada","ipsum","cursus"],["convallis. Maecenas sed egestas nulla, ac condimentum orci.","Mauris diam felis,","","","","","","",""],["ac accumsan nunc vehicula vitae.","Nulla eget justo in felis tristique fringilla. Morbi sit amet","","","","","","",""],["","Maecenas non lorem quis tellus placerat varius.","","","","","","",""],["","Aenean congue fringilla justo ut aliquam.","","","","","","",""],["","Mauris id ex erat.","Nunc vulputate neque vitae justo facilisis, non condimentum ante","","","","","",""],["sagittis.","","","","","","","",""],["","Morbi viverra semper lorem nec molestie.","","","","","","",""],["","Maecenas tincidunt est efficitur ligula euismod, sit amet ornare est vulputate.","","","","","","",""],["12","","","","","","","",""],["10","","","","","","","",""],["8","","","","","","","",""],["Column 1","","","","","","","",""],["6","","","","","","","",""],["Column 2","","","","","","","",""],["4 Column 3","","","","","","","",""],["2","","","","","","","",""],["0","","","","","","","",""],["Row 1","Row 2","Row 3","Row 4","","","","",""]],"rowCount":20,"columnCount":9,"strategyUsed":"stream","warnings":[],"confidence":0.85},{"tableIndex":1,"pageRange":[2,2],"rows":[["velit.","Pellentesque","fermentum","nisl","vitae","fringilla","venenatis.","Etiam","id","mauris","vitae","orci"],["a.","","","","","","","","","","",""],["Lorem ipsum","Lorem ipsum","Lorem ipsum","","","","","","","","",""],["1","In eleifend velit vitae libero sollicitudin euismod.","Lorem","","","","","","","","",""],["2","Cras fringilla ipsum magna, in fringilla dui commodo Ipsum","","","","","","","","","",""],["a.","","","","","","","","","","",""],["3","Aliquam erat volutpat.","Lorem","","","","","","","","",""],["4","Fusce vitae vestibulum velit.","Lorem","","","","","","","","",""],["5","Etiam vehicula luctus fermentum.","Ipsum","","","","","","","","",""],["et","pulvinar","nunc.","Pellentesque","fringilla","mollis","efficitur.","Nullam","venenatis","commodo","",""]],"rowCount":10,"columnCount":12,"strategyUsed":"stream","warnings":[],"confidence":0.85},{"tableIndex":2,"pageRange":[3,3],"rows":[["elit.","","","","","","","","","","",""],["dictum tellus.","","","","","","","","","","",""],["Aliquam","erat","volutpat.","Vestibulum","in","egestas","velit.","Pellentesque","fermentum","nisl","vitae",""],["fringilla","venenatis.","Etiam","id","mauris","vitae","orci","maximus","ultricies.","Cras","fringilla","ipsum"],["et","pulvinar","nunc.","Pellentesque","fringilla","mollis","efficitur.","Nullam","venenatis","commodo","",""]],"rowCount":5,"columnCount":12,"strategyUsed":"stream","warnings":[],"confidence":0.85}],"summary":{"tableCount":3,"pageCount":4}}

提取数据 - 代码片段


    curl --location 'https://zylalabs.com/api/11754/pdf+table+extraction+api/22299/extract+data' \
    --header 'Content-Type: application/json' \ 
    --form 'image=@"FILE_PATH"'

API 访问密钥和身份验证

注册后，每个开发者都会被分配一个个人 API 访问密钥，这是一个唯一的字母和数字组合，用于访问我们的 API 端点。要使用 PDF Table Extraction API 进行身份验证，只需在 Authorization 标头中包含您的 bearer token。

标头

标头	描述
`授权`	[必需] 应为 `Bearer access_key`. 订阅后，请查看上方的"您的 API 访问密钥"。

问题

简单透明的定价

无长期承诺。随时升级、降级或取消。免费试用包括最多 50 个请求。

月度年度

(年度计费可节省 2 个月 🎉)

💫Basic

$24.99/月

500 请求 / 月
然后 $0.0649740 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

Popular

⚡Pro

$49.99/月

2,000 请求 / 月
然后 $0.0649740 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

🔥Pro Plus

$99.99/月

6,000 请求 / 月
然后 $0.0649740 如果超过限制，每次请求
速率限制: 120 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

⚜️Premium

$199.99/月

15,000 请求 / 月
然后 $0.0649740 如果超过限制，每次请求
速率限制: 120 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

💫Basic

$20.83/月

500 请求 / 月
然后 $0.0649740 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

Popular

⚡Pro

$41.66/月

2,000 请求 / 月
然后 $0.0649740 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

🔥Pro Plus

$83.33/月

6,000 请求 / 月
然后 $0.0649740 如果超过限制，每次请求
速率限制: 120 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

⚜️Premium

$166.66/月

15,000 请求 / 月
然后 $0.0649740 如果超过限制，每次请求
速率限制: 120 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

🚀 企业版

起价
$ 10,000/年

自定义数量
自定义速率限制
专业客户支持
实时 API 监控

预约通话

客户喜爱的功能

✔︎ 仅支付成功请求
✔︎ 7 天免费试用
✔︎ 多语言支持
✔︎ 一个 API 密钥，所有 API。
✔︎ 直观的仪表板

✔︎ 全面的错误处理
✔︎ 开发者友好的文档
✔︎ Postman 集成
✔︎ 安全的 HTTPS 连接
✔︎ 可靠的正常运行时间

PDF Table Extraction API FAQs

PDF表格提取API返回什么类型的数据

API返回从PDF文档提取的结构化表格数据。这包括多个表格，每个表格以JSON格式的数组表示，用户可以选择接收Excel（.xlsx）或CSV格式的数据

响应数据中的关键字段是什么

响应包括关键字段，例如 `tableIndex`、`pageRange`、`rows`、`rowCount`、`columnCount`、`strategyUsed` 和 `confidence`。每个表的数据都经过组织，以便于程序化处理

响应数据是如何组织的

响应数据被组织成一个摘要部分，包括表格和页面的总数量，后面跟着一个表格数组。每个表格包含其行、页面范围和信心分数，使得导航和利用变得简单

可以与此端点一起使用哪些参数

端点的主要参数是PDF文件本身，可以直接上传额外的参数可能包括输出格式的选项（JSON Excel CSV）和置信评分的设置

数据准确性如何维持

数据的准确性通过确定性输出得以保持，这意味着相同的输入始终会产生相同的结果。API还为每个表提供可选的置信度分数，指示提取的可靠性

这些数据的典型使用案例是什么

典型的用例包括提取发票项目将财务报告转换为结构化数据集自动化数据管道以及从客户上传的PDF中摄取表格数据以简化数据处理工作流

用户如何有效利用返回的数据

用户可以利用结构化输出将其集成到数据管道、ETL 过程或后台系统中。组织良好的格式使得在各种应用中对提取的表格进行轻松的操作和分析成为可能

什么是预期的标准数据模式

用户可以期待反映原始表格结构的数据模式，包括行和列对齐。API处理不规则表格和空单元格，确保输出保持结构化并适合进一步处理

API可以从PDF中提取哪些类型的表格

API可以提取各种类型的结构化表格，包括那些不规则布局、空单元格和行数不一致的表格。它自动检测PDF中的单个或多个表格，确保仅处理基于网格的表格结构

API如何处理多页表格

该API支持跨多个页面的表格，准确捕捉整个表格结构并以单个输出返回。每个表格的页面范围包含在响应中以便于参考

用户可以指定提取数据的输出格式吗

是的用户可以通过指定所需的输出格式来自定义数据请求 JSON Excel (.xlsx) 或 CSV 这种灵活性允许集成到各种应用程序和工作流程中

API提供了哪些可选的功能用于数据提取

该API为每个提取的表格提供可选的置信分数，以指示提取的可靠性此功能帮助用户评估返回数据的质量

API如何确保数据隐私和安全

该API旨在无状态和隐私友好，确保处理后不存储数据。它使用安全的仅限HTTPS通信来保护用户在传输过程中的数据

用户在提取的数据中包含空单元格时应该怎么办

用户可以期待API优雅地处理空单元格，保持表格的整体结构。输出将反映原始布局，使得尽管存在缺失值，数据操作仍然简单明了

用户如何解读响应中的置信分数

置信分数范围从0到1，表示提取的表格准确的可能性。较高的分数表示更高的可靠性，帮助用户确定哪些表格值得信任以便进一步处理

`strategyUsed`字段在响应中的意义是什么

`strategyUsed`字段指示API提取表格数据所采用的方法。该信息可以帮助用户了解提取过程并评估输出对其特定需求的适用性

一般常见问题

什么是 Zyla API Hub？

Zyla API Hub 就像一个大型 API 商店，您可以在一个地方找到数千个 API。我们还为所有 API 提供专门支持和实时监控。注册后，您可以选择要使用的 API。请记住，每个 API 都需要自己的订阅。但如果您订阅多个 API，您将为所有这些 API 使用相同的密钥，使事情变得更简单。

允许使用哪些货币和支付方式？

价格以 USD（美元）、EUR（欧元）、CAD（加元）、AUD（澳元）和 GBP（英镑）列出。我们接受所有主要的借记卡和信用卡。我们的支付系统使用最新的安全技术，由 Stripe 提供支持，Stripe 是世界上最可靠的支付公司之一。如果您在使用卡片付款时遇到任何问题，请通过 [email protected]

此外，如果您已经以这些货币中的任何一种（USD、EUR、CAD、AUD、GBP）拥有有效订阅，该货币将保留用于后续订阅。只要您没有任何有效订阅，您可以随时更改货币。

如果我在定价页面上看到本地货币，为什么不能用它付款？

定价页面上显示的本地货币基于您 IP 地址的国家/地区，仅供参考。实际价格以 USD（美元）为单位。当您付款时，即使您在我们的网站上看到以本地货币显示的等值金额，您的卡片对账单上也会以美元显示费用。这意味着您不能直接使用本地货币付款。

我的付款被拒绝，我该怎么办？

有时，银行可能会因其欺诈保护设置而拒绝收费。我们建议您首先联系您的银行，检查他们是否阻止了我们的收费。此外，您可以访问账单门户并更改关联的卡片以进行付款。如果这些方法不起作用并且您需要进一步帮助，请通过 [email protected]

我的 API 订阅将如何收费？

价格由月度或年度订阅决定，具体取决于所选计划。

我的 API 调用将如何从我的计划中扣除？

API 调用根据成功请求从您的计划中扣除。每个计划都包含您每月可以进行的特定数量的调用。只有成功的调用（由状态 200 响应指示）才会计入您的总数。这确保失败或不完整的请求不会影响您的月度配额。

您的计费周期如何工作？

Zyla API Hub 采用月度订阅系统。您的计费周期将从您购买付费计划的那一天开始，并在下个月的同一日期续订。因此，如果您想避免未来的费用，请提前取消订阅。

如何升级我当前的 API 订阅计划？

要升级您当前的订阅计划，只需转到 API 的定价页面并选择您要升级到的计划。升级将立即生效，让您立即享受新计划的功能。请注意，您之前计划中的任何剩余调用都不会转移到新计划，因此在升级时请注意这一点。您将被收取新计划的全部金额。

如何查看本月我可以进行的剩余 API 调用次数？

要检查您本月剩余多少 API 调用，请参考响应标头中的 "X-Zyla-API-Calls-Monthly-Remaining" 字段。例如，如果您的计划允许每月 1,000 个请求，而您已使用 100 个，则响应标头中的此字段将显示 900 个剩余调用。

如何找出我的订阅计划允许的最大 API 请求数？

要查看您的计划允许的最大 API 请求数，请检查 "X-Zyla-RateLimit-Limit" 响应标头。例如，如果您的计划包括每月 1,000 个请求，此标头将显示 1,000。

如何知道我的速率限制何时重置？

"X-Zyla-RateLimit-Reset" 标头显示您的速率限制重置之前的秒数。这告诉您何时您的请求计数将重新开始。例如，如果它显示 3,600，则意味着还有 3,600 秒直到限制重置。

我可以随时取消吗？

是的，您可以随时通过访问您的账户并在账单页面上选择取消选项来取消您的计划。请注意，升级、降级和取消会立即生效。此外，取消后，您将不再有权访问该服务，即使您的配额中还有剩余调用。

7 天免费试用如何工作？

为了让您有机会在没有任何承诺的情况下体验我们的 API，我们提供 7 天免费试用，允许您免费进行最多 50 次 API 调用。此试用只能使用一次，因此我们建议将其应用于您最感兴趣的 API。虽然我们的大多数 API 都提供免费试用，但有些可能不提供。试用在 7 天后或您进行了 50 次请求后结束，以先发生者为准。如果您在试用期间达到 50 次请求限制，您需要"开始您的付费计划"以继续发出请求。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。或者，如果您在第 7 天之前不取消订阅，您的免费试用将结束，您的计划将自动计费，授予您访问计划中指定的所有 API 调用的权限。请记住这一点以避免不必要的费用。

如果我忘记取消免费试用会怎样？

7 天后，您将被收取试用期间订阅的计划的全额费用。因此，在试用期结束前取消很重要。因忘记及时取消而提出的退款请求不被接受。

在免费试用期间我可以进行多少次调用？

当您订阅 API 免费试用时，您可以进行最多 50 次 API 调用。如果您希望超出此限制进行额外的 API 调用，API 将提示您执行"开始您的付费计划"。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。

付款订单何时处理？

付款订单在每月 20 日至 30 日之间处理。如果您在 20 日之前提交请求，您的付款将在此时间范围内处理。

如果我遇到任何问题，我应该联系谁？

您可以通过我们的聊天渠道联系我们以获得即时帮助。我们始终在线，时间为上午 8 点至下午 5 点（EST）。如果您在该时间之后联系我们，我们将尽快回复您。此外，您可以通过 [email protected]

开始免费试用

服务级别

100%

响应时间

18ms

类别:

工具与实用程序

PDF文本提取器 API

PDF转文本API是将PDF文件转换为文本或单词的简单解决方案它允许用户快速轻松地从PDF中提取纯文本使其成为文本分析数据提取和文档处理的便捷工具

工具与实用程序 7 天免费试用

服务级别:

91%

响应时间:

2,513ms

PDF到2D文本提取器 API

PDF到2D文本提取API将PDF文档转换为结构化的2D文本，便于数据提取和分析

数据与分析 7 天免费试用

服务级别:

100%

响应时间:

1,073ms

PDF 转换为文本 API

PDF转文本API允许用户轻松将PDF文件转换为文本或单词通过使用该API，用户可以从PDF文档中提取文本内容，从而更容易处理、分析或重新利用文件中包含的信息

工具与实用程序 7 天免费试用

服务级别:

100%

响应时间:

0ms

文档数据提取 API

通过我们的文档数据提取API 简化您的工作流程该API旨在将任何结构化或非结构化文档转换为可操作的结构化数据

数据与分析 7 天免费试用

服务级别:

100%

响应时间:

1,716ms

从文档中提取文本 API

无缝将扫描文档转换为可编辑文本，使用文档提取文本API

视觉识别与成像 7 天免费试用

服务级别:

100%

响应时间:

1,945ms

文本提取器 API

文本提取API将扫描的图像和文档转换为可编辑文本，提取和识别字符和单词以便于编辑

视觉识别与成像 7 天免费试用

服务级别:

100%

响应时间:

3,168ms

文档OCR提取器 API

从文档中提取结构化数据，使用高精度OCR，包括个人信息、日期、数字和格式化文本以进行验证和自动化

视觉识别与成像 7 天免费试用

服务级别:

100%

响应时间:

1,812ms

网页提取器 API

从网页中提取干净的、未格式化的文本和Markdown，以便于分析、文档编制或显示，使用这个多功能的API

数据与分析 7 天免费试用

服务级别:

100%

响应时间:

3,107ms

文档转文本 API

通过DocToText API解锁数据的强大功能 - 您无缝文档转换的终极解决方案从DOC和PDF到图像和电子邮件，轻松将各种格式转换为纯文本和HTML 无论是小任务还是大规模项目，体验顶级的光学字符识别和电子邮件解析能力简化您的数据提取之旅今天

数据与分析 7 天免费试用

服务级别:

100%

响应时间:

0ms

结构化文本提取器 API

通过一个旨在从任何网页提取干净文本或Markdown的API来简化内容操作

自然语言处理 7 天免费试用

服务级别:

100%

响应时间:

4,048ms

PDF Table Extraction API API ID: 11754

Key Capabilities

What This API Does

What This API Does NOT Do

Example Use Cases

Output Formats

API Characteristics

Limitations

Designed For Developers

Summary

您想查看什么？查看 信息 或查看 文档?

API 文档

端点

输入参数

API 示例响应

提取数据 - 代码片段

API 访问密钥和身份验证

问题

简单透明的定价

💫Basic

$24.99/月

⚡Pro

$49.99/月

🔥Pro Plus

$99.99/月

⚜️Premium

$199.99/月

💫Basic

$20.83/月

⚡Pro

$41.66/月

🔥Pro Plus

$83.33/月

⚜️Premium

$166.66/月

🚀 企业版

起价 $ 10,000/年

客户喜爱的功能

PDF Table Extraction API FAQs

PDF表格提取API返回什么类型的数据

响应数据中的关键字段是什么

响应数据是如何组织的

可以与此端点一起使用哪些参数

数据准确性如何维持

这些数据的典型使用案例是什么

用户如何有效利用返回的数据

什么是预期的标准数据模式

API可以从PDF中提取哪些类型的表格

API如何处理多页表格

用户可以指定提取数据的输出格式吗

API提供了哪些可选的功能用于数据提取

API如何确保数据隐私和安全

用户在提取的数据中包含空单元格时应该怎么办

用户如何解读响应中的置信分数

`strategyUsed`字段在响应中的意义是什么

一般常见问题

什么是 Zyla API Hub？

允许使用哪些货币和支付方式？

如果我在定价页面上看到本地货币，为什么不能用它付款？

我的付款被拒绝，我该怎么办？

我的 API 订阅将如何收费？

我的 API 调用将如何从我的计划中扣除？

您的计费周期如何工作？

如何升级我当前的 API 订阅计划？

如何查看本月我可以进行的剩余 API 调用次数？

如何找出我的订阅计划允许的最大 API 请求数？

如何知道我的速率限制何时重置？

我可以随时取消吗？

7 天免费试用如何工作？

如果我忘记取消免费试用会怎样？

在免费试用期间我可以进行多少次调用？

付款订单何时处理？

如果我遇到任何问题，我应该联系谁？

服务级别

响应时间

类别:

标签:

相关 API

PDF文本提取器 API

PDF到2D文本提取器 API

您想查看什么？查看信息或查看文档?

起价
$ 10,000/年