智能网络爬虫是一个快速、可靠的API,用于从任何公共网页中提取结构化内容 发送一个URL,获取干净的数据:
{"title":"Facebook","body":"Explore the things you love.","meta":{},"favicon":"https://static.xx.fbcdn.net/rsrc.php/y1/r/ay1hV6OlegS.ico","canonicalUrl":"https://www.facebook.com/","isAmp":false,"hasSchemaOrg":false,"hasJsonLd":false,"lang":"en","url":"https://www.facebook.com"}
curl --location --request GET 'https://zylalabs.com/api/12311/web+scraper+api/23127/scrape+web+page?url=https://www.facebook.com' --header 'Authorization: Bearer YOUR_API_KEY'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
The Web Scraper API can extract structured content including the title, body text, metadata (such as description and keywords), Open Graph tags, favicons, canonical URLs, language detection, and support for AMP pages.
The API returns the extracted data in a clean, structured format that includes fields for title, body text, meta tags, Open Graph data, favicons, and more, allowing for easy integration into applications.
The Web Scraper API is ideal for lead generation, SEO analysis, content aggregation, AI pipelines, and research tools, enabling users to gather and analyze web content efficiently.
The API uses Mozilla Readability to extract article-quality content, ensuring that the title and body text are clean and relevant, while also handling HTML sanitization and encoding detection automatically.
Yes, the Web Scraper API can detect and extract structured data formats including Schema.org and JSON-LD, providing users with additional context and information from web pages.
网络爬虫 API 返回结构化数据,包括标题、正文文本、元数据(如描述和关键词)、开放图谱标签、网站图标、规范 URL、语言和结构化数据检测(Schema.org 和 JSON-LD)
响应中的关键字段包括“标题”“正文”“元数据”(用于元数据)“网站图标”“规范链接”“语言”“是否支持AMP”“是否包含SchemaOrg”和“是否包含JsonLd”提供了全面的内容详情
响应数据以JSON格式组织,每个键代表关于抓取网页的特定信息,便于解析和集成到应用程序中
端点的主要参数是要抓取的网页的URL 用户可以通过指定不同的URL来自定义他们的请求以从各种网页中提取数据
用户可以利用返回的数据进行各种应用,例如显示文章摘要、分析SEO表现、汇总研究内容或将数据输入AI模型进行进一步处理
数据是从互联网上公共可访问的网页中提取的 确保有广泛的内容可供抓取 前提是这些页面遵守网络抓取政策
通过使用可靠的提取技术来保持数据的准确性,包括Mozilla Readability进行内容提取,以及自动化HTML清理以确保干净和相关的数据
典型的用例包括市场营销的潜在客户生成 网站优化的SEO分析 新闻或研究平台的内容聚合 以及将结构化数据输入AI管道以增强洞察力
服务级别:
100%
响应时间:
2,680ms
服务级别:
100%
响应时间:
203ms
服务级别:
100%
响应时间:
1,394ms
服务级别:
100%
响应时间:
3,497ms
服务级别:
100%
响应时间:
1,302ms
服务级别:
50%
响应时间:
1,253ms
服务级别:
100%
响应时间:
743ms
服务级别:
100%
响应时间:
1,717ms
服务级别:
100%
响应时间:
1,130ms
服务级别:
100%
响应时间:
2,507ms