# réponse

当执行请求时 Crawlbase 你会得到回复。

Il s'agit d'une version JSON basée sur un code HTML html. format Cliquez ici (en anglais) pour ouvrir le code HTML.

# Réponse HTML

Il s'agit d'une version HTML de la version HTML.

Celui-là 响应参数 将添加到响应标头中。

GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=html'
Response:
  Headers:
    url: https://github.com/crawlbase?tab=repositories
    original_status: 200
    pc_status: 200
    'X-Domain-Complexity': standard

  Body:
    <!doctype html><html class="a-no-js" data-19ax5a9jf="dingo"><!-- sp:feature:head-start -->
    <head><script>var aPageStart = (new Date()).getTime();</script><meta charset="utf-8">
    ... (all the html of the page)

# Réponse JSON

JSON est une application JSON.

此对象包含您需要的所有信息。 读 响应参数 Il y a tellement de choses à faire ici.

GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=json'
Response:
{
  "original_status": "200",
  "pc_status": 200,
  "url": "https://github.com/crawlbase?tab=repositories",
  "domain_complexity": "standard",
  "body": "\u003C!doctype html\u003E\u003Chtml class=\"a-no-js\" data-19ax5a9jf\n... (all the html of the page)"
}

# En-têtes

JSON et html 将返回 json en cours de développementTraduction en html,这将使您知道请求发生了什么。

# URL

URL de l'URL de l'URL de l'URL de l'URL de l'URL de l'URL de l'URL de l'URL Crawlbase Suivie par.

# statut_original

我们(的状态响应Crawlbase) L'URL est la suivante.

Il s'agit d'un site http 状态码.

请 注意: Crawlbase 仅收取以下请求的费用 original_status 成功 (200, 201, 204), 永久重定向 (301), 临时重定向 (302) 如果跟随重定向返回内容,未找到 (410, 404)。 pc_status Depuis 200 ans. original_status 收到的代码将不收费。

# pc_status

Celui-là Crawlbase (pc)
例如,一个网站可能会返回 original_status 200 pièces de monnaie, et XNUMX pièces de monnaie. pc_status Numéro 503.

任何非标准代码(如 601、999等)均用于内部工程团队,仅用于在联系支持时帮助您调试问题。

请 注意: à Crawlbase 最终以失败告终 pc_status 代码(与 200 不同)不会收费。

# Complexité du domaine X

La réponse à cette question est :

  • standard – 易于抓取或爬取的域名,且保护措施较少。这些域名通常价格最低。
  • moderate –具有中等反机器人保护措施的域名,需要专门处理。这些域名通常具有中等定价等级,并且处理起来需要更多资源。
  • complex –拥有高级防护系统的域名,难以抓取或爬取。这类域名需要先进的技术和专业资源,价格也较高。

了解不同域名的复杂程度有助于您估算抓取任务的潜在价格和技术考虑因素。有关基于域名复杂程度的具体价格信息,请参阅您的订阅计划或通过以下方式联系我们的销售团队 : 联系页面.

# corps

此参数仅在 json 中可用 format, en html format 将是响应本身的主体。

Contenu de la page Crawlbase 发现这是代理抓取请求中发送的 URL的结果。