# Répondre
Si vous avez une question à propos de Crawlbase Vous obtenez une réponse.
Cette réponse est un objet JSON ou le code HTML de la page, en utilisant l'option, avec eux Format Paramètre (Standard est HTML).
# Réponse HTML
Si le format de réponse HTML est ausgewählt (c'était l'instellung standard), vous pourrez également obtenir le HTML de la page comme réponse.
La société Paramètre de réponse wird den Antwortheadern hinzugefügt.
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=html'
Response:
Headers:
url: https://github.com/crawlbase?tab=repositories
original_status: 200
pc_status: 200
'X-Domain-Complexity': standard
Body:
<!doctype html><html class="a-no-js" data-19ax5a9jf="dingo"><!-- sp:feature:head-start -->
<head><script>var aPageStart = (new Date()).getTime();</script><meta charset="utf-8">
... (all the html of the page)
# Réponse JSON
Si vous avez utilisé le format de réponse JSON, vous aurez un objet JSON qui pourra être analysé.
Cet objet contient toutes les informations qui vous conviennent. Lisez-vous Paramètre de réponse pour toutes les informations.
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=json'
Response:
{
"original_status": "200",
"pc_status": 200,
"url": "https://github.com/crawlbase?tab=repositories",
"domain_complexity": "standard",
"body": "\u003C!doctype html\u003E\u003Chtml class=\"a-no-js\" data-19ax5a9jf\n... (all the html of the page)"
}
# En-têtes
Nous vous proposons des exemples obligatoires, qui contiennent la réponse JSON ou HTML. Paramètre pour JSON ou En-tête pour HTML, Damit Sie erfahren, était mit der Anfrage passiert ist.
# URL
L'URL proposée, dans la page d'accueil, ou l'URL du guide d'utilisation, est Crawlbase suivi.
# statut_original
La réponse à ce statut est que nous (Crawlbase) lors du Crawlen der in der Anfrage geendeten URL erhalten.
Vous pouvez utiliser le même code d'état HTTP.
Veuillez noter que Crawlbase Es werden nur Anfragen berechnet, die original_status Erfolg (200, 201, 204), permanente Weiterleitung (301), temporäre Weiterleitung (302), wenn die folgende Weiterleitung Inhalt zurückgegeben hat, nicht gefunden (410, 404). Et quand pc_status est 200. Tous les autres original_status Für die erhaltenen Codes fall keine Gebühren an.
# pc_status
La société Crawlbase (PC) Le Statuscode peut croire que le Statuscode est à l'intérieur et l'ist du Code, der letztendlich gültig ist.
Beispielsweise könnte eine Website original_status 200 avec un captcha, cet automne, pc_status sera 503 son.
Ce code n'est pas conforme à la norme, comme l'Etwa 601, 999 USW., un stagiaire de l'équipe d'ingénierie travaille et n'est pas responsable de l'assistance technique lorsque vous êtes en contact avec le support.
S'il vous plaît noter que demander à Crawlbase cela se termine avec un erfolglosen pc_status Code (également sous 200) wird nicht berechnet.
# Complexité du domaine X
Le Komplexitätsgrad donne, comme les chenilles ou les grattoirs, un meilleur domaine, et offre également des ressources et un prix plus larges :
standard– Domaines, qui doivent être facilement explorés ou grattés et n'ont pas besoin d'une protection minimale. Ces domaines ont été placés dans le cadre du prix le plus bas.moderate– Domänen mit modérém Anti-Bot-Schutz, die eine spezielle Behandlung erfordern. Ces domaines ont un type typique d'un meilleur prix et sont des ressources intensives pour l'aménagement.complex– Domänen mit erweiterten Schutzsystemen, die schwer zu crawlen oder zu scrapen sind. Ces compétences techniques avancées et ces ressources spécialisées étaient si bien dans le cadre du haut prix plus large.
Das Verständnis des Komplexitätsgrads verschiedener Domänen hilft Ihnen, potenzielle Preise and technische Aspekte for Ihre Crawling-Aufgaben abzuschätzen. Des informations spécifiques sur les bases de données sur les structures complexes du domaine se trouvent dans votre plan d'abonnement ou auprès de nos partenaires commerciaux. contact.
# corps
Ce paramètre n'est pas utilisé dans JSON Format, en html format wird der Hauptteil der Answer selbst sein.
Le contenu de la page, le Crawlbase Gefunden als Ergebnis des Proxy-Crawlings der in der Anfrage geendeten URL.