# Crawler Apis

Um Crawler-Statistiques sur l'emploi, emplois à vendre, un Crawler über die API zu bereinigen or einen Crawler anzuhalten/fortzusetzen, folgen Sie bitte den nachstehenden Anweisungen:

Remarque: Remplacez-les par JS-Crawlern dans toutes les API-Aufrufen du TCP-Token à partir du JS-Token.

# API de statistiques

Erhalten Sie eine Zusammenfassung Ihrer Crawler, einschließlich Parallelität, Warteschlangenstatus und Crawling-Verlauf (Aufschlüsselung nach Erfolg und Fehler) :

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/stats'

Verlauf nach Datumsbereich filtern :

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/stats?history_from=yyyy-mm-dd&history_to=yyyy-mm-dd'

# API de nettoyage

Pour un meilleur Crawler zu löschen, stellen Sie ce POST-Anfrage avec eux Crawler-Nom et jeton (JS/TCP) :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/purge'

Remarque: Dadurch sera immédiatement supprimé toutes les pages à partir de Crawler.

# API pour supprimer des emplois

Pour un travail à partir d'un Crawler zu löschen, senden Sie ce POST-Anfrage mit der Anfrage-RID, dem Crawler-Nom et jeton (JS/TCP) :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/delete_job?rid=RID'

# API « Recherche d'emploi »

Une page d'accueil pour le RID dans les locaux de guerre CrawlerPour trouver, utilisez la réponse GET suivante (JS/TCP) :

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/find_by_rid/RID'

Réponses:

  • Si dans le Warteschlange :
{
  "status": "QUEUED",
  "request_info": {
    "rid": "YOUR_RID",
    "url": "YOUR_URL",
    "retry": 3,
    "created_at": 1600494969.189415
  }
}
  • Si ce n'est pas dans la file d'attente : Ob die Anfrage bereits gecrawlt wurde or sich nicht in der Warteschlange befindet.
{
  "status": "NOT_QUEUED",
  "request_info": {
    "rid": "YOUR_RID"
  }
}

# API conserver

À un Crawler anzuhalten, verwenden Sie cette POST-Anfrage avec eux Crawler-Nom et jeton (JS/TCP) :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/pause'

# API renforcée

À un Crawler fortzusetzen, stellen Sie ce POST-Anfrage avec eux Crawler-Nom et jeton (JS/TCP) :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/unpause'