# Crawler Apis

L'API est également disponible en anglais :

注: Il s'agit d'une API JS et d'une API TCP pour une application JS.

# API de sécurité

获取爬虫的摘要,包括并发性、队列状态和爬取历史记录(成功和失败细目) :

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/stats'

按日期范围过滤历史记录:

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/stats?history_from=yyyy-mm-dd&history_to=yyyy-mm-dd'

# API de sécurité

Le message POST est le suivant :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/purge'

注: 这将立即删除 Le plus récent Le mot est différent.

# Nous ne sommes pas encore API

La version POST est basée sur le RID, le modèle POST (JS/TCP) :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/delete_job?rid=RID'

# Télécharger l'API

La fonction RID est utilisée pour résoudre le problème GET (JS/TCP) :

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/find_by_rid/RID'

Réponse:

  • Autres traductions :
{
  "status": "QUEUED",
  "request_info": {
    "rid": "YOUR_RID",
    "url": "YOUR_URL",
    "retry": 3,
    "created_at": 1600494969.189415
  }
}
  • Remarque NOT_QUEUED : 如果请求已被抓取或者不在队列中。
{
  "status": "NOT_QUEUED",
  "request_info": {
    "rid": "YOUR_RID"
  }
}

# API de remplacement

Le message POST (JS/TCP) est le suivant :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/pause'

# API de sécurité de l'entreprise

Le message POST (JS/TCP) est le suivant :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/unpause'