Passer au contenu principal
HuntAI
AccueilClassementsSujets
Soumettre
HuntAI

Découvrez les meilleurs outils IA classés par données de trafic réelles de SimilarWeb.

Explorer

AccueilClassementsSujets

Ressources

Soumettre un outil

Données

Données de trafic fournies par SimilarWeb. Mises à jour quotidiennement.

© 2026 HuntAI. Tous droits réservés.

Privacy PolicyTerms of Service

Données de trafic réelles · Mise à jour quotidienne

  1. Accueil
  2. /
  3. API
  4. /
  5. APIEval-20
APIEval-20

APIEval-20

An open benchmark for AI agents that test APIs

APIArtificial IntelligenceDeveloper Tools
Visiter le site web

No traffic data available yet

Data is sourced from SimilarWeb

À propos de APIEval-20

APIEval-20 is a black-box benchmark for API testing agents. Each agent gets only a JSON schema and one sample payload, then generates a test suite. We run those tests against live reference APIs with planted bugs and score bug detection, API coverage, and efficiency. Unlike LLM-as-judge evals, scoring is fully objective: a bug is either caught or it isn’t. Tasks span auth, errors, pagination, schemas, and multi-step flows. Open on Hugging Face.

Questions fréquentes

Qu'est-ce que APIEval-20 ?

APIEval-20 est APIEval-20 is a black-box benchmark for API testing agents. Each agent gets only a JSON schema and one sample payload, then generates a test suite. We run those tests against live reference APIs with planted bugs and score bug detection, API coverage, and efficiency. Unlike LLM-as-judge evals, scoring is fully objective: a bug is either caught or it isn’t. Tasks span auth, errors, pagination, schemas, and multi-step flows. Open on Hugging Face.

APIEval-20 est-il gratuit ?

Oui, APIEval-20 est gratuit.

Quelles sont les meilleures alternatives à APIEval-20 ?

Parmi les alternatives populaires à APIEval-20, on trouve Airtop Auth, OpenAI o3-mini, Anything API, Fish Audio S1. Comparez leur trafic mensuel et leurs fonctionnalités ci-dessus.

Best API Alternatives to APIEval-20

Airtop Auth

Airtop Auth

54.8K/mo

OpenAI o3-mini

OpenAI o3-mini

191.2M/mo

Anything API

Anything API

Fish Audio S1

Fish Audio S1

2.6M/mo

ChatGPT Images

ChatGPT Images

191.2M/mo

Gemini Deep Research Agent

Gemini Deep Research Agent

8.5M/mo