Des nouvelles ont été ajoutées en tête de listes.
Remontez pour les voir.
Inscription à la newsletter
Le vol d'inférence est le nouveau bug de sécurité des applications AI : comment protéger vos points de terminaison LLM
DEV -
30/05
Une liste de contrôle pratique pour protéger les points de terminaison d'IA publics contre les abus de modèle, les boucles d'agents incontrôlables et les factures d'inférence surprises.
Si votre application expose un point de terminaison d’IA, votre infrastructure la plus coûteuse pourrait désormais être la plus facile à abuser.
Une requête HTTP normale est bon marché. Une requête unique qui déclenche un modèle frontière, une longue boucle d'agent, une recherche sur le Web, des intégrations, des appels d'outils ou l'exécution de code ne l'est pas. Cet écart est ce que les gens appellent le vol d'inférence : des attaquants utilisent vos routes publiques d'IA comme modèle proxy gratuit jusqu'à ce que votre facture, votre quota ou votre latence explose.
Il ne s’agit pas simplement d’un problème consistant à « fixer une limite de taux et à se calmer ». Les requêtes d'IA nécessitent des contrôles contre les abus au niveau du produit, car le travail coûteux se produit souvent une fois que la requête a transmis votre pile Web habituelle.
Décomposons un plan de défense pratique que les développeurs peuvent réellement mettre en œuvre.
Qu’est-ce qui différencie le vol par inférence ?
Les abus d'API traditionnels vous nuisent généralement en raison du volume de requêtes :
Entrer en mode plein écran Quitter le mode plein écran
L’attaquant n’a donc pas toujours besoin d’un trafic important. Ils n’ont besoin que de routes leur permettant de convertir des appels HTTP bon marché en inférences coûteuses.
Modèles de risque courants :
non authentifié/api/chat,/api/générer, ou/api/agentpoints de terminaison
niveaux gratuits généreux sans budget par utilisateur
terrains de jeux anonymes connectés à des modèles de production
boucles d'agent sans limites de pas
téléchargement de fichiers + flux de synthèse sans limite de taille
Points de terminaison RAG qui récupèrent trop de documents par requête
réponses en continu qui continuent de s'exécuter... [Courte citation de 8% de l'article original]
Loading...
🍪
Le modèle économique de notre site repose sur l'affichage de publicités personnalisées basées sur l'utilisation de cookies publicitaires. En continuant votre visite sur notre site, vous consentez à l'utilisation de ces cookies.
Politique de confidentialité