metrics | Agent Skills

product-analytics

llm_evaluation

Implement comprehensive evaluation strategies for LLM applications using automated metrics, human feedback, and benchmarking. Use when testing LLM performance, measuring AI application quality, or establishing evaluation frameworks.

[accuracyagentsalgorithmsartificial

vuralserhat86

4212

skill_evaluator

Evaluates agent skills against Anthropic's best practices. Use when asked to review, evaluate, assess, or audit a skill for quality. Analyzes SKILL.md structure, naming conventions, description quality, content organization, and identifies anti-patterns. Produces actionable improvement recommendations.

[architectureauditautomationbest

vuralserhat86

4212

monitoring-observability

Set up monitoring, logging, and observability for applications and infrastructure. Use when implementing health checks, metrics collection, log aggregation, or alerting systems. Handles Prometheus, Grafana, ELK Stack, Datadog, and monitoring best practices.

monitoringobservabilityloggingmetrics

autohandai

Agent Skills with tag: metrics

product-analytics

llm_evaluation

skill_evaluator

monitoring-observability