Los precios de APIs cambian mas rapido que la mayoria de los blogs. Por eso esta pieza no intenta venderte una conclusion eterna. Intenta darte una fotografia util, una fecha de corte y los enlaces primarios para volver a verificar cuando toque decidir.
- Usa esta pagina como punto de partida, no como contrato eterno.
- Para decisiones serias, verifica siempre la fuente oficial el mismo dia de la compra o del despliegue.
- El costo real depende tambien de cache, grounding, latencia, revisiones y contexto.
Snapshot de precios verificados
| Proveedor / modelo | Input | Cached input / cache | Output | Fuente |
|---|---|---|---|---|
| OpenAI GPT-5.4 | $2.50 / 1M | $0.25 / 1M | $15.00 / 1M | OpenAI |
| Anthropic Claude Sonnet 4 | $3.00 / 1M | ver caching y long context | $15.00 / 1M | Anthropic |
| Google Gemini 2.5 Pro | $1.25 / 1M <=200k | $0.125 / 1M cache | $10.00 / 1M <=200k | |
| xAI grok-4-1-fast-non-reasoning | $0.20 / 1M | - | $0.50 / 1M | xAI |
| DeepSeek chat (V3.2) | $0.28 / 1M cache miss | $0.028 / 1M cache hit | $0.42 / 1M | DeepSeek |
| Perplexity sonar | $0.25 / 1M | $0.0625 / 1M cache read | $2.50 / 1M | Perplexity |
Lo que la tabla no cuenta por si sola
Un modelo barato puede salir caro si exige muchas correcciones. Un modelo caro puede salir barato si baja reintentos, errores o tiempo humano. En IA, el costo por token importa, pero nunca deberia ser tu unica metrica.
Tambien debes mirar contexto maximo, costo de cache, grounding, tiempo de respuesta y si la herramienta que usas encima mete su propio margen comercial.
Como usar esta pagina sin equivocarte
- Si estas aprendiendo, usa esta tabla para orientarte, no para obsesionarte.
- Si estas presupuestando, combina precio por token con volumen esperado.
- Si estas eligiendo un default productivo, compara tambien fiabilidad y latencia.
Fuentes para seguir profundizando
- OpenAI pricing GPT-5.4: input $2.50, cached input $0.25, output $15.00.
- Anthropic pricing Sonnet 4: input $3, output $15 para <=200K.
- Google Gemini pricing Gemini 2.5 Pro: input $1.25, output $10 para <=200K.
- xAI pricing grok-4-1-fast-non-reasoning: input $0.20, output $0.50.
- DeepSeek pricing deepseek-chat: cache hit $0.028, cache miss $0.28, output $0.42.
- Perplexity Agent API models sonar: input $0.25, output $2.50, cache read $0.0625.
Que leer despues
Conversa con la academia y deja criterio publico.
Ahora el acceso vive arriba a la derecha, como debe ser. Desde ahi puedes entrar, comentar y abrir el bot flotante para resolver dudas puntuales sin romper la lectura.
Los comentarios se moderan cuando hace falta, los aportes utiles se votan y el bot flotante responde corto, con contexto del articulo y limites claros de uso.