Modelos Disponibles
La API de Saptiva ofrece una amplia variedad de modelos diseñados para satisfacer diferentes necesidades y presupuestos. Además, tienes la posibilidad de personalizar estos modelos para casos de uso específicos, optimizando su desempeño mediante técnicas avanzadas de ajuste y configuración personalizada.
Descripción general de los modelos
Saptiva Turbo
Qwen 3:30B - No Think
Respuestas rápidas, bajo costo. Soporta tools.
Chats simples, asistentes de alta concurrencia
$0.2
$0.6
Saptiva Cortex
Qwen 3:30B - Think
Tareas de razonamiento. Soporta tools.
Agentes con lógica, comprensión profunda
$0.30
$0.8
Saptiva Ops
GPT OSS:20B
Casos complejos con SDK, Tareas de razonamiento. No soporta tools.
Agentes autónomos, RAG, websearch
$0.2
$0.6
Saptiva Legacy
LLama 3.3:70B
Compatibilidad con herramientas legacy. Soporta tools.
SDK avanzado, pruebas, compatibilidad técnica
$0.2
$0.6
Saptiva OCR
Saptiva OCR
Extracción inteligente de texto
OCR, estructuración de documentos, VLM
$0.15
$0.5
Saptiva Embed
Qwen3 Embedding 8b
Vectorización semántica
Memoria contextual, búsqueda, RAG (generación embeddings)
$0.01
-
Saptiva KAL
Mistral Small 3.2 24B Instruct 2506
Contexto y normatividad de México. Soporta tools.
Agentes conversacionales, RAG, chatbots especializados
$0.2
$0.6
grok3
xAI Grok 3
Buen razonamiento general y contexto medio-largo
Análisis y QA técnico, consultas con contexto medio-largo
$3.00
$15.00
grok3-fast
xAI Grok 3 Fast
Baja latencia en producción
Atención en tiempo real, asistentes en web/app con baja latencia
$5.00
$25.00
grok3-mini
xAI Grok 3 Mini
Bots simples y tareas básicas al menor costo
Bots informativos simples, formularios conversacionales
$0.30
$0.50
grok3-mini-fast
xAI Grok 3 Mini Fast
Tiempo real barato para chats livianos
Chat en vivo barato, soporte básico con SLA estricto
$0.60
$4.00
grok4
xAI Grok 4
Razonamiento profundo y análisis complejos
Razonamiento profundo, planificación, coding asistido avanzado
$3.00
$15.00
grok-code-f1
xAI Grok Code Fast 1
Agentes en tiempo real con lógica
Autocompletado y refactor, explicación de errores, snippets a funciones
$0.20
$1.50
Nota:
Para usar cualquiera de estos modelos en una petición, utiliza exactamente el valor indicado en la columna Nombre.
La columna "Precio por M de tokens IN" se refiere al costo por cada millón de tokens que envías al modelo.
La columna "Precio por M de tokens OUT" corresponde al costo por cada millón de tokens que el modelo genera como respuesta.
cmd-a
Cohere Command A 03-2025
Asistentes empresariales generales, QA y redacción confiable
FAQ internas, redacción de correos/políticas, clasificación de tickets
$0.0156
cmd-r
Cohere Command R 08-2024
Razonamiento y RAG con herramientas
Agentes con tools y RAG, extracción estructurada, recuperación citada
$0.0009
cmd-r-plus
Cohere Command R Plus 08-2024
Razonamiento complejo y respuestas largas
Planeación multi-step, análisis largos, flujos orquestados complejos
$0.0156
llama3.1-405b
Meta LLama 3.1 405b Instruct
Gran calidad open-weights; análisis complejos
Copilotos premium, reportes regulatorios, evaluación de riesgos
$0.0267
llama3.2-90b-v
Meta LLama 3.2 90b Vision Instruct
Multimodal (visión); lectura de imágenes/documentos
Lectura de imágenes/PDFs, extracción de tablas, QA multimodal
$0.005
llama4-scout-17b
Meta LLama 4 Scout 17b 16e Instruct
Alto volumen a bajo costo; tareas rutinarias
Chatbots de alto volumen, respuesta de FAQ, enrutamiento
$0.0018
Explicación de los campos
A continuación, encontrarás una descripción breve de los principales términos utilizados en esta tabla:
Modelo Base: Es el modelo fundacional sobre el que está construido cada modelo específico de Saptiva. Indica su arquitectura y tamaño (cantidad aproximada de parámetros), afectando directamente su capacidad y rendimiento.
Mejor para (Best for): Indica cuál es la fortaleza principal del modelo, es decir, el tipo de tarea o función para la cual fue especialmente diseñado y optimizado.
Caso de Uso (Use Case): Ejemplifica claramente los contextos y situaciones concretas en los que el modelo muestra el mejor desempeño y utilidad.
Última actualización