hammer-brushModelos Disponibles

La API de Saptiva ofrece una amplia variedad de modelos diseñados para satisfacer diferentes necesidades y presupuestos. Además, tienes la posibilidad de personalizar estos modelos para casos de uso específicos, optimizando su desempeño mediante técnicas avanzadas de ajuste y configuración personalizada.

Descripción general de los modelos

Nombre
Modelo Base
Mejor para
Caso de Uso
Precio por M de tokens IN
Precio por M de tokens OUT

Saptiva Turbo

Qwen 3:30B - No Think

Respuestas rápidas, bajo costo. Soporta tools.

Chats simples, asistentes de alta concurrencia

$0.2

$0.6

Saptiva Cortex

Qwen 3:30B - Think

Tareas de razonamiento. Soporta tools.

Agentes con lógica, comprensión profunda

$0.30

$0.8

Saptiva Ops

GPT OSS:20B

Casos complejos con SDK, Tareas de razonamiento. No soporta tools.

Agentes autónomos, RAG, websearch

$0.2

$0.6

Saptiva Legacy

LLama 3.3:70B

Compatibilidad con herramientas legacy. Soporta tools.

SDK avanzado, pruebas, compatibilidad técnica

$0.2

$0.6

Saptiva OCR

Saptiva OCR

Extracción inteligente de texto

OCR, estructuración de documentos, VLM

$0.15

$0.5

Saptiva Embed

Qwen3 Embedding 8b

Vectorización semántica

Memoria contextual, búsqueda, RAG (generación embeddings)

$0.01

-

Saptiva KAL

Mistral Small 3.2 24B Instruct 2506

Contexto y normatividad de México. Soporta tools.

Agentes conversacionales, RAG, chatbots especializados

$0.2

$0.6

grok3

xAI Grok 3

Buen razonamiento general y contexto medio-largo

Análisis y QA técnico, consultas con contexto medio-largo

$3.00

$15.00

grok3-fast

xAI Grok 3 Fast

Baja latencia en producción

Atención en tiempo real, asistentes en web/app con baja latencia

$5.00

$25.00

grok3-mini

xAI Grok 3 Mini

Bots simples y tareas básicas al menor costo

Bots informativos simples, formularios conversacionales

$0.30

$0.50

grok3-mini-fast

xAI Grok 3 Mini Fast

Tiempo real barato para chats livianos

Chat en vivo barato, soporte básico con SLA estricto

$0.60

$4.00

grok4

xAI Grok 4

Razonamiento profundo y análisis complejos

Razonamiento profundo, planificación, coding asistido avanzado

$3.00

$15.00

grok-code-f1

xAI Grok Code Fast 1

Agentes en tiempo real con lógica

Autocompletado y refactor, explicación de errores, snippets a funciones

$0.20

$1.50

Nota:

  • Para usar cualquiera de estos modelos en una petición, utiliza exactamente el valor indicado en la columna Nombre.

  • La columna "Precio por M de tokens IN" se refiere al costo por cada millón de tokens que envías al modelo.

  • La columna "Precio por M de tokens OUT" corresponde al costo por cada millón de tokens que el modelo genera como respuesta.

Nombre
Modelo Base
Mejor para
Caso de Uso
Precio por 10k transacciones

cmd-a

Cohere Command A 03-2025

Asistentes empresariales generales, QA y redacción confiable

FAQ internas, redacción de correos/políticas, clasificación de tickets

$0.0156

cmd-r

Cohere Command R 08-2024

Razonamiento y RAG con herramientas

Agentes con tools y RAG, extracción estructurada, recuperación citada

$0.0009

cmd-r-plus

Cohere Command R Plus 08-2024

Razonamiento complejo y respuestas largas

Planeación multi-step, análisis largos, flujos orquestados complejos

$0.0156

llama3.1-405b

Meta LLama 3.1 405b Instruct

Gran calidad open-weights; análisis complejos

Copilotos premium, reportes regulatorios, evaluación de riesgos

$0.0267

llama3.2-90b-v

Meta LLama 3.2 90b Vision Instruct

Multimodal (visión); lectura de imágenes/documentos

Lectura de imágenes/PDFs, extracción de tablas, QA multimodal

$0.005

llama4-scout-17b

Meta LLama 4 Scout 17b 16e Instruct

Alto volumen a bajo costo; tareas rutinarias

Chatbots de alto volumen, respuesta de FAQ, enrutamiento

$0.0018


Explicación de los campos

A continuación, encontrarás una descripción breve de los principales términos utilizados en esta tabla:

  • Modelo Base: Es el modelo fundacional sobre el que está construido cada modelo específico de Saptiva. Indica su arquitectura y tamaño (cantidad aproximada de parámetros), afectando directamente su capacidad y rendimiento.

  • Mejor para (Best for): Indica cuál es la fortaleza principal del modelo, es decir, el tipo de tarea o función para la cual fue especialmente diseñado y optimizado.

  • Caso de Uso (Use Case): Ejemplifica claramente los contextos y situaciones concretas en los que el modelo muestra el mejor desempeño y utilidad.

Última actualización