> For the complete documentation index, see [llms.txt](https://saptiva.gitbook.io/saptiva-docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://saptiva.gitbook.io/saptiva-docs/basicos/modelos-disponibles.md).

# Modelos Disponibles

La **API** de **Saptiva** ofrece una amplia variedad de modelos diseñados para satisfacer diferentes necesidades y presupuestos. Además, tienes la posibilidad de personalizar estos modelos para casos de uso específicos, optimizando su desempeño mediante técnicas avanzadas de ajuste y configuración personalizada.

## Descripción general de los modelos

<table><thead><tr><th>Nombre</th><th>Modelo Base</th><th width="139.818115234375">Mejor para</th><th width="128">Caso de Uso</th><th>Precio por M de tokens IN</th><th width="128">Precio por M de tokens OUT</th></tr></thead><tbody><tr><td><code>Saptiva Turbo</code></td><td>Qwen 3:30B - No Think</td><td>Respuestas rápidas, bajo costo. Soporta tools.</td><td>Chats simples, asistentes de alta concurrencia</td><td>$0.2</td><td>$0.6</td></tr><tr><td><code>Saptiva Cortex</code></td><td>Qwen 3:30B - Think</td><td>Tareas de razonamiento. Soporta tools.</td><td>Agentes con lógica, comprensión profunda</td><td>$0.30</td><td>$0.8</td></tr><tr><td><code>Saptiva Ops</code></td><td>GPT OSS:20B</td><td>Casos complejos con SDK, Tareas de razonamiento.<br>No soporta tools.</td><td>Agentes autónomos, RAG, websearch</td><td>$0.2</td><td>$0.6</td></tr><tr><td><code>Saptiva Legacy</code></td><td>LLama 3.3:70B</td><td>Compatibilidad con herramientas legacy. Soporta tools.</td><td>SDK avanzado, pruebas, compatibilidad técnica</td><td>$0.2</td><td>$0.6</td></tr><tr><td><code>Saptiva OCR</code></td><td>Saptiva OCR</td><td>Extracción inteligente de texto</td><td>OCR, estructuración de documentos, VLM</td><td>$0.15</td><td>$25.50</td></tr><tr><td><code>Saptiva Embed</code></td><td>Qwen3 Embedding 8b</td><td>Vectorización semántica</td><td>Memoria contextual, búsqueda, RAG (generación embeddings)</td><td>$0.01</td><td>-</td></tr><tr><td><code>Saptiva KAL</code></td><td>Mistral Small 3.2 24B Instruct 2506</td><td>Contexto y normatividad de México. Soporta tools.</td><td>Agentes conversacionales, RAG, chatbots especializados</td><td>$0.2</td><td>$0.6</td></tr></tbody></table>

> **Nota:**
>
> * Para usar cualquiera de estos modelos en una petición, utiliza exactamente el valor indicado en la columna **Nombre**.
> * La columna "Precio por M de tokens IN" se refiere al costo por cada millón de tokens que envías al modelo.
> * La columna "Precio por M de tokens OUT" corresponde al costo por cada millón de tokens que el modelo genera como respuesta.

<table><thead><tr><th width="128">Nombre</th><th>Modelo Base</th><th>Mejor para</th><th>Caso de Uso</th><th>Precio por 10k caracteres</th></tr></thead><tbody><tr><td>cmd-a</td><td>Cohere Command A 03-2025</td><td>Asistentes empresariales generales, QA y redacción confiable</td><td>FAQ internas, redacción de correos/políticas, clasificación de tickets</td><td>$0.0265</td></tr><tr><td>cmd-r</td><td>Cohere Command R 08-2024</td><td>Razonamiento y RAG con herramientas</td><td>Agentes con tools y RAG, extracción estructurada, recuperación citada</td><td>$0.0015</td></tr><tr><td>cmd-r-plus</td><td>Cohere Command R Plus 08-2024</td><td>Razonamiento complejo y respuestas largas</td><td>Planeación multi-step, análisis largos, flujos orquestados complejos</td><td>$0.0265</td></tr><tr><td>llama3.1-405b</td><td>Meta LLama 3.1 405b Instruct</td><td>Gran calidad open-weights; análisis complejos</td><td>Copilotos premium, reportes regulatorios, evaluación de riesgos</td><td>$0.0454</td></tr><tr><td>llama3.2-90b-v</td><td>Meta LLama 3.2 90b Vision Instruct</td><td>Multimodal (visión); lectura de imágenes/documentos</td><td>Lectura de imágenes/PDFs, extracción de tablas, QA multimodal</td><td>$0.009</td></tr><tr><td>llama4-maverick-17b</td><td>Meta LLama 4 Maverick 17b 128e Instruct fp8</td><td>Rápido y eficiente; automatizaciones ligeras</td><td>Chat interno rápido, automatizaciones ligeras, clasificación</td><td>$0.0031</td></tr><tr><td>llama4-scout-17b</td><td>Meta LLama 4 Scout 17b 16e Instruct</td><td>Alto volumen a bajo costo; tareas rutinarias</td><td>Chatbots de alto volumen, respuesta de FAQ, enrutamiento</td><td>$0.0031</td></tr></tbody></table>

***

### Explicación de los campos

A continuación, encontrarás una descripción breve de los principales términos utilizados en esta tabla:

* **Modelo Base**: Es el modelo fundacional sobre el que está construido cada modelo específico de **Saptiva**. Indica su arquitectura y tamaño (cantidad aproximada de parámetros), afectando directamente su capacidad y rendimiento.
* **Mejor para (Best for)**: Indica cuál es la fortaleza principal del modelo, es decir, el tipo de tarea o función para la cual fue especialmente diseñado y optimizado.
* **Caso de Uso (Use Case)**: Ejemplifica claramente los contextos y situaciones concretas en los que el modelo muestra el mejor desempeño y utilidad.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://saptiva.gitbook.io/saptiva-docs/basicos/modelos-disponibles.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
