> For the complete documentation index, see [llms.txt](https://saptiva.gitbook.io/saptiva-docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://saptiva.gitbook.io/saptiva-docs/basicos/modelos-disponibles.md). # Modelos Disponibles La **API** de **Saptiva** ofrece una amplia variedad de modelos diseñados para satisfacer diferentes necesidades y presupuestos. Además, tienes la posibilidad de personalizar estos modelos para casos de uso específicos, optimizando su desempeño mediante técnicas avanzadas de ajuste y configuración personalizada. ## Descripción general de los modelos

Nombre	Modelo Base	Mejor para	Caso de Uso	Precio por M de tokens IN	Precio por M de tokens OUT
`Saptiva Turbo`	Qwen 3:30B - No Think	Respuestas rápidas, bajo costo. Soporta tools.	Chats simples, asistentes de alta concurrencia	$0.2	$0.6
`Saptiva Cortex`	Qwen 3:30B - Think	Tareas de razonamiento. Soporta tools.	Agentes con lógica, comprensión profunda	$0.30	$0.8
`Saptiva Ops`	GPT OSS:20B	Casos complejos con SDK, Tareas de razonamiento. No soporta tools.	Agentes autónomos, RAG, websearch	$0.2	$0.6
`Saptiva Legacy`	LLama 3.3:70B	Compatibilidad con herramientas legacy. Soporta tools.	SDK avanzado, pruebas, compatibilidad técnica	$0.2	$0.6
`Saptiva OCR`	Saptiva OCR	Extracción inteligente de texto	OCR, estructuración de documentos, VLM	$0.15	$25.50
`Saptiva Embed`	Qwen3 Embedding 8b	Vectorización semántica	Memoria contextual, búsqueda, RAG (generación embeddings)	$0.01	-
`Saptiva KAL`	Mistral Small 3.2 24B Instruct 2506	Contexto y normatividad de México. Soporta tools.	Agentes conversacionales, RAG, chatbots especializados	$0.2	$0.6

> **Nota:** > > * Para usar cualquiera de estos modelos en una petición, utiliza exactamente el valor indicado en la columna **Nombre**. > * La columna "Precio por M de tokens IN" se refiere al costo por cada millón de tokens que envías al modelo. > * La columna "Precio por M de tokens OUT" corresponde al costo por cada millón de tokens que el modelo genera como respuesta.

Nombre	Modelo Base	Mejor para	Caso de Uso	Precio por 10k caracteres
cmd-a	Cohere Command A 03-2025	Asistentes empresariales generales, QA y redacción confiable	FAQ internas, redacción de correos/políticas, clasificación de tickets	$0.0265
cmd-r	Cohere Command R 08-2024	Razonamiento y RAG con herramientas	Agentes con tools y RAG, extracción estructurada, recuperación citada	$0.0015
cmd-r-plus	Cohere Command R Plus 08-2024	Razonamiento complejo y respuestas largas	Planeación multi-step, análisis largos, flujos orquestados complejos	$0.0265
llama3.1-405b	Meta LLama 3.1 405b Instruct	Gran calidad open-weights; análisis complejos	Copilotos premium, reportes regulatorios, evaluación de riesgos	$0.0454
llama3.2-90b-v	Meta LLama 3.2 90b Vision Instruct	Multimodal (visión); lectura de imágenes/documentos	Lectura de imágenes/PDFs, extracción de tablas, QA multimodal	$0.009
llama4-maverick-17b	Meta LLama 4 Maverick 17b 128e Instruct fp8	Rápido y eficiente; automatizaciones ligeras	Chat interno rápido, automatizaciones ligeras, clasificación	$0.0031
llama4-scout-17b	Meta LLama 4 Scout 17b 16e Instruct	Alto volumen a bajo costo; tareas rutinarias	Chatbots de alto volumen, respuesta de FAQ, enrutamiento	$0.0031

*** ### Explicación de los campos A continuación, encontrarás una descripción breve de los principales términos utilizados en esta tabla: * **Modelo Base**: Es el modelo fundacional sobre el que está construido cada modelo específico de **Saptiva**. Indica su arquitectura y tamaño (cantidad aproximada de parámetros), afectando directamente su capacidad y rendimiento. * **Mejor para (Best for)**: Indica cuál es la fortaleza principal del modelo, es decir, el tipo de tarea o función para la cual fue especialmente diseñado y optimizado. * **Caso de Uso (Use Case)**: Ejemplifica claramente los contextos y situaciones concretas en los que el modelo muestra el mejor desempeño y utilidad. --- # Agent Instructions This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com. ## Querying This Documentation If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question. Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter: ``` GET https://saptiva.gitbook.io/saptiva-docs/basicos/modelos-disponibles.md?ask=&goal= ``` `ask` is the immediate question: it should be specific, self-contained, and written in natural language. `goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal. The response will contain a direct answer to the question and relevant excerpts and sources from the documentation. Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.