> For the complete documentation index, see [llms.txt](https://saptiva.gitbook.io/saptiva-docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://saptiva.gitbook.io/saptiva-docs/mejores-practicas/rag.md).

# RAG

**RAG** (*Retrieval-Augmented Generation*) es una técnica que permite a un modelo de lenguaje generar respuestas más útiles y precisas **consultando información externa y actualizada**, como documentos, bases de datos o archivos empresariales.

\
En lugar de "adivinar" basándose solo en lo que fue entrenado, el modelo **busca contenido relevante y luego genera la respuesta con base en eso**.

### ¿Cómo funciona?

RAG transforma los documentos en un formato matemático llamado **vectores**, que capturan el significado "semántico" del texto.

Estos vectores se almacenan en una **base de datos vectorial**, donde pueden ser rápidamente comparados con nuevas preguntas mediante algo llamado **búsqueda semántica.** Cuando haces una consulta, el sistema convierte tu pregunta en un vector, **busca los fragmentos más similares**, y se los pasa al modelo de lenguaje para que genere una respuesta precisa, fluida y contextualizada.

{% hint style="info" %}
🧠 En otras palabras: RAG es como tener una memoria externa inteligente. El modelo recuerda “cómo hablar” pero consulta los datos actualizados antes de responder.
{% endhint %}

### Arquitectura del Sistema

Nuestro sistema RAG en Saptiva se compone de tres elementos principales que trabajan en conjunto:

1. **Procesamiento de datos con Saptiva Embed:**\
   Transformamos los documentos en vectores semánticos usando nuestro modelo de embeddings propio, **Saptiva Embed**. Esto permite realizar búsquedas basadas en significado, no solo coincidencias literales, y garantiza compatibilidad óptima con nuestros modelos generativos.
2. **Motor de recuperación:**\
   Utiliza esos vectores para encontrar los fragmentos más relevantes ante cada consulta.\
   Este paso asegura que las respuestas se fundamenten en datos actualizados, específicos y trazables.
3. **Generación con Saptiva Cortex:**\
   Combinamos los fragmentos recuperados con las capacidades del modelo de lenguaje **Saptiva Cortex**, optimizado para trabajar en conjunto con **Saptiva Embed**, asegurando una alineación semántica precisa entre lo que se busca y lo que se genera.

### Gestión y Mantenimiento

El mantenimiento de un sistema RAG requiere atención continua a varios aspectos clave:

La actualización de datos debe realizarse de manera regular y sistemática para mantener la relevancia de las respuestas. Esto incluye la incorporación de nueva información y la depuración de datos obsoletos.

El rendimiento del sistema se monitorea constantemente mediante métricas específicas que evalúan tanto la precisión de las respuestas como la eficiencia del proceso de recuperación.

La calidad de las respuestas se asegura mediante un proceso de validación que verifica la coherencia entre la información recuperada y las respuestas generadas.

### Beneficios para el Negocio

La implementación de RAG en Saptiva ofrece ventajas competitivas significativas. Nuestros clientes se benefician de respuestas más precisas y actualizadas, mientras que la empresa mantiene un control total sobre la información proporcionada. La capacidad de auditar y rastrear las fuentes de información aumenta la confiabilidad y transparencia de nuestros servicios.

### Ejemplo: RAGster <a href="#rag-is-the-most-cost-effective-easy-to-implement-and-lowest-risk-path-to-higher-performance-for-gena" id="rag-is-the-most-cost-effective-easy-to-implement-and-lowest-risk-path-to-higher-performance-for-gena"></a>

{% hint style="info" %}
Consulta nuestro repositorio RAGster como implementación de referencia  para arquitecturas RAG con un UI integrado para la carga de documentos.
{% endhint %}


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://saptiva.gitbook.io/saptiva-docs/mejores-practicas/rag.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.