Playbook
Sistemas RAG
Recuperación fiable aunque cambien los documentos.
Un RAG real es más que embeddings. Trata ingesta, recuperación y ensamblaje de respuesta como capas separadas y testeables.
Ingesta + chunking
Preserva estructura y procedencia.
- Normaliza fuentes (PDF, DOCX, HTML) a un esquema estable
- Divide por encabezados o límites semánticos, no por longitud fija
- Guarda metadatos de propiedad, acceso y timestamps
- Versiona documentos para rollback o comparación
Estrategia de recuperación
Obtén el contexto correcto antes de generar.
- Búsqueda híbrida (BM25 + vector) supera embeddings puros
- Usa filtros de metadatos y control de acceso en la recuperación
- Re‑rank de resultados con un modelo ligero
- Cachea queries frecuentes y mantiene ventana de frescura
Ensamblaje de respuesta
Las citas no son opcionales en producción.
- Prompts con requisitos explícitos de citas
- Rechaza cuando no hay fuentes o baja confianza
- Usa un esquema estricto de respuesta para evitar drift
Modos de fallo
- Docs obsoletos o faltantes que causan alucinaciones
- Sobreinclusión de contexto irrelevante
- Fuentes en conflicto sin desambiguación
- Cero visibilidad sobre calidad de recuperación
Lista de verificación
- Test set con queries top y edge cases
- Dashboard de calidad de recuperación
- Citas obligatorias en prompts
- Filtros de acceso en retrieval