Nuestra Arquitectura
Transparencia radical. Así construimos sistemas autónomos, seguros y de alto rendimiento.
Motores Cognitivos
Nuestra arquitectura es agnóstica al proveedor de LLM. Soportamos múltiples modelos simultáneamente con fallback automático — si uno satura o falla, el sistema conmuta al siguiente sin interrupción.
Google Gemini
Motor principal para razonamiento multimodal y contextos extensos. Su ventana de 1M+ tokens permite analizar bases documentales completas en una sola inferencia.
Groq — Llama 3.3 70B
Velocidad extrema para respuestas en tiempo real. Nuestro modelo de producción principal para conversaciones de Instagram. Inferencia en milisegundos gracias al hardware LPU de Groq.
Anthropic Claude
Razonamiento avanzado y máxima seguridad en outputs. Especialmente útil para tareas de análisis complejo, síntesis documental y casos donde la precisión es crítica.
OpenAI ChatGPT
El estándar de la industria. Integrado como proveedor adicional para casos de uso donde el cliente lo requiere explícitamente o donde la compatibilidad con herramientas de terceros es prioritaria.
Ollama — Modelos Locales
Privacidad total. Ejecutamos modelos como Llama 3.1, Qwen 2.5 y nomic-embed-text directamente en local. Los datos sensibles nunca salen de la infraestructura propia.
DeepSeek
Alternativa de alto rendimiento y coste reducido. Integrado como proveedor adicional para escenarios de alto volumen donde el equilibrio coste/calidad es determinante.
Core & Orquestación
n8n
El sistema nervioso central. Orquesta la arquitectura de microservicios. Cada agente es un conjunto de flujos especializados que se llaman entre sí.
Redis Streams
Bus de mensajes asíncrono. Los mensajes entrantes se encolan en streams por canal.
Qdrant Vector DB
Memoria semántica de alta velocidad. Almacén de conocimiento para nuestros agentes.
Context Manager
Inteligencia de contexto para dotar de memoria y comprensión contextual.
mcp-*
Microservicios propios de procesamiento asíncrono, decargas, habilitación multimedia para agentes, procesamiento paralelo.
MCP — Model Context Protocol
Protocolo estándar para dotar a los agentes de desarrollo de capacidades externas. Nuestra flota de MCPs incluye acceso a nuestra infraestructura, SSH remoto y gestión de flujos desde el entorno de desarrollo.
Datos & CRM
PostgreSQL
Base de datos maestra del sistema agente. Almacena usuarios, conversaciones, configuración de agentes, prompts, herramientas, logs de ejecución y analytics de LLM. Esquema propio agencia_schema con nomenclatura estandarizada.
Redis
Caché de sesiones, cola de ejecución de n8n (Bull) y bus de mensajes asíncrono (Streams).
EspoCRM
CRM nativo integrado con el sistema agente. Los leads cualificados se registran automáticamente. El agente puede consultar el historial de un cliente durante la conversación para personalizar la respuesta según interacciones previas.
NocoDB
Interfaz visual sobre PostgreSQL para gestión operativa del sistema — configuración de agentes, prompts, herramientas y reglas de ruteo sin necesidad de SQL directo. CMS headless para el panel de administración.
MinIO — Almacenamiento S3
Almacenamiento de objetos compatible con S3. Gestiona nuestro conocimiento, la capacidad multimedia de nuestros agentes, nuestros backups.
Seguridad Activa
Arquitectura de seguridad en capas: detección comportamental, bloqueo en proxy, filtrado en CDN, WAF en tiempo real y autenticación centralizada. Cada capa es independiente — si una falla, las demás siguen activas.
CrowdSec IPS
Intrusion PreventionMotor de análisis comportamental colaborativo. Si una IP ataca a cualquier servidor de la red global CrowdSec, es bloqueada en nuestra infraestructura automáticamente. Analiza logs de Caddy, SSH y sistema operativo en tiempo real.
Cloudflare CDN + WAF
Capa L3Primera línea de defensa. Filtra tráfico malicioso antes de que llegue al servidor. Las IPs baneadas por CrowdSec se sincronizan automáticamente con Cloudflare cada 10 segundos via IP Lists API — bloqueo coordinado en ambas capas.
Caddy + AppSec WAF
Capa L7Proxy inverso con bouncer de CrowdSec integrado. Consulta la LAPI en cada petición HTTP. El módulo AppSec WAF analiza el payload de las peticiones en tiempo real para detectar inyecciones SQL, XSS y otras amenazas de aplicación.
Authelia
Zero TrustIdentity Provider con MFA obligatorio para todos los servicios internos. Integrado con Caddy via forward_auth. Ningún panel de administración está accesible sin autenticación de doble factor.
Tailscale — Red Privada
Zero Config VPNRed privada cifrada entre nuestros servidores. Todo el tráfico interno — despliegues CI/CD, accesos — viaja por Tailscale sin exponer puertos adicionales a internet. La infraestructura distribuida se comporta como una red local.
Infraestructura
Arquitectura híbrida Cloud-Edge. Servicios en la nube y locales conectados
VPS IONOS — Cloud Node
Nodo público en centro de datos de España.
Servidores locales — Edge Nodes
Nodo privado de inferencia. Ejecuta Ollama con modelos locales.
Docker
Servicios contenerizados de alto rendimiento.
Hetzner
Proveedor adicional para conexiones de apoyo
Restic — Backups Cifrados
Sistema de backups cifrados de toda la infraestructura.
Desarrollo & Operaciones
Roo Code
Agente de desarrollo autónomo integrado
GitHub Actions — CI/CD
Infraestructura como Código (IaC). Pipelines de despliegues automáticos.
Outline — Documentación
Wiki interna para documentación y conocimiento.
Dozzle — Monitorización
Visor de logs en tiempo real