AnythingLLM ocupa un lugar intermedio muy útil: más que una interfaz de chat, menos que una configuración completa de LangChain. El concepto de espacio de trabajo y la ingestión de documentos incorporada lo convierten en una opción sensata para equipos que desean un ChatGPT privado con su propia base de conocimientos. Las recomendaciones de hosting en línea son muy variadas porque la mayoría de los revisores lo prueban con espacios de trabajo vacíos.
Corrí AnythingLLM en producción para un proyecto con 30 espacios de trabajo y un corpus de 200K documentos. Esto es lo que realmente requiere la carga de trabajo.
Cuánto cuesta realmente AnythingLLM en RAM
La aplicación es una pila de Node.js más el almacén de vectores LanceDB incrustado. La memoria en reposo ronda los 400 MB.
El principal motor del uso de memoria es la actividad en los espacios de trabajo:
- Espacio de trabajo inactivo: 50 MB en memoria
- Espacio de trabajo activo con conjunto pequeño de documentos (menos de 100 docs): 200 a 400 MB
- Espacio de trabajo activo con gran corpus (más de 10K docs en LanceDB): 1 a 3 GB
- Trabajos de ingestión concurrentes: 500 MB a 2 GB dependiendo del tamaño de los documentos
El tamaño en disco también sorprende. El índice LanceDB puede llegar a ocupar de 2 a 5 GB por cada 100K documentos, dependiendo de la dimensión del embedding y la longitud de los documentos.
Comparativa de VPS para AnythingLLM
| Proveedor | Plan | vCPU | RAM | Disco | Mensual | Mejor uso |
|---|---|---|---|---|---|---|
| Hetzner Cloud | CCX13 | 2 | 8 GB | 80 GB NVMe | 14.86 EUR | Equipo pequeño, corpus modesto |
| Contabo VPS | VPS M | 6 | 16 GB | 200 GB NVMe | 8.49 EUR | Producción económica con gran corpus |
| DigitalOcean | Premium AMD 8 GB | 4 | 8 GB | 160 GB NVMe | 56 USD | Equipo en EE. UU., simplicidad operativa |
| Hetzner CCX23 | CCX23 | 4 | 16 GB | 160 GB NVMe | 29.74 EUR | AnythingLLM + Ollama alojados juntos |
Hetzner Cloud CCX13: Para equipos pequeños
Para un equipo de 5 a 10 usuarios con espacios de trabajo con menos de 50K documentos en total, el CCX13 es suficiente. 8 GB de RAM sostienen cómodamente la app, el índice LanceDB y la actividad de consultas concurrentes. Un CPU dedicado es importante porque la ingestión de documentos requiere mucho proceso; los planes compartidos muestran lentitud en la ingestión.
Pros:
- CPU dedicada mantiene la ingestión predecible
- NVMe gestiona bien las escrituras en el índice LanceDB
- 8 GB de RAM caben varios espacios de trabajo activos sin problemas
Contras:
- No suficiente para un escalado serio de documentos, necesitarás ampliar más allá de 50K documentos.
Consigue Hetzner: Hetzner Cloud.
Contabo VPS M: Para producción con muchos documentos
Si tu equipo maneja grandes corpus de documentos (más de 100K docs en varias áreas), los 16 GB de RAM del VPS M de Contabo son la opción más económica. 8.49 EUR al mes por esa especificación son insuperables.
La CPU compartida puede ocasionar lentitud ocasional en la ingestión cuando múltiples usuarios suben documentos simultáneamente. Para importaciones en batch (durante la noche), esto está bien. Para cargas de documentos en tiempo real con múltiples usuarios, la variabilidad puede ser molesta.
Pros:
- Mejor especificación bruta por euro para AnythingLLM
- 200 GB NVMe soporta años de crecimiento en índices de vectores
- 16 GB de RAM permiten varios espacios de trabajo activos con grandes corpus
Consigue Contabo: Contabo VPS.
DigitalOcean Premium AMD 8 GB: Para operaciones en EE. UU.
56 USD al mes es elevado, pero la calidad de la plataforma importa cuando tu equipo utiliza AnythingLLM a diario. Postgres gestionado para metadata de la app elimina una preocupación operativa. La recuperación mediante snapshots después de una importación de documentos problemática resulta realmente útil.
Opinión sincera: 8 GB de RAM es el mínimo aquí, y puede que necesites 16 GB para un uso serio de los espacios de trabajo, duplicando el costo. En ese caso, compáralo con Hetzner CCX23 autohospedado.
Consigue DigitalOcean: DigitalOcean.
Hetzner CCX23: Para AnythingLLM + Ollama
La opción ideal cuando quieres AnythingLLM más embeddings locales y inferencia local en una sola máquina. 16 GB de RAM permiten alojar el modelo de embeddings (1 a 2 GB), el modelo de inferencia (8 GB) y AnythingLLM con su almacén de vectores (4 a 6 GB), con espacio suficiente de sobra.
Elige esto para despliegues sensibles a la privacidad donde todo debe estar en una sola máquina. Es más barato que múltiples máquinas iguales.
Lo que escogería
Para un equipo pequeño que usa AnythingLLM como un ChatGPT privado con uso ligero de documentos: Hetzner CCX13. Para producción con muchos documentos y presupuesto ajustado: Contabo VPS M. Para hospedaje completo con modelos locales: Hetzner CCX23. AnythingLLM es lo suficientemente estable como para que las recomendaciones de hosting se mantengan hasta 2026.
El panorama completo de VPS está en la comparación SelfHostVPS. AnythingLLM se combina naturalmente con Ollama; consulta esa guía para recomendaciones de backend. ---END---
Frequently asked questions
¿Cuánta RAM necesita realmente AnythingLLM?
El proceso de Node.js se mantiene en reposo con alrededor de 400 MB. Cada espacio de trabajo activo con documentos añade entre 200 MB y 1 GB dependiendo del volumen de documentos y la elección de tienda de vectores. Para un equipo pequeño con 5 a 10 espacios de trabajo y corpus modestos, 4 GB de RAM son suficientes. Para configuraciones más grandes (50+ espacios de trabajo, 100K+ documentos), planea de 8 a 16 GB.
¿Necesita AnythingLLM su propia base de datos de vectores?
Incluye LanceDB ( incrustado) por defecto, que funciona bien para uso personal y equipos pequeños. Los despliegues en producción a menudo cambian a Qdrant o Weaviate para un mejor rendimiento en consultas concurrentes. LanceDB incrustado tiene dificultades con más de 500K documentos o más de 20 usuarios concurrentes. Planea migrar si creces más allá de esa escala.
¿Puede AnythingLLM compartir un VPS con Ollama para un RAG totalmente auto hospedado?
Sí, este es un patrón común. Planea al menos 16 GB de RAM: Ollama con un modelo optimizado para incrustaciones de 7B (nomic-embed-text o similar) usa entre 1 y 2 GB, el modelo de inferencia añade 8 GB, AnythingLLM más su tienda de vectores consume de 4 a 6 GB. El Hetzner CCX23 encaja cómodamente en esto.
¿Cómo se compara AnythingLLM con Open WebUI para hosting?
AnythingLLM es más pesado porque incluye ingestión de documentos, vectores y gestión de espacios. Open WebUI es solo una interfaz de chat proxy a un backend de inferencia. Para chat puro, Open WebUI es más barato. Para RAG documental, AnythingLLM evita conectar componentes. La diferencia de hosting es aproximadamente 2x a favor de Open WebUI solo para chat.