Mejor VPS para AnythingLLM (2026): Espacios de trabajo que no mueren

AnythingLLM ocupa un lugar intermedio muy útil: más que una interfaz de chat, menos que una configuración completa de LangChain. El concepto de espacio de trabajo y la ingestión de documentos incorporada lo convierten en una opción sensata para equipos que desean un ChatGPT privado con su propia base de conocimientos. Las recomendaciones de hosting en línea son muy variadas porque la mayoría de los revisores lo prueban con espacios de trabajo vacíos.

Corrí AnythingLLM en producción para un proyecto con 30 espacios de trabajo y un corpus de 200K documentos. Esto es lo que realmente requiere la carga de trabajo.

Cuánto cuesta realmente AnythingLLM en RAM

La aplicación es una pila de Node.js más el almacén de vectores LanceDB incrustado. La memoria en reposo ronda los 400 MB.

El principal motor del uso de memoria es la actividad en los espacios de trabajo:

Espacio de trabajo inactivo: 50 MB en memoria
Espacio de trabajo activo con conjunto pequeño de documentos (menos de 100 docs): 200 a 400 MB
Espacio de trabajo activo con gran corpus (más de 10K docs en LanceDB): 1 a 3 GB
Trabajos de ingestión concurrentes: 500 MB a 2 GB dependiendo del tamaño de los documentos

El tamaño en disco también sorprende. El índice LanceDB puede llegar a ocupar de 2 a 5 GB por cada 100K documentos, dependiendo de la dimensión del embedding y la longitud de los documentos.

Comparativa de VPS para AnythingLLM

Proveedor	Plan	vCPU	RAM	Disco	Mensual	Mejor uso
Hetzner Cloud	CCX13	2	8 GB	80 GB NVMe	14.86 EUR	Equipo pequeño, corpus modesto
Contabo VPS	VPS M	6	16 GB	200 GB NVMe	8.49 EUR	Producción económica con gran corpus
DigitalOcean	Premium AMD 8 GB	4	8 GB	160 GB NVMe	56 USD	Equipo en EE. UU., simplicidad operativa
Hetzner CCX23	CCX23	4	16 GB	160 GB NVMe	29.74 EUR	AnythingLLM + Ollama alojados juntos

Hetzner Cloud CCX13: Para equipos pequeños

Para un equipo de 5 a 10 usuarios con espacios de trabajo con menos de 50K documentos en total, el CCX13 es suficiente. 8 GB de RAM sostienen cómodamente la app, el índice LanceDB y la actividad de consultas concurrentes. Un CPU dedicado es importante porque la ingestión de documentos requiere mucho proceso; los planes compartidos muestran lentitud en la ingestión.

Pros:

CPU dedicada mantiene la ingestión predecible
NVMe gestiona bien las escrituras en el índice LanceDB
8 GB de RAM caben varios espacios de trabajo activos sin problemas

Contras:

No suficiente para un escalado serio de documentos, necesitarás ampliar más allá de 50K documentos.

Consigue Hetzner: Hetzner Cloud.

Contabo VPS M: Para producción con muchos documentos

Si tu equipo maneja grandes corpus de documentos (más de 100K docs en varias áreas), los 16 GB de RAM del VPS M de Contabo son la opción más económica. 8.49 EUR al mes por esa especificación son insuperables.

La CPU compartida puede ocasionar lentitud ocasional en la ingestión cuando múltiples usuarios suben documentos simultáneamente. Para importaciones en batch (durante la noche), esto está bien. Para cargas de documentos en tiempo real con múltiples usuarios, la variabilidad puede ser molesta.

Pros:

Mejor especificación bruta por euro para AnythingLLM
200 GB NVMe soporta años de crecimiento en índices de vectores
16 GB de RAM permiten varios espacios de trabajo activos con grandes corpus

Consigue Contabo: Contabo VPS.

DigitalOcean Premium AMD 8 GB: Para operaciones en EE. UU.

56 USD al mes es elevado, pero la calidad de la plataforma importa cuando tu equipo utiliza AnythingLLM a diario. Postgres gestionado para metadata de la app elimina una preocupación operativa. La recuperación mediante snapshots después de una importación de documentos problemática resulta realmente útil.

Opinión sincera: 8 GB de RAM es el mínimo aquí, y puede que necesites 16 GB para un uso serio de los espacios de trabajo, duplicando el costo. En ese caso, compáralo con Hetzner CCX23 autohospedado.

Consigue DigitalOcean: DigitalOcean.

Hetzner CCX23: Para AnythingLLM + Ollama

La opción ideal cuando quieres AnythingLLM más embeddings locales y inferencia local en una sola máquina. 16 GB de RAM permiten alojar el modelo de embeddings (1 a 2 GB), el modelo de inferencia (8 GB) y AnythingLLM con su almacén de vectores (4 a 6 GB), con espacio suficiente de sobra.

Elige esto para despliegues sensibles a la privacidad donde todo debe estar en una sola máquina. Es más barato que múltiples máquinas iguales.

Lo que escogería

Para un equipo pequeño que usa AnythingLLM como un ChatGPT privado con uso ligero de documentos: Hetzner CCX13. Para producción con muchos documentos y presupuesto ajustado: Contabo VPS M. Para hospedaje completo con modelos locales: Hetzner CCX23. AnythingLLM es lo suficientemente estable como para que las recomendaciones de hosting se mantengan hasta 2026.

El panorama completo de VPS está en la comparación SelfHostVPS. AnythingLLM se combina naturalmente con Ollama; consulta esa guía para recomendaciones de backend. ---END---

Frequently asked questions

¿Cuánta RAM necesita realmente AnythingLLM?

El proceso de Node.js se mantiene en reposo con alrededor de 400 MB. Cada espacio de trabajo activo con documentos añade entre 200 MB y 1 GB dependiendo del volumen de documentos y la elección de tienda de vectores. Para un equipo pequeño con 5 a 10 espacios de trabajo y corpus modestos, 4 GB de RAM son suficientes. Para configuraciones más grandes (50+ espacios de trabajo, 100K+ documentos), planea de 8 a 16 GB.

¿Necesita AnythingLLM su propia base de datos de vectores?

Incluye LanceDB ( incrustado) por defecto, que funciona bien para uso personal y equipos pequeños. Los despliegues en producción a menudo cambian a Qdrant o Weaviate para un mejor rendimiento en consultas concurrentes. LanceDB incrustado tiene dificultades con más de 500K documentos o más de 20 usuarios concurrentes. Planea migrar si creces más allá de esa escala.

¿Puede AnythingLLM compartir un VPS con Ollama para un RAG totalmente auto hospedado?

Sí, este es un patrón común. Planea al menos 16 GB de RAM: Ollama con un modelo optimizado para incrustaciones de 7B (nomic-embed-text o similar) usa entre 1 y 2 GB, el modelo de inferencia añade 8 GB, AnythingLLM más su tienda de vectores consume de 4 a 6 GB. El Hetzner CCX23 encaja cómodamente en esto.

¿Cómo se compara AnythingLLM con Open WebUI para hosting?

AnythingLLM es más pesado porque incluye ingestión de documentos, vectores y gestión de espacios. Open WebUI es solo una interfaz de chat proxy a un backend de inferencia. Para chat puro, Open WebUI es más barato. Para RAG documental, AnythingLLM evita conectar componentes. La diferencia de hosting es aproximadamente 2x a favor de Open WebUI solo para chat.