Miglior VPS per AnythingLLM (2026): Spazi di lavoro che Non Muoiono

AnythingLLM occupa una posizione di mezzo utile: più di una chat UI, meno di una configurazione completa di LangChain. Il concetto di workspace e l’ingestione di documenti integrata lo rendono una scelta sensata per i team che desiderano un ChatGPT privato con la propria knowledge base. Le raccomandazioni di hosting online sono molto incoerenti perché la maggior parte dei recensori lo testa con spazi di lavoro vuoti.

Ho utilizzato AnythingLLM in produzione per un progetto clienti con 30 spazi di lavoro e un corpus di 200K documenti. Ecco cosa serve realmente in termini di lavoro.

Quanto Costa Davvero AnythingLLM in RAM

L’applicazione è basata su stack Node.js più il vettore embedded LanceDB. La memoria in idle è di circa 400 MB.

Il principale fattore di consumo di memoria è l’attività degli spazi di lavoro:

Spazio di lavoro inattivo: 50 MB di RAM in uso
Spazio di lavoro attivo con piccolo set di documenti (meno di 100 documenti): 200-400 MB
Spazio di lavoro attivo con grande corpus (10K+ documenti in LanceDB): 1-3 GB
Lavori di ingestione concorrenti: da 500 MB a 2 GB a seconda delle dimensioni dei documenti

Anche l’impronta su disco sorprende. L’indice LanceDB può arrivare a 2-5 GB ogni 100K documenti, a seconda della dimensione dell’embedding e della lunghezza dei documenti.

Confronto VPS per AnythingLLM

Provider	Piano	vCPU	RAM	Disco	Mensile	Ideale per
Hetzner Cloud	CCX13	2	8 GB	80 GB NVMe	14.86 EUR	Piccolo team, corpus modesto
Contabo VPS	VPS M	6	16 GB	200 GB NVMe	8.49 EUR	Produzione budget con grande corpus
DigitalOcean	Premium AMD 8 GB	4	8 GB	160 GB NVMe	56 USD	Team USA, semplicità operativa
Hetzner CCX23	CCX23	4	16 GB	160 GB NVMe	29.74 EUR	AnythingLLM + Ollama co-hosted

Hetzner Cloud CCX13: Per piccoli team

Per un team di 5-10 utenti con spazi di lavoro sotto i 50K documenti totali, il CCX13 è sufficiente. 8 GB di RAM reggono facilmente l’app, l’indice LanceDB e l’attività di query simultanee. La CPU dedicata è importante perché l’ingestione dei documenti è CPU-intensive, mentre le CPU condivise mostrano rallentamenti in questa fase.

Vantaggi:

CPU dedicata: ingestione più prevedibile
NVMe: ottimo per scrivere l’indice LanceDB
8 GB RAM: supporta alcuni spazi di lavoro attivi senza problemi

Lo svantaggio: non sufficiente per grandi quantità di documenti, sarà necessario scalare oltre i 50K.

Ottieni Hetzner: Hetzner Cloud.

Contabo VPS M: Per produzione con molti documenti

Se il tuo team gestisce grandi corpus di documenti (oltre 100K documenti), il VPS M di Contabo con 16 GB di RAM è la soluzione più economica. 8.49 EUR al mese per questa configurazione è imbattibile.

La CPU condivisa si manifesta come occasionali rallentamenti durante l’ingestione simultanea da più utenti. Per import batch (notturni), va bene. Per upload di documenti in tempo reale multi-utente, la variazione può risultare fastidiosa.

Vantaggi:

Miglior rapporto prestazioni/euro per AnythingLLM
200 GB NVMe: spazio a lungo termine per crescita dell’indice vettoriale
16 GB RAM: supporta più spazi di lavoro attivi con grandi corpus

Ottieni Contabo: Contabo VPS.

DigitalOcean Premium AMD 8 GB: Per team negli USA

56 USD al mese è proibitivo, ma la qualità della piattaforma conta se il team utilizza AnythingLLM quotidianamente. Ruolo di Postgres gestito per i metadati dell’applicazione elimina una preoccupazione operativa. Rollback tramite snapshot dopo importazioni problematiche è davvero utile.

Onestamente: 8 GB di RAM sono il minimo, e potresti aver bisogno di 16 GB per uso serio degli spazi di lavoro, raddoppiando il costo. A quel punto, confronta con una configurazione self-hosted Hetzner CCX23.

Ottieni DigitalOcean: DigitalOcean.

Hetzner CCX23: Per AnythingLLM + Ollama

Il livello giusto quando vuoi AnythingLLM più embedding locali e inferenza locale su una singola macchina. 16 GB di RAM sufficiente per il modello di embedding (1-2 GB), il modello di inferenza (8 GB), AnythingLLM con il suo vettore store (4-6 GB), con margine di sicurezza.

Scegli questa opzione per deployment che richiedono privacy, dove tutto deve rimanere su una macchina. Più economico che far girare più macchine per lo stesso setup.

La Mia Scelta Preferita

Per un piccolo team che utilizza AnythingLLM come ChatGPT privato con uso leggero di documenti: Hetzner CCX13. Per produzione con molti documenti e budget limitato: Contabo VPS M. Per hosting completamente self-hosted con modelli locali: Hetzner CCX23. AnythingLLM è abbastanza stabile da mantenere le raccomandazioni di hosting valide fino al 2026.

L’intera panoramica VPS si trova al SelfHostVPS comparison. AnythingLLM si abbina naturalmente con Ollama, consulta quella guida per le scelte di backend.

Frequently asked questions

Quanta RAM serve realmente ad AnythingLLM?

Il processo Node.js è in idle intorno ai 400 MB. Ogni spazio di lavoro attivo con documenti aggiunge da 200 MB a 1 GB a seconda del volume dei documenti e della scelta del vettore store. Per un piccolo team con 5-10 spazi di lavoro e corpus di documenti modesti, 4 GB di RAM sono sufficienti. Per configurazioni più grandi (50+ spazi di lavoro, 100K+ documenti), pianificare da 8 a 16 GB.

AnythingLLM ha bisogno di un proprio database vettoriale?

Viene fornito di default con LanceDB (embedded), che funziona bene per uso personale e team piccoli. Le installazioni di produzione spesso passano a Qdrant o Weaviate per migliorare le prestazioni di query concorrenti. LanceDB embedded fatica a gestire oltre 500K documenti o più di 20 utenti contemporanei. Pianificare una migrazione se si supera questa scala.

AnythingLLM può condividere un VPS con Ollama per un RAG completamente self-hosted?

Sì, questo è un modello comune. Pianificare almeno 16 GB di RAM: Ollama con un modello di embedding ottimizzato (nomic-embed-text o simili) occupa 1-2 GB, il modello di inferenza aggiunge 8 GB, AnythingLLM con il suo vettore store aggiunge 4-6 GB. Hetzner CCX23 si adatta comodamente a questa configurazione.

Come si confronta AnythingLLM con Open WebUI per l'hosting?

AnythingLLM è più pesante perché integra ingestione dei documenti, memorizzazione vettoriale e gestione degli spazi di lavoro. Open WebUI è semplicemente un'interfaccia chat che fa da proxy a un backend di inferenza. Per uso chat puro, Open WebUI è meno costoso da ospitare. Per domande e risposte basate su documenti (RAG), AnythingLLM elimina la necessità di collegare componenti separati. La differenza di costo di hosting è di solito 2x a favore di Open WebUI per configurazioni solo chat.