Test indipendenti Aggiornato aprile 2026 387 guide di self-hosting 5 provider VPS testati

comparison

Miglior VPS per AnythingLLM (2026): Spazi di lavoro che Non Muoiono

AnythingLLM sembra leggero finché la memorizzazione vettoriale e l'ingestione dei documenti non entrano in gioco. Ecco la lista realistica di VPS per i deployment di team.

AnythingLLM occupa una posizione di mezzo utile: più di una chat UI, meno di una configurazione completa di LangChain. Il concetto di workspace e l’ingestione di documenti integrata lo rendono una scelta sensata per i team che desiderano un ChatGPT privato con la propria knowledge base. Le raccomandazioni di hosting online sono molto incoerenti perché la maggior parte dei recensori lo testa con spazi di lavoro vuoti.

Ho utilizzato AnythingLLM in produzione per un progetto clienti con 30 spazi di lavoro e un corpus di 200K documenti. Ecco cosa serve realmente in termini di lavoro.

Quanto Costa Davvero AnythingLLM in RAM

L’applicazione è basata su stack Node.js più il vettore embedded LanceDB. La memoria in idle è di circa 400 MB.

Il principale fattore di consumo di memoria è l’attività degli spazi di lavoro:

Anche l’impronta su disco sorprende. L’indice LanceDB può arrivare a 2-5 GB ogni 100K documenti, a seconda della dimensione dell’embedding e della lunghezza dei documenti.

Confronto VPS per AnythingLLM

ProviderPianovCPURAMDiscoMensileIdeale per
Hetzner CloudCCX1328 GB80 GB NVMe14.86 EURPiccolo team, corpus modesto
Contabo VPSVPS M616 GB200 GB NVMe8.49 EURProduzione budget con grande corpus
DigitalOceanPremium AMD 8 GB48 GB160 GB NVMe56 USDTeam USA, semplicità operativa
Hetzner CCX23CCX23416 GB160 GB NVMe29.74 EURAnythingLLM + Ollama co-hosted

Hetzner Cloud CCX13: Per piccoli team

Per un team di 5-10 utenti con spazi di lavoro sotto i 50K documenti totali, il CCX13 è sufficiente. 8 GB di RAM reggono facilmente l’app, l’indice LanceDB e l’attività di query simultanee. La CPU dedicata è importante perché l’ingestione dei documenti è CPU-intensive, mentre le CPU condivise mostrano rallentamenti in questa fase.

Vantaggi:

Lo svantaggio: non sufficiente per grandi quantità di documenti, sarà necessario scalare oltre i 50K.

Ottieni Hetzner: Hetzner Cloud.

Contabo VPS M: Per produzione con molti documenti

Se il tuo team gestisce grandi corpus di documenti (oltre 100K documenti), il VPS M di Contabo con 16 GB di RAM è la soluzione più economica. 8.49 EUR al mese per questa configurazione è imbattibile.

La CPU condivisa si manifesta come occasionali rallentamenti durante l’ingestione simultanea da più utenti. Per import batch (notturni), va bene. Per upload di documenti in tempo reale multi-utente, la variazione può risultare fastidiosa.

Vantaggi:

Ottieni Contabo: Contabo VPS.

DigitalOcean Premium AMD 8 GB: Per team negli USA

56 USD al mese è proibitivo, ma la qualità della piattaforma conta se il team utilizza AnythingLLM quotidianamente. Ruolo di Postgres gestito per i metadati dell’applicazione elimina una preoccupazione operativa. Rollback tramite snapshot dopo importazioni problematiche è davvero utile.

Onestamente: 8 GB di RAM sono il minimo, e potresti aver bisogno di 16 GB per uso serio degli spazi di lavoro, raddoppiando il costo. A quel punto, confronta con una configurazione self-hosted Hetzner CCX23.

Ottieni DigitalOcean: DigitalOcean.

Hetzner CCX23: Per AnythingLLM + Ollama

Il livello giusto quando vuoi AnythingLLM più embedding locali e inferenza locale su una singola macchina. 16 GB di RAM sufficiente per il modello di embedding (1-2 GB), il modello di inferenza (8 GB), AnythingLLM con il suo vettore store (4-6 GB), con margine di sicurezza.

Scegli questa opzione per deployment che richiedono privacy, dove tutto deve rimanere su una macchina. Più economico che far girare più macchine per lo stesso setup.

La Mia Scelta Preferita

Per un piccolo team che utilizza AnythingLLM come ChatGPT privato con uso leggero di documenti: Hetzner CCX13. Per produzione con molti documenti e budget limitato: Contabo VPS M. Per hosting completamente self-hosted con modelli locali: Hetzner CCX23. AnythingLLM è abbastanza stabile da mantenere le raccomandazioni di hosting valide fino al 2026.

L’intera panoramica VPS si trova al SelfHostVPS comparison. AnythingLLM si abbina naturalmente con Ollama, consulta quella guida per le scelte di backend.

Frequently asked questions

Quanta RAM serve realmente ad AnythingLLM?

Il processo Node.js è in idle intorno ai 400 MB. Ogni spazio di lavoro attivo con documenti aggiunge da 200 MB a 1 GB a seconda del volume dei documenti e della scelta del vettore store. Per un piccolo team con 5-10 spazi di lavoro e corpus di documenti modesti, 4 GB di RAM sono sufficienti. Per configurazioni più grandi (50+ spazi di lavoro, 100K+ documenti), pianificare da 8 a 16 GB.

AnythingLLM ha bisogno di un proprio database vettoriale?

Viene fornito di default con LanceDB (embedded), che funziona bene per uso personale e team piccoli. Le installazioni di produzione spesso passano a Qdrant o Weaviate per migliorare le prestazioni di query concorrenti. LanceDB embedded fatica a gestire oltre 500K documenti o più di 20 utenti contemporanei. Pianificare una migrazione se si supera questa scala.

AnythingLLM può condividere un VPS con Ollama per un RAG completamente self-hosted?

Sì, questo è un modello comune. Pianificare almeno 16 GB di RAM: Ollama con un modello di embedding ottimizzato (nomic-embed-text o simili) occupa 1-2 GB, il modello di inferenza aggiunge 8 GB, AnythingLLM con il suo vettore store aggiunge 4-6 GB. Hetzner CCX23 si adatta comodamente a questa configurazione.

Come si confronta AnythingLLM con Open WebUI per l'hosting?

AnythingLLM è più pesante perché integra ingestione dei documenti, memorizzazione vettoriale e gestione degli spazi di lavoro. Open WebUI è semplicemente un'interfaccia chat che fa da proxy a un backend di inferenza. Per uso chat puro, Open WebUI è meno costoso da ospitare. Per domande e risposte basate su documenti (RAG), AnythingLLM elimina la necessità di collegare componenti separati. La differenza di costo di hosting è di solito 2x a favore di Open WebUI per configurazioni solo chat.