La decisione di deployment che cambia tutto
Scegliere dove gira un modello è una decisione infrastrutturale e di governance, non un'ottimizzazione delle performance. Cambia la tua postura privacy, i tuoi obblighi di affidabilità, la tua traccia di prove per la compliance e quanto il tuo layer di orchestrazione deve compensare le lacune di capacità.
Fatti chiave
- Modalità di deployment
- Locale / open-source · Self-hosted · Managed API
- Dimensioni confrontate
- 12 dimensioni di design e governance
- Si applica a
- Tutti e 10 i principi del Blueprint
- La domanda chiave
- Dove vanno i dati e cosa succede quando il modello fallisce?
La decisione, non l'hype
La scelta del modello per i sistemi agentici riguarda controllo, privacy e cosa si rompe — non i punteggi nei benchmark. Le domande rilevanti sono: Dove vanno i dati? Chi può osservare l'inferenza? Cosa succede quando il modello o il provider non sono disponibili? Quali prove di compliance puoi produrre?
Confronto modalità di deployment
Confine dati
Locale / open-source
I dati non lasciano mai il dispositivo o l'org
Self-hosted
I dati restano sull'infrastruttura dell'org
Managed API
I dati vengono elaborati dal provider
Postura privacy
Locale / open-source
Massima — nessuna esposizione esterna
Self-hosted
Forte — dipende dai controlli infrastrutturali
Managed API
Richiede fiducia nel provider e DPA
Latenza
Locale / open-source
Variabile — dipende dall'hardware
Self-hosted
Controllata — prevedibile su infrastruttura nota
Managed API
Dipende dal provider — varia per regione e carico
Comportamento dei costi
Locale / open-source
Costo compute fisso
Self-hosted
Compute fisso più overhead operativo
Managed API
Variabile — fatturato per token
Tool calling
Locale / open-source
Limitato nella maggior parte dei modelli open
Self-hosted
Dipende dal modello
Managed API
Forte nei modelli frontier
Context window
Locale / open-source
Spesso più piccola
Self-hosted
Dipende dal modello
Managed API
La più grande disponibile
Livello di affidabilità
Locale / open-source
Da sperimentale a production-capable
Self-hosted
Production-capable
Managed API
Da production a enterprise-governed
Capacità offline
Locale / open-source
Completa
Self-hosted
Parziale
Managed API
Nessuna
Dipendenza dal vendor
Locale / open-source
Nessuna sui pesi del modello
Self-hosted
Solo dipendenza infrastrutturale
Managed API
Alta — la disponibilità del provider è una dipendenza
Prove di compliance
Locale / open-source
Audit trail controllato dall'org
Self-hosted
Audit trail controllato dall'org
Managed API
Richiede attestazione del provider
Onere di revisione
Locale / open-source
Più alto — nessun audit trail del provider
Self-hosted
Medio
Managed API
Più basso — il provider gestisce l'audit infrastrutturale
Esigenze di orchestrazione
Locale / open-source
Più alte — compensa le lacune di capacità
Self-hosted
Medie
Managed API
Più basse — delega la complessità del ragionamento