TinyAgentOS trasforma il vecchio hardware in un cluster di agenti AI
TinyAgentOS è una piattaforma self-hosted per agenti AI che fa girare un intero ecosistema sul hardware che già hai in casa, dal Raspberry Pi al PC gaming. Supporta 15 framework, 43 plugin MCP, 97 modelli locali verificati e un sistema di memoria che raggiunge il 97% su LongMemEval-S, tutto senza dipendenze cloud.
TL;DR: TinyAgentOS è un OS self-hosted per agenti AI che mette in pool tutto il calcolo che già possiedi, dal telefono Android al PC gaming, e ci fa girare agenti locali senza lock-in di framework. Ancora pre-beta, ma il backend, il sistema di memoria e la group chat multi-framework funzionano già.
Dove andiamo
Se hai mai provato a far girare agenti AI in casa e ti sei impantanato tra framework che non comunicano, cloud che non rispettano la privacy e dashboard che non esistono, TinyAgentOS merita attenzione. Vediamo cos’è, come funziona l’architettura, dove si posiziona rispetto a exo e OpenClaw, e perché il fatto che sia ancora pre-beta non significa che non si possa già usare.
Il racconto
TinyAgentOS (repo: jaylfc/tinyagentos) è un sistema operativo self-hosted e auto-clustering per agenti AI, creato dallo sviluppatore jaylfc. L’idea di fondo è disarmante nella sua semplicità: invece di affittare tempo GPU nel cloud, metti in pool tutto il calcolo che già possiedi e ci fai girare gli agenti localmente.
Il progetto è apparso su GitHub all’inizio del 2026 e si muove velocemente. A metà aprile conta 56 stelle, e l’autore ha contribuito anche a ShibaClaw e al tool di ricerca qmd, oltre ad aver aperto una issue su exo-explore per il supporto NPU RK3588, segnale di un coinvolgimento profondo nell’ecosistema hardware edge-AI.
La motivazione è chiara dal README: “tutto gira su un Orange Pi 5 Plus da 170 sterline senza dipendenze cloud”. TinyAgentOS è pensato per chi vuole infrastruttura reale per agenti AI in casa, senza spedire dati sui server di nessuno.
Cosa include
- Desktop environment web: apri
http://tuo-host:6969/e ottieni un OS completo nel browser, con window manager, dock, launchpad, notifiche, widget e 34 app integrate. Su mobile passa a una home a widget swipeabile, installabile come PWA. - Indipendenza dal framework: la decisione progettuale più importante. TinyAgentOS possiede tutto ciò che conta di un agente (memoria, file, canali, accesso ai modelli, configurazione). Il framework è solo un motore di esecuzione sostituibile. Cambi framework e il tuo agente mantiene cronologia, canali, adapter LoRA e API key. Zero migrazione, zero perdita di dati.
- Sistema di memoria taOSmd: il motore integrato (jaylfc/taosmd) raggiunge il 97.0% di accuratezza su LongMemEval-S, girando interamente su Orange Pi senza cloud. Usa un grafo di conoscenza temporale con finestre di validità, rilevamento di contraddizioni, ricerca ibrida semantica+keyword con rerank cross-encoder e query expansion assistita da LLM.
- Cluster di calcolo distribuito: unisci qualsiasi dispositivo in un mesh AI. Un PC gaming per i modelli grandi, un Mac per l’inferenza MLX, un Pi per gli embeddings, un vecchio telefono Android dal cassetto. I worker si connettono dal system tray o via Termux.
- Catalogo modelli curato: 97 manifest verificati che coprono LLM (Qwen3, Llama 3.1/3.3, Gemma 2/3, Phi-4, Mistral, DeepSeek), modelli vision, embeddings, reranker, speech e generazione immagini. Più 167k+ modelli searchable da HuggingFace. Il filtraggio hardware-aware mostra solo quello che i tuoi dispositivi possono effettivamente eseguire.
- Supporto hardware: Apple Silicon (MLX), NVIDIA, AMD, Rockchip NPU, Raspberry Pi, telefoni Android. Il sistema rileva automaticamente gli acceleratori, incluse GPU NVIDIA senza
nvidia-smie NPU Rockchip in container LXC.
Il layer “Librarian” del sistema di memoria è particolarmente ingegnoso: esegue query expansion assistita da LLM prima del retrieval, il che significa che può collegare una domanda vaga come “quella cosa delle API key della settimana scorsa” alla conversazione reale in cui si parlava di API key. Combinato con le finestre di validità sul grafo di conoscenza, il sistema traccia fatti che cambiano nel tempo, invalidando automaticamente le informazioni obsolete.
Confronto con progetti simili
| Progetto | Focus | Calcolo Distribuito | Sistema Memoria | Desktop UI | Indip. dal Framework |
|---|---|---|---|---|---|
| TinyAgentOS | OS completo per agenti self-hosted | Sì, auto-clustering | taOSmd (97% LongMemEval-S) | Desktop web completo | Sì, 15 framework |
| exo | Inferenza distribuita | Sì, clustering | No | No | No |
| OpenClaw | Framework per agenti | No | Built-in | CLI/Telegram | N/A (è un framework) |
| Home Assistant | Smart home | Sistema add-on | Limitato | UI web completa | N/A |
| CrewAI / AutoGen | Orchestrazione multi-agente | No | Minimo | No | No |
TinyAgentOS occupa una nicchia unica: non è solo un cluster di inferenza (come exo), non è solo un framework per agenti (come OpenClaw o SmolAgents), e non è solo un hub per la smart home (come Home Assistant). Prova a essere un sistema operativo completo per agenti AI che si autogestisce su hardware economico. Il paragone più vicino sarebbe combinare il clustering di exo con un desktop OS, un app store e un vero layer di memoria, tutto pensato per girare su un Orange Pi.
Casi d’uso
- L’homelabber con un cassetto pieno di SBC: hai un Orange Pi 5 Plus, un Raspberry Pi 4 e un vecchio ThinkPad. Installi TinyAgentOS sull’Orange Pi come controller, aggiungi gli altri due come worker, e hai un cluster AI distribuito con costi cloud pari a zero e nessun dato fuori casa.
- Lo sviluppatore multi-framework: vuoi verificare se SmolAgents gestisce meglio il tuo workflow rispetto a LangChain. Li deployi entrambi su TinyAgentOS, dai loro la stessa memoria e gli stessi canali, e li osservi fianco a fianco in una chat condivisa. Memoria, file e connessioni persistono tra un framework e l’altro.
- Il ricercatore attento alla privacy: la politica del laboratorio vieta l’invio di dati ad API esterne. TinyAgentOS gira interamente in locale: taOSmd funziona senza modelli cloud, i modelli girano in locale e gli agenti comunicano tramite canali locali. Nessun dato esce dall’edificio.
- La piccola azienda: hai un Mac mini e un PC gaming. TinyAgentOS sul Mac mini come controller e il PC gaming come worker per l’inferenza pesante. Agenti che monitorano email, processano documenti e gestiscono la knowledge base, tutto da una dashboard web accessibile da qualsiasi dispositivo sulla rete.
- Chi ricicla il vecchio telefono: quel Pixel nel cassetto con il worker via Termux contribuisce con embeddings e inferenza di modelli piccoli al cluster. Ogni bit di silicio inattivo conta.
Per chi vuole approfondire
Da qui in poi si entra nel tecnico. Se ti interessa l’idea più dell’implementazione, puoi saltare direttamente alla conclusione.
Installazione
Installare il controller è una riga:
curl -fsSL https://raw.githubusercontent.com/jaylfc/tinyagentos/master/scripts/install-server.sh | sudo bash
Funziona su Debian, Ubuntu, Fedora, Arch, Alpine e macOS. Lo script è idempotente e sicuro da ri-eseguire. Per i worker:
curl -fsSL https://raw.githubusercontent.com/jaylfc/tinyagentos/master/scripts/install-worker.sh | sudo bash -s -- http://tuo-server:6969
I worker possono anche girare come app desktop con icona nel system tray, oppure su Android via Termux.
Architettura interna
La fonte di verità è sempre lo stato live dei backend, mai il filesystem. Ogni sottosistema interpella i backend e legge un indice in-memory centrale. I backend (CUDA, Vulkan, ROCm, Metal) si registrano e vengono scoperti automaticamente. Lo scheduler instrada il lavoro solo verso backend effettivamente pronti, eliminando i bug da configurazione stantia.
Il layer Librarian di taOSmd esegue query expansion assistita da LLM prima del retrieval: collega domande vaghe alle conversazioni reali. Le finestre di validità sul grafo di conoscenza tracciano fatti temporali, invalidando automaticamente le informazioni obsolete.
Il punto
Punti chiave:
- TinyAgentOS mette in pool il hardware che già hai e ci fa girare agenti AI senza lock-in di framework e senza cloud
- L’indipendenza dal framework è il vero differenziatore: cambia motore di esecuzione senza perdere memoria, file o configurazione
- È ancora pre-beta (56 stelle su GitHub a metà aprile 2026), ma il backend, il sistema di memoria e la group chat multi-framework funzionano già
- La portata del progetto è anche il suo rischio: costruire OS, app store, engine di memoria, scheduler e supporto multi-framework contemporaneamente è uno sforzo ingegneristico monumentale
L’AI self-hosted non è più un esperimento da nicchia. Ma serviva un sistema operativo che unificasse il calcolo distribuito, la memoria degli agenti e l’indipendenza dai framework. TinyAgentOS ci prova.
Fonti
- Repository GitHub di TinyAgentOS
- Sistema di memoria taOSmd
- Profilo GitHub di jaylfc
- Benchmark LongMemEval-S
- exo - Inferenza Distribuita (confronto)
- Issue RK3588 NPU su exo (contributo di jaylfc)