TinyAgentOS trasforma il vecchio hardware in un cluster di agenti AI

TinyAgentOS è una piattaforma self-hosted per agenti AI che fa girare un intero ecosistema sul hardware che già hai in casa, dal Raspberry Pi al PC gaming. Supporta 15 framework, 43 plugin MCP, 97 modelli locali verificati e un sistema di memoria che raggiunge il 97% su LongMemEval-S, tutto senza dipendenze cloud.

Fonte: GitHub (jaylfc/tinyagentos), taOSmd

TL;DR: TinyAgentOS è un OS self-hosted per agenti AI che mette in pool tutto il calcolo che già possiedi, dal telefono Android al PC gaming, e ci fa girare agenti locali senza lock-in di framework. Ancora pre-beta, ma il backend, il sistema di memoria e la group chat multi-framework funzionano già.

Dove andiamo

Se hai mai provato a far girare agenti AI in casa e ti sei impantanato tra framework che non comunicano, cloud che non rispettano la privacy e dashboard che non esistono, TinyAgentOS merita attenzione. Vediamo cos’è, come funziona l’architettura, dove si posiziona rispetto a exo e OpenClaw, e perché il fatto che sia ancora pre-beta non significa che non si possa già usare.

Il racconto

TinyAgentOS (repo: jaylfc/tinyagentos) è un sistema operativo self-hosted e auto-clustering per agenti AI, creato dallo sviluppatore jaylfc. L’idea di fondo è disarmante nella sua semplicità: invece di affittare tempo GPU nel cloud, metti in pool tutto il calcolo che già possiedi e ci fai girare gli agenti localmente.

Il progetto è apparso su GitHub all’inizio del 2026 e si muove velocemente. A metà aprile conta 56 stelle, e l’autore ha contribuito anche a ShibaClaw e al tool di ricerca qmd, oltre ad aver aperto una issue su exo-explore per il supporto NPU RK3588, segnale di un coinvolgimento profondo nell’ecosistema hardware edge-AI.

La motivazione è chiara dal README: “tutto gira su un Orange Pi 5 Plus da 170 sterline senza dipendenze cloud”. TinyAgentOS è pensato per chi vuole infrastruttura reale per agenti AI in casa, senza spedire dati sui server di nessuno.

Cosa include

Desktop environment web: apri http://tuo-host:6969/ e ottieni un OS completo nel browser, con window manager, dock, launchpad, notifiche, widget e 34 app integrate. Su mobile passa a una home a widget swipeabile, installabile come PWA.
Indipendenza dal framework: la decisione progettuale più importante. TinyAgentOS possiede tutto ciò che conta di un agente (memoria, file, canali, accesso ai modelli, configurazione). Il framework è solo un motore di esecuzione sostituibile. Cambi framework e il tuo agente mantiene cronologia, canali, adapter LoRA e API key. Zero migrazione, zero perdita di dati.
Sistema di memoria taOSmd: il motore integrato (jaylfc/taosmd) raggiunge il 97.0% di accuratezza su LongMemEval-S, girando interamente su Orange Pi senza cloud. Usa un grafo di conoscenza temporale con finestre di validità, rilevamento di contraddizioni, ricerca ibrida semantica+keyword con rerank cross-encoder e query expansion assistita da LLM.
Cluster di calcolo distribuito: unisci qualsiasi dispositivo in un mesh AI. Un PC gaming per i modelli grandi, un Mac per l’inferenza MLX, un Pi per gli embeddings, un vecchio telefono Android dal cassetto. I worker si connettono dal system tray o via Termux.
Catalogo modelli curato: 97 manifest verificati che coprono LLM (Qwen3, Llama 3.1/3.3, Gemma 2/3, Phi-4, Mistral, DeepSeek), modelli vision, embeddings, reranker, speech e generazione immagini. Più 167k+ modelli searchable da HuggingFace. Il filtraggio hardware-aware mostra solo quello che i tuoi dispositivi possono effettivamente eseguire.
Supporto hardware: Apple Silicon (MLX), NVIDIA, AMD, Rockchip NPU, Raspberry Pi, telefoni Android. Il sistema rileva automaticamente gli acceleratori, incluse GPU NVIDIA senza nvidia-smi e NPU Rockchip in container LXC.

La filosofia architetturale merita un approfondimento: la fonte di verità è sempre lo stato live dei backend, mai il filesystem o un file di configurazione. Ogni sottosistema che chiede "il modello X è disponibile?" interpella i backend e legge un indice in-memory centrale. Questo rende i backend cross-platform inseribili a piacere: CUDA, Vulkan, ROCm e Metal si registrano e vengono scoperti automaticamente. Lo scheduler instrada il lavoro solo verso backend effettivamente pronti, eliminando un'intera classe di bug da configurazione stantia che affligge i setup più semplici.

Il layer “Librarian” del sistema di memoria è particolarmente ingegnoso: esegue query expansion assistita da LLM prima del retrieval, il che significa che può collegare una domanda vaga come “quella cosa delle API key della settimana scorsa” alla conversazione reale in cui si parlava di API key. Combinato con le finestre di validità sul grafo di conoscenza, il sistema traccia fatti che cambiano nel tempo, invalidando automaticamente le informazioni obsolete.

Confronto con progetti simili

Progetto	Focus	Calcolo Distribuito	Sistema Memoria	Desktop UI	Indip. dal Framework
TinyAgentOS	OS completo per agenti self-hosted	Sì, auto-clustering	taOSmd (97% LongMemEval-S)	Desktop web completo	Sì, 15 framework
exo	Inferenza distribuita	Sì, clustering	No	No	No
OpenClaw	Framework per agenti	No	Built-in	CLI/Telegram	N/A (è un framework)
Home Assistant	Smart home	Sistema add-on	Limitato	UI web completa	N/A
CrewAI / AutoGen	Orchestrazione multi-agente	No	Minimo	No	No

TinyAgentOS occupa una nicchia unica: non è solo un cluster di inferenza (come exo), non è solo un framework per agenti (come OpenClaw o SmolAgents), e non è solo un hub per la smart home (come Home Assistant). Prova a essere un sistema operativo completo per agenti AI che si autogestisce su hardware economico. Il paragone più vicino sarebbe combinare il clustering di exo con un desktop OS, un app store e un vero layer di memoria, tutto pensato per girare su un Orange Pi.

L'indipendenza dal framework è il vero differenziatore. La maggior parte delle piattaforme per agenti ti blocca nel loro ecosistema. Se costruisci su LangChain e vuoi passare a SmolAgents, tipicamente riscrivi tutto. TinyAgentOS gestisce il ciclo di vita completo dell'agente al di fuori del framework, rendendo il framework un componente sostituibile piuttosto che un impegno di piattaforma. È un modello architetturale genuinamente diverso che potrebbe diventare significativo se il progetto matura.

Casi d’uso

L’homelabber con un cassetto pieno di SBC: hai un Orange Pi 5 Plus, un Raspberry Pi 4 e un vecchio ThinkPad. Installi TinyAgentOS sull’Orange Pi come controller, aggiungi gli altri due come worker, e hai un cluster AI distribuito con costi cloud pari a zero e nessun dato fuori casa.
Lo sviluppatore multi-framework: vuoi verificare se SmolAgents gestisce meglio il tuo workflow rispetto a LangChain. Li deployi entrambi su TinyAgentOS, dai loro la stessa memoria e gli stessi canali, e li osservi fianco a fianco in una chat condivisa. Memoria, file e connessioni persistono tra un framework e l’altro.
Il ricercatore attento alla privacy: la politica del laboratorio vieta l’invio di dati ad API esterne. TinyAgentOS gira interamente in locale: taOSmd funziona senza modelli cloud, i modelli girano in locale e gli agenti comunicano tramite canali locali. Nessun dato esce dall’edificio.
La piccola azienda: hai un Mac mini e un PC gaming. TinyAgentOS sul Mac mini come controller e il PC gaming come worker per l’inferenza pesante. Agenti che monitorano email, processano documenti e gestiscono la knowledge base, tutto da una dashboard web accessibile da qualsiasi dispositivo sulla rete.
Chi ricicla il vecchio telefono: quel Pixel nel cassetto con il worker via Termux contribuisce con embeddings e inferenza di modelli piccoli al cluster. Ogni bit di silicio inattivo conta.

Per chi vuole approfondire

Da qui in poi si entra nel tecnico. Se ti interessa l’idea più dell’implementazione, puoi saltare direttamente alla conclusione.

Installazione

Installare il controller è una riga:

curl -fsSL https://raw.githubusercontent.com/jaylfc/tinyagentos/master/scripts/install-server.sh | sudo bash

Funziona su Debian, Ubuntu, Fedora, Arch, Alpine e macOS. Lo script è idempotente e sicuro da ri-eseguire. Per i worker:

curl -fsSL https://raw.githubusercontent.com/jaylfc/tinyagentos/master/scripts/install-worker.sh | sudo bash -s -- http://tuo-server:6969

I worker possono anche girare come app desktop con icona nel system tray, oppure su Android via Termux.

Architettura interna

La fonte di verità è sempre lo stato live dei backend, mai il filesystem. Ogni sottosistema interpella i backend e legge un indice in-memory centrale. I backend (CUDA, Vulkan, ROCm, Metal) si registrano e vengono scoperti automaticamente. Lo scheduler instrada il lavoro solo verso backend effettivamente pronti, eliminando i bug da configurazione stantia.

Il layer Librarian di taOSmd esegue query expansion assistita da LLM prima del retrieval: collega domande vaghe alle conversazioni reali. Le finestre di validità sul grafo di conoscenza tracciano fatti temporali, invalidando automaticamente le informazioni obsolete.

Il punto

Punti chiave:

TinyAgentOS mette in pool il hardware che già hai e ci fa girare agenti AI senza lock-in di framework e senza cloud
L’indipendenza dal framework è il vero differenziatore: cambia motore di esecuzione senza perdere memoria, file o configurazione
È ancora pre-beta (56 stelle su GitHub a metà aprile 2026), ma il backend, il sistema di memoria e la group chat multi-framework funzionano già
La portata del progetto è anche il suo rischio: costruire OS, app store, engine di memoria, scheduler e supporto multi-framework contemporaneamente è uno sforzo ingegneristico monumentale

L’AI self-hosted non è più un esperimento da nicchia. Ma serviva un sistema operativo che unificasse il calcolo distribuito, la memoria degli agenti e l’indipendenza dai framework. TinyAgentOS ci prova.

Fonti

Repository GitHub di TinyAgentOS
Sistema di memoria taOSmd
Profilo GitHub di jaylfc
Benchmark LongMemEval-S
exo - Inferenza Distribuita (confronto)
Issue RK3588 NPU su exo (contributo di jaylfc)