SL
Skeptik Log
reddit

OpenClaw 4.22: più modelli, voce e un terminale senza gateway

Autore: u/lucienbaba Originale ↗
Nota: Le parti evidenziate in blu sono integrazioni di ricerca aggiunte per completezza, non presenti nel thread originale.

OpenClaw 4.22 allarga il parco modelli con Hy3 e xAI, aggiunge una TUI locale che elimina la dipendenza dal Gateway, ma la community continua a segnalare bug Telegram ricorrenti che la cache dei metadata non risolve alla radice.

Fonte: Reddit r/myclaw, GitHub, Tencent, xAI

Perché ti dovrebbe interessare

Se usi OpenClaw sul terminale, la modalità TUI embedded è la feature che aspettavi da tempo: chat diretta senza avviare il Gateway. Se ti interessa l’AI vocale, xAI porta TTS, STT e trascrizione in tempo reale. E se segui i modelli open-source, Hy3 di Tencent è un nome che farà parlare. Ma c’è anche l’altra faccia: i bug Telegram continuano, e questa release non li risolve del tutto.

I nuovi modelli: Hy3 di Tencent e l’arsenale xAI

La novità che ha fatto più rumore è l’arrivo di Tencent Hy3 Preview (Hunyuan 3.0) tramite TokenHub. Si tratta di un modello MoE da 295 miliardi di parametri totali, di cui 21B attivi per inferenza, con una finestra di contesto di 256K token e licenza open-source. Per chi segue il panorama dei modelli aperti, è un’aggiunta rilevante: Hy3 si posiziona come il modello open-source più ambizioso di Tencent, capace di competere con le migliori architetture MoE attualmente disponibili.

Tencent ha rilasciato Hy3 in open-source il 23 aprile 2026, giusto un giorno prima della release di OpenClaw 4.22. Il modello, noto anche come Hunyuan 3.0, è stato annunciato come il più potente modello open-source della compagnia, con architettura MoE a 295B parametri e 21B attivi durante l'inferenza. La finestra di contesto di 256K token lo rende competitivo con Kimi K2.5 e altri modelli long-context di punta.

Sul fronte xAI, l’integrazione è ancora più corposa. OpenClaw 4.22 aggiunge supporto per la generazione di immagini tramite grok-imagine-image e grok-imagine-image-pro, inclusi gli edit da immagine di riferimento. Ma non finisce qui: xAI porta anche 6 voci per TTS (con output in MP3, WAV, PCM e G.711), il modello STT grok-stt per trascrizione, e la trascrizione in tempo reale per le Voice Call.

xAI ha lanciato le proprie API STT/TTS standalone il 17 aprile 2026. Queste API sono basate sullo stack audio che alimenta Grok Voice nei veicoli Tesla e nel supporto Starlink, e ora sono disponibili anche per gli sviluppatori tramite l'integrazione OpenClaw. L'arrivo di queste API in formato standalone segna un passo importante per l'ecosistema xAI, che finora aveva mantenuto le capacità vocali confinate all'interno dell'app Grok.

A completare il quadro vocale, Deepgram, ElevenLabs e Mistral sono stati aggiunti come provider di streaming STT per le Voice Call, ampliando le opzioni per chi usa OpenClaw in modalità conversazionale.

TUI locale: chattare dal terminale senza Gateway

Forse la feature più attesa da chi usa OpenClaw in ambiente server o semplicemente preferisce il terminale: la modalità TUI embedded permette di avviare una chat direttamente dalla riga di comando senza bisogno di avviare il Gateway. Questo riduce la complessità di setup per chi lavora su macchine remote o vuole fare test rapidi senza appesantire l’ambiente.

Le approval gate dei plugin restano enforce, quindi non si perde in sicurezza quello che si guadagna in semplicità. Un compromesso ragionevole che mantiene la filosofia di OpenClaw: facilità d’uso senza sacrificare il controllo.

Onboarding più dolce e modelli dalla chat

Due cambiamenti che riducono l’attrito iniziale:

  • Auto-install dei plugin mancanti: se OpenClaw rileva che un plugin necessario non è presente, lo installa automaticamente invece di bloccarsi con un errore
  • Comando /models add: permette di registrare nuovi modelli direttamente dalla chat senza riavviare il Gateway o modificare manualmente i file di configurazione

Un membro della community ha già colto l’occasione per segnalare un caso d’uso pratico:

“If you want to try GPT-5.5 through OpenAI Codex, upgrade to the latest OpenClaw first, then just run: /models add openai-codex gpt-5.5.”

È un esempio che illustra bene la filosofia di questa release: meno passaggi manuali, più tempo per usare gli agenti invece di configurarli.

GPT-5.5 è accessibile tramite il provider OpenAI Codex su OpenClaw. Il comando `/models add openai-codex gpt-5.5` registra il modello nella configurazione senza richiedere un restart del Gateway, rendendo il processo di adozione dei nuovi modelli OpenAI quasi istantaneo.

GPT-5 e il prompt overlay condiviso

La release introduce un sistema di prompt overlay condiviso per tutti i provider GPT-5. Il parametro agents.defaults.promptOverlays.gpt5.personality funziona come toggle globale per personalizzare il comportamento dei modelli GPT-5 indipendentemente dal provider utilizzato. Questo risolve un problema pratico: chi usa GPT-5 attraverso provider diversi (OpenAI diretto, Azure, OpenRouter) non deve più configurare overlay separati per ciascuno.

Il resto: WhatsApp, sessioni, diagnostica e fix

La release è densa di miglioramenti trasversali:

  • WhatsApp: reply quoting nativo e systemPrompt per-gruppo e per-direct, con supporto wildcard. Un passo avanti per chi gestisce bot su più conversazioni con personalità diverse
  • Sessioni: filtri per label, agente e ricerca libera, titoli derivati automaticamente e anteprime dell’ultimo messaggio. Qualità della vita che si sente quando si lavora con decine di conversazioni attive
  • Control UI: identità personale per l’operatore, con nome e avatar locale. Non è solo estetica: rende più chiaro chi sta operando quando più persone interagiscono con gli stessi agenti
  • Diagnostics export: genera un pacchetto con log sanitizzati, status, config e informazioni di stabilità, pronto per essere allegato a un bug report. Se avete mai provato a segnalare un bug sapendo che vi avrebbero chiesto “mandaci i log”, capirete perché questo è importante
  • ACPX: introduce openClawToolsMcpBridge per iniettare tool OpenClaw (inizialmente cron) in un contesto ACP. Pi embedded aggiunge una extension factory per hook runtime asincroni. Codex completa i hook lifecycle con before_compaction, after_compaction, llm_input, llm_output e agent_end. Claude CLI adotta warm stdio di default e riprende le sessioni dopo un restart del Gateway
  • Tokenjuice: compatta i risultati di exec/bash nelle run Pi embedded, riducendo il consumo di contesto. Un fix silenzioso ma che fa la differenza su sessioni lunghe

I fix: thinking, prezzi, sessioni e il fantasma di Telegram

I fix risolvono problemi che in alcuni casi duravano da mesi:

  • Thinking default alzato a medium per i modelli reasoning. Prima era off/low, il che significava che modelli progettati per pensare venivano usati senza farli pensare. Una scelta di default sbagliata che finalmente viene corretta
  • Prezzi OpenRouter/LiteLLM: fetch asincrono con timeout di 30 secondi. Niente più blocchi infiniti mentre il sistema cerca di capire quanto costa un modello
  • Session daily reset fixato: prima cancellava conversazioni attive, un comportamento che ha causato non pochi mal di testa
  • Plugins install: aggiunge automaticamente alla allow list
  • Models/auth: fix per re-auth che cancellava altri provider. Un bug subdolo che poteva rendere inaccessibili provider perfettamente funzionanti
  • Memory search: fix sqlite-vec KNN per result limits
  • OpenAI-compatible: fix token accounting per vLLM, SGLang, llama.cpp, LM Studio e altri backend compatibili

E poi c’è Telegram. La cache dei forum metadata ora ha un expiry, il che dovrebbe ridurre i problemi di stale data. Ma la community non è convinta che basti.

L’elefante nella stanza: i bug Telegram ricorrenti

Per quanto la release sia ricca di novità positive, la community continua a segnalare problemi persistenti con Telegram. Un utente ha commentato lapidario:

“Again todays update breaks my telegram, again! wtf”

Non è un caso isolato. Dalla versione 4.2 in poi, numerose issue su GitHub documentano canali Telegram che falliscono silenziosamente, senza errori visibili nell’interfaccia ma con messaggi che non vengono recapitati. Le issue #60400, #60185, #61273, #61195 e #60646 rappresentano solo la punta dell’iceberg di un problema che sembra strutturale.

I bug Telegram in OpenClaw hanno una storia lunga e dolorosa. Dalla versione 4.2, multiple issue su GitHub documentano canali che falliscono senza segnalare errori. Il problema è particolarmente insidioso perché si manifesta come un silenzio apparente: il bot sembra funzionare, ma i messaggi non arrivano a destinazione. La cache dei forum metadata introdotta in 4.22 mitiga alcuni sintomi, ma la community chiede un fix più profondo che affronti la gestione delle connessioni Telegram alla radice.

La cache dei forums metadata con expiry è un passo nella direzione giusta, ma molti utenti sentono che il problema richiede un intervento più radicale. Quando un aggiornamento che aggiunge feature rompe qualcosa di base come la consegna dei messaggi, il danno alla fiducia degli utenti è significativo.

Il punto

Punti chiave:

  • OpenClaw 4.22 aggiunge Hy3 di Tencent, le API xAI per voce e immagini, e una TUI locale che funziona senza Gateway
  • L’onboarding è più fluido: auto-install dei plugin e /models add dalla chat senza restart
  • I bug Telegram restano il problema aperto: messaggi che falliscono silenziosamente, e la cache dei metadata non basta a risolverlo alla radice

La 4.22 parla di più modelli, voce e facilità d’uso locale. Ma parla anche, a voce più bassa, di una promessa ancora non mantenuta sulla stabilità del canale di comunicazione più usato.


Fonti:

  • Reddit r/myclaw (reddit.com/r/myclaw)
  • GitHub OpenClaw releases (github.com/openclaw/openclaw)
  • Tencent Hy3 / Hunyuan 3.0 (hy3ai.com)
  • xAI Docs (docs.x.ai)
  • MarkTechPost (marktechpost.com)
reddit Autore: u/lucienbaba Subreddit: r/myclaw