SL
Skeptik Log
skeptik-log

Quello che OpenRouter non ti dice sui modelli gratis

Autore: Skeptik Log

Il free tier di OpenRouter funziona davvero, ma solo se ci metti almeno $10 sopra. I modelli spariscono senza preavviso, puoi finire a pagare per errore, e il rate limiting è più stringente di quanto sembri. Vale la pena, ma con gli occhi aperti.

Fonte: Video YouTube, OpenRouter

Perché ti dovrebbe interessare

Se hai mai pensato di usare un LLM senza sborsare un centesimo, OpenRouter sembra la risposta. Oltre 30 modelli gratuiti, un’unica API, zero configurazione. Ma c’è un gap tra quello che la landing page promette e quello che trovi quando ci lavori davvero. Qui sotto vediamo i tre lati oscuri del free tier, come proteggersi, e quali alternative esistono.

I $10.50 che nessuno menziona

La differenza tra “gratuito” e “gratuito sul serio” su OpenRouter si riassume in due numeri: 50 e 1000. Senza ricariche, hai 50 richieste al giorno sui modelli free. Con almeno $10 di ricarica, il limite sale a 1000. Il vero costo d’ingresso per un uso produttivo non è zero: è $10.50.

Il mezzo dollaro extra è la fee di ricarico. Con criptovalute paghi il 5% del totale, quindi $0.50 su $10. Con carta di credito il minimo è $0.80, e il costo effettivo sale a $10.80. La cripto è conveniente: paghi meno e hai più controllo. Ma la lezione è che “gratuito” su OpenRouter significa “gratuito dopo un investimento iniziale”.

I modelli vanno e vengono

Aprite la lista dei modelli free oggi e trovate circa 30 opzioni. Apritela tra una settimana e alcune potrebbero non esserci più. Step 3.5 Flash era uno dei modelli gratuiti più veloci e usati: sparito. Qwen 3.6 Coder è stato free per circa una settimana, poi è diventato a pagamento senza preavviso.

Il punto non è che i modelli cambiano. È che se state usando OpenRouter come backend per un agente o un workflow automatizzato, un modello che esiste oggi può non esistere domani. E il vostro codice si rompe senza che nessuno vi avvisi.

Questo è il trade-off strutturale del free tier: la disponibilità non è contrattuale, è temporanea. I provider rendono disponibili i modelli gratuitamente per promozione, testing, o per spingere l’adozione, e li rimuovono quando le priorità cambiano.

La lista aggiornata ad aprile 2026 include modelli interessanti:

  • Nemotron 3 Super (NVIDIA) - il più usato del free tier, buon generalista
  • Qwen3 Coder (Qwen) - eccellente per coding, ma può sparire
  • MiniMax M2.5 (MiniMax) - buon agentic, tool calling
  • GPT-OSS 120B (OpenAI) - versione open source di OpenAI
  • Gemma 4 26B (Google) - multimodale con vision

Ma nessuno vi garantisce che ci saranno ancora la prossima settimana.

L’errore che costa $1.50

Se collegate la vostra API key OpenRouter a un agente senza impostare uno spend limit a zero, state giocando a roulette russa col portafoglio. L’autore del video originale ha speso $1.50 su Gemini 3 Flash senza volerlo: il suo agente, configurato per usare solo modelli gratuiti, ha iniziato a instradare richieste verso modelli a pagamento senza che lui se ne accorgesse.

La soluzione è semplice: create una chiave API con un credit limit di $0. Così, se il sistema prova a usare un modello a pagamento, la richiesta fallisce invece di addebitarvi soldi che non volevate spendere. Si fa in 10 secondi nella sezione API Keys del dashboard OpenRouter.

Rate limiting: il collo di bottiglia invisibile

Anche con 1000 richieste al giorno sbloccate, il limite di 20 richieste al minuto è una catena stretta. Se usate un modello popolare come Nemotron Super durante le ore di punta, non è raro ricevere errori 429 (rate limit) anche con richieste semplici. Il server è sovraccarico perché tutti stanno usando lo stesso modello gratuito nello stesso momento.

Il rate limiting è per modello, non in aggregato. In teoria potreste distribuire le richieste tra più modelli per aumentare il throughput. In pratica, se il vostro workflow dipende da un modello specifico, il rate limit di quel modello è il vostro vero vincolo.

OpenRouter nel panorama API: perché esiste e cosa ci guadagna

OpenRouter non è un provider di modelli. È un router: un intermediario che aggrega l’accesso a modelli di decine di provider diversi (OpenAI, Google, Meta, NVIDIA, Qwen, MiniMax, e altri) attraverso una singola API. Il modello di business si basa su due pilastri:

  • Una piccola fee su ogni richiesta a pagamento (tipicamente il 5% del costo del provider)
  • La capacità di indirizzare traffico verso i provider in modo intelligente

I modelli gratuiti sono un investimento per acquisizione. Quando NVIDIA rende disponibile Nemotron Super gratuitamente su OpenRouter, lo fa perché vuole che sviluppatori si familiarizzino con il modello, lo integrino, e poi passino alla versione a pagamento quando i limiti del free tier diventano insormontabili. OpenRouter guadagna dalla fee sulle transazioni a pagamento che seguono. È lo stesso modello dei tier freemium: il prodotto gratuito è il marketing, non il prodotto.

Confronto rapido con la concorrenza:

Provider Free tier Punto di forza Limitazione
OpenRouter ~30 modelli Catalogo ampio, singola API Modelli instabili, $10 per 1000 req/day
Together AI Nessuno significativo Pricing competitivo Nessun free tier
Groq Generoso Inference ultra-rapida Catalogo limitato
NVIDIA NIM ~15 modelli 40 req/min Solo prototipi, non produzione
Google AI Studio Gemini Flash ~1500 req/giorno Un solo modello

Come verificare se un modello è davvero free

Non fidatevi di quello che vi dice il vostro client. OpenCode, per esempio, mostra una lista di modelli “free” di OpenRouter che a volte non corrisponde alla realtà attuale. Un modello può apparire nella lista del vostro tool ma non essere più disponibile come free tier. Risultato: la richiesta fallisce silenziosamente, o peggio, viene instradata verso la versione a pagamento.

La procedura sicura è andate su openrouter.ai/models, filtrate per “free”, e verificate che il modello sia effettivamente nella lista. In alternativa, usate il Free Models Router di OpenRouter (openrouter/free), che seleziona automaticamente il modello gratuito più adatto in base ai requisiti della richiesta.

OpenCode: il modo più semplice per iniziare

Per chi vuole configurare provider e modelli senza impazzire con le API a mano, OpenCode è l’interfaccia più immediata. Disponibile come app desktop e come tool da terminale. Connettere OpenRouter è questione di incollare la API key, e i modelli free sono pre-filtrati e pronti all’uso. Il modello ID è visibile e copiabile, il che rende facile configurare agenti o workflow che puntano al modello giusto.

L’approccio da terminale è altrettanto semplice: opencode, poi /models, Ctrl+A per connettere un provider, e siete operativi.

Alternative gratuite per LLM API

OpenRouter non è l’unico modo per usare modelli LLM senza spendere. Le alternative principali:

  • Ollama locale: modelli open source direttamente sul vostro hardware. Zero costi, zero rate limit, ma limitati dalla potenza della vostra GPU. Ideale per modelli fino a ~14B parametri su un MacBook M-series.
  • Google AI Studio: Gemini Flash gratuitamente con limiti generosi (circa 1500 richieste/giorno). Ottimo per prototipi e testing.
  • Groq free tier: inference ultra-rapida su Llama, Mixtral, e altri modelli open source. Rate limit ragionevole per uso personale.
  • NVIDIA NIM: modelli gratuiti su build.nvidia.com con circa 40 richieste al minuto. Coprono Kimi K2.5, MiniMax M2.5, GLM-5, DeepSeek V3.2, e altri. Buoni per prototipi, non per produzione.
  • Hugging Face Inference: tier gratuito con modelli popolari, limiti più stringenti.

La scelta dipende dal caso d’uso. Catalogo ampio e flessibilità? OpenRouter. Velocità e prevedibilità? Groq o locale. Affidabilità senza sorprese? Google AI Studio è difficile da battere per il prezzo (zero).

I modelli free ad aprile 2026: cosa c’è davvero

La lista cambia frequentemente, ma ad aprile 2026 include circa 30 modelli. I più interessanti per uso pratico:

Modello Provider Contesto Note
Nemotron 3 Super 120B NVIDIA 262K Il più usato del free tier, buon generalista
Qwen3 Coder Qwen 262K Eccellente per coding, ma può sparire
MiniMax M2.5 MiniMax 197K Buon agentic, tool calling
GPT-OSS 120B OpenAI 131K Versione open source di OpenAI
GLM 4.5 Air Z.ai 131K Leggero, buone performance
Llama 3.3 70B Meta 66K Affidabile, buon generalista
Gemma 4 26B Google 262K Multimodale con vision
Ling 2.6 1T InclusionAI 262K Modello cinese, tool calling

Tutti hanno il suffisso :free nell’ID modello e sono soggetti a rate limiting (20 RPM, 1000 req/giorno con $10+ ricaricati). La disponibilità non è garantita: i provider possono rimuoverli in qualsiasi momento.

Per chi vuole approfondire

Da qui in poi si entra nel tecnico. Se ti interessa l’uso pratico più dei dettagli implementativi, puoi saltare direttamente alla conclusione.

Configurazione sicura dell’API key

Per evitare addebiti involontari, la configurazione raccomandata per un account free-tier è:

  1. Andare su Settings > API Keys nel dashboard OpenRouter
  2. Creare una nuova chiave con Credit Limit: $0.00
  3. Abilitare solo i modelli con il suffisso :free nel routing
  4. Se usate un agente, configurare il fallback su openrouter/free invece di un modello specifico

Questa configurazione garantisce che nessuna richiesta possa generare costi, anche in caso di errore di routing.

Calcolo del throughput effettivo

Con 1000 richieste al giorno e un rate limit di 20 RPM, il throughput massimo teorico è:

  • Per minuto: 20 richieste (se il modello risponde entro 3 secondi)
  • Per ora: 1.200 richieste (teorico, raramente raggiungibile nelle ore di punta)
  • Per giorno: 1.000 richieste (il hard limit prevale sul rate limit)

Per workflow che richiedono burst di richieste (es. batch processing, agenti con tool calling), il rate limit è il vincolo principale. Per uso interattivo (chat, coding assist), i 1000 req/giorno sono più che sufficienti.

Il punto

Punti chiave:

  • Il free tier di OpenRouter richiede almeno $10 di ricarica per essere davvero utile (1000 vs 50 req/giorno)
  • I modelli gratuiti spariscono senza preavviso: non usateli come backend per produzione
  • Impostate sempre il credit limit a $0 sulla API key per evitare addebiti involontari

Il free tier di OpenRouter è un parco giochi, non una infrastruttura. Usatelo per sperimentare e trovare il modello giusto, poi passate al pay-as-you-go per tutto ciò che deve funzionare domani come oggi.

🔗 Risorse

skeptik-log Autore: Skeptik Log