AI - Page 2 - Rost Glukhov | Sito personale e blog tecnico

Tutorial sulla Generazione Aumentata dal Recupero (RAG): Architettura, Implementazione e Guida alla Produzione

Production-focused guide to building RAG systems: chunking, vector stores, hybrid retrieval, reranking, evaluation, and when to choose RAG over fine-tuning.

A performance engineering hub for running LLMs efficiently: runtime behavior, bottlenecks, benchmarks, and the real constraints that shape throughput and latency.

LLM Hosting nel 2026: Confronto tra Infrastrutture Locali, Self-Hosted e Cloud

Strategic guide to hosting large language models locally with Ollama, llama.cpp, vLLM, or in the cloud. Compare tools, performance trade-offs, and cost considerations.

L’hosting self-hosted di LLM mantiene i dati, i modelli e l’inferenza sotto il tuo controllo: un percorso pratico verso sovrainità AI per team, aziende e nazioni.

Confronto delle prestazioni dei modelli LLM su Ollama su GPU con 16 GB di VRAM

Eseguire grandi modelli linguistici in locale ti offre privacy, capacità offline e zero costi API. Questo benchmark rivela esattamente cosa si può aspettare da 14 modelli popolari LLMs su Ollama su un RTX 4080.

I migliori 17 progetti Python in tendenza su GitHub

L’ecosistema Python di questo mese è dominato da Claude Skills e dagli strumenti per agenti AI. Questa panoramica analizza i repository Python più in tendenza su GitHub.

L’ecosistema Rust sta esploso con progetti innovativi, in particolare negli strumenti per la codifica AI e nelle applicazioni per terminale. Questo riepilogo analizza i repository Rust più popolari su GitHub di questo mese.

Top 19 Progetti Go più popolari su GitHub - Gennaio 2026

L’ecosistema Go continua a prosperare grazie a progetti innovativi che spaziano dall’AI, alle applicazioni auto-hosted e all’infrastruttura per sviluppatori. Questa panoramica analizza i repository Go più popolari su GitHub di questo mese.

Questo completo guida fornisce un background e un dettagliato confronto tra Anaconda, Miniconda e Mamba - tre potenti strumenti che sono diventati essenziali per gli sviluppatori Python e i data scientist che lavorano con dipendenze complesse e ambienti di calcolo scientifico.

Open WebUI: interfaccia self-hosted per LLM

Open WebUI è una potente, estensibile e ricca di funzionalità interfaccia web autoospitata per interagire con i grandi modelli linguistici.

Eventi tecnologici a Melbourne da non perdere nel 2026

La comunità tecnologica di Melbourne continua a prosperare nel 2026 con un’impressionante serie di conferenze, incontri e workshop che coprono sviluppo software, calcolo cloud, AI, cybersecurity e tecnologie emergenti.

vLLM è un motore di inferenza e servizio ad alto throughput e a basso consumo di memoria per modelli linguistici su larga scala (LLM), sviluppato dal laboratorio Sky Computing dell’Università della California, Berkeley.

Prezzo DGX Spark AU: 6.249–7.999 USD presso i principali rivenditori

L' NVIDIA DGX Spark (GB10 Grace Blackwell) è ora disponibile in Australia nei principali rivenditori di PC con scorte locali. Se segui le prezzi e disponibilità globali del DGX Spark, sarà interessante sapere che i prezzi in Australia variano da 6.249 a 7.999 AUD a seconda della configurazione di archiviazione e del rivenditore.

Rilevare l'AI Slop: Tecniche & Segnali di Allarme

La proliferazione del contenuto generato dall’IA ha creato una nuova sfida: distinguere la scrittura umana autentica da “AI slop” - testo sintetico di bassa qualità, prodotto in massa.

Self-Hosting Cognee: Scegliere LLM su Ollama

Cognee è un framework Python per costruire grafi di conoscenza da documenti utilizzando LLM. Ma funziona con modelli auto-hostati?

BAML vs Insegnante: Output di LLM Strutturati

Quando si lavora con i Large Language Models in produzione, ottenere output strutturati e sicuri dal punto di vista dei tipi è fondamentale. Due framework popolari - BAML e Instructor - adottano approcci diversi per risolvere questo problema.

AI

Tutorial sulla Generazione Aumentata dal Recupero (RAG): Architettura, Implementazione e Guida alla Produzione

Le Prestazioni degli LLM nel 2026: Benchmark, Colli di Bottiglia e Ottimizzazione

LLM Hosting nel 2026: Confronto tra Infrastrutture Locali, Self-Hosted e Cloud

Autoservizio di LLM e Sovranità dell'AI

Confronto delle prestazioni dei modelli LLM su Ollama su GPU con 16 GB di VRAM

I migliori 17 progetti Python in tendenza su GitHub

Top 23 progetti Rust più in voga su GitHub - Gennaio 2026

Top 19 Progetti Go più popolari su GitHub - Gennaio 2026

Guida a Anaconda vs Miniconda vs Mamba

Open WebUI: interfaccia self-hosted per LLM

Eventi tecnologici a Melbourne da non perdere nel 2026

vLLM Quickstart: Servizio di LLM ad alte prestazioni - nel 2026

Prezzo DGX Spark AU: 6.249–7.999 USD presso i principali rivenditori

Rilevare l'AI Slop: Tecniche & Segnali di Allarme

Self-Hosting Cognee: Scegliere LLM su Ollama

BAML vs Insegnante: Output di LLM Strutturati