AI - Page 4 - Rost Glukhov | Sito personale e blog tecnico

Open WebUI: interfaccia self-hosted per LLM

Open WebUI è una potente, estensibile e ricca di funzionalità interfaccia web autoospitata per interagire con i grandi modelli linguistici.

Eventi tecnologici a Melbourne da non perdere nel 2026

La comunità tecnologica di Melbourne continua a prosperare nel 2026 con un’impressionante serie di conferenze, incontri e workshop che coprono sviluppo software, calcolo cloud, AI, cybersecurity e tecnologie emergenti.

vLLM è un motore di inferenza e servizio ad alto throughput e a basso consumo di memoria per modelli linguistici su larga scala (LLM), sviluppato dal laboratorio Sky Computing dell’Università della California, Berkeley.

Prezzo DGX Spark AU: 6.249–7.999 USD presso i principali rivenditori

L' NVIDIA DGX Spark (GB10 Grace Blackwell) è ora disponibile in Australia nei principali rivenditori di PC con scorte locali. Se segui le prezzi e disponibilità globali del DGX Spark, sarà interessante sapere che i prezzi in Australia variano da 6.249 a 7.999 AUD a seconda della configurazione di archiviazione e del rivenditore.

Rilevare l'AI Slop: Tecniche & Segnali di Allarme

La proliferazione del contenuto generato dall’IA ha creato una nuova sfida: distinguere la scrittura umana autentica da “AI slop” - testo sintetico di bassa qualità, prodotto in massa.

Self-Hosting Cognee: Scegliere LLM su Ollama

Cognee è un framework Python per costruire grafi di conoscenza da documenti utilizzando LLM. Ma funziona con modelli auto-hostati?

BAML vs Insegnante: Output di LLM Strutturati

Quando si lavora con i Large Language Models in produzione, ottenere output strutturati e sicuri dal punto di vista dei tipi è fondamentale. Due framework popolari - BAML e Instructor - adottano approcci diversi per risolvere questo problema.

Scegliere il giusto LLM per Cognee: Configurazione locale di Ollama

Scegliere il miglior LLM per Cognee richiede di bilanciare la qualità della costruzione del grafo, i tassi di allucinazione e i vincoli hardware. Cognee eccelle con modelli più grandi a bassa allucinazione (32B+) tramite Ollama ma le opzioni di dimensioni medio-piccole funzionano per le configurazioni più leggere.

Scheda di riferimento per Jupyter Notebook

Jumpstart the produttività del Jupyter Notebook con scorciatiere essenziali, comandi magici e suggerimenti per il flusso di lavoro che trasformeranno l’esperienza di data science e sviluppo.

Utilizzo dell'API di ricerca Web di Ollama in Python

La libreria Python di Ollama ora include funzionalità native di ricerca web OLLama. Con poche righe di codice, puoi arricchire i tuoi LLM locali con informazioni in tempo reale dal web, riducendo le illusioni e migliorando l’accuratezza.

La scelta del giusto vettore store può fare la differenza per le prestazioni, i costi e la scalabilità della tua applicazione RAG. Questo confronto completo copre le opzioni più popolari nel 2024-2025.

L’API di ricerca web di Ollama ti permette di integrare LLM locali con informazioni in tempo reale dal web. Questa guida ti mostra come implementare le capacità di ricerca web in Go, dal semplice utilizzo dell’API alle funzionalità complete degli agenti di ricerca.

Aumento dei prezzi della RAM: fino al 619% nel 2025

Il mercato della memoria sta vivendo una volatilità dei prezzi senza precedenti alla fine del 2025, con i prezzi della RAM in forte aumento che si stanno verificando drammaticamente in tutti i segmenti.

Ollama vs vLLM vs LM Studio: il metodo migliore per eseguire LLM in locale nel 2026?

L’esecuzione di LLM in locale è ora pratica per sviluppatori, startup e persino team aziendali.
Ma la scelta dello strumento giusto — Ollama, vLLM, LM Studio, LocalAI o altri — dipende dai tuoi obiettivi:

Go Microservices per l'Orchestrazione AI/ML

Con l’aumento della complessità dei carichi di lavoro di AI e ML, è diventato più urgente il bisogno di sistemi di orchestrazione robusti. La semplicità, le prestazioni e la concorrenza di Go lo rendono una scelta ideale per costruire lo strato di orchestrazione dei pipeline ML, anche quando i modelli stessi sono scritti in Python.

Embedding multimodali: collegare le modalità dell'AI

Embeddingi cross-modal rappresentano un passo avanti significativo nell’intelligenza artificiale, consentendo di comprendere e ragionare su diversi tipi di dati all’interno di uno spazio di rappresentazione unificato.

AI

Open WebUI: interfaccia self-hosted per LLM

Eventi tecnologici a Melbourne da non perdere nel 2026

vLLM Quickstart: Servizio di LLM ad alte prestazioni - nel 2026

Prezzo DGX Spark AU: 6.249–7.999 USD presso i principali rivenditori

Rilevare l'AI Slop: Tecniche & Segnali di Allarme

Self-Hosting Cognee: Scegliere LLM su Ollama

BAML vs Insegnante: Output di LLM Strutturati

Scegliere il giusto LLM per Cognee: Configurazione locale di Ollama

Scheda di riferimento per Jupyter Notebook

Utilizzo dell'API di ricerca Web di Ollama in Python

Confronto dei Vettori Store per RAG

L'uso dell'Ollama Web Search API in Go

Aumento dei prezzi della RAM: fino al 619% nel 2025

Ollama vs vLLM vs LM Studio: il metodo migliore per eseguire LLM in locale nel 2026?

Go Microservices per l'Orchestrazione AI/ML

Embedding multimodali: collegare le modalità dell'AI