LLM

Non molto tempo fa è stato rilasciato. Andiamo a rivedere e
testa come si comporta Mistral Small rispetto ad altri LLM.

Reranking è un secondo passo nella Generazione Assistita dal Recupero (RAG) sistemi, proprio tra il Recupero e la Generazione.

Recentemente Black Forest Labs ha pubblicato un insieme di modelli AI testo-immagine.
Questi modelli si dice che abbiano una qualità di output molto superiore.
Proviamoli

La buona cucina è un piacere per gli occhi. Ma in questo post compariamo due sistemi di ricerca basati sull’AI, Farfalle e Perplexica.

Questo è molto eccitante! Invece di chiamare copilot o perplexity.ai e raccontare a tutti il mondo di cosa stai cercando, ora puoi ospitare un servizio simile sul tuo PC o laptop!

Quando ho iniziato a sperimentare con gli LLM, le interfacce utente per loro erano in fase attiva di sviluppo e ora alcune di esse sono davvero buone.

Recentemente abbiamo visto il rilascio di diversi nuovi LLM. Tempi eccitanti. Testiamo e vediamo come si comportano quando rilevano fallacie logiche.

Tuttavia, esistono alcuni approcci comuni per scrivere promemoria efficaci in modo che i modelli linguistici non si confondano cercando di capire cosa si desidera da essi.

Confronto delle capacità di riassunto degli LLM

Testando come modelli con un numero diverso di parametri e quantizzazione si comportano.

Dopo l’installazione di ollama è meglio riconfigurare ollama per archiviarli in un nuovo luogo subito. In questo modo, dopo aver scaricato un nuovo modello, non verrà scaricato nella vecchia posizione.

Confronto della velocità di previsione di diverse versioni di LLM: llama3 (Meta/Facebook), phi3 (Microsoft), gemma (Google), mistral (open source) su CPU e GPU.

Ecco qui che confronto diverse versioni di LLM: Llama3 (Meta), Phi3 (Microsoft), Gemma (Google), Mistral Nemo (Mistral AI) e Qwen (Alibaba).

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 e Phi - Test con LLM

Riordinamento con modelli di embedding

Modello AI Flux da testo a immagine

Farfalle vs Perplexica

Self-hosting Perplexica - con Ollama

Frontend per LLM

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Scrivere prompt efficaci per i modelli linguistici di grandi dimensioni

Confronto delle capacità di riassunto degli LLM

Spostare i modelli Ollama in una posizione diversa

Test di velocità dei modelli linguistici di grandi dimensioni

Rilevamento delle fallacie logiche con i modelli linguistici di grandi dimensioni