AI - Page 5 - Rost Glukhov | Site personnel et blog technique

Reclassement de documents avec Ollama et le modèle Qwen3 Reranker — en Go

Puisque la version standard d’Ollama ne possède pas d’API de reranking directe, vous devrez implémenter le reranking en utilisant Qwen3 Reranker en GO en générant des embeddings pour les paires requête-document et en les notant.

Un froid jour d’hiver en juillet… c’est-à-dire en Australie… j’ai ressenti le besoin urgent d’entraîner un modèle d’IA pour détecter les barres d’armature en béton non coupées…

Comparaison de la qualité de la traduction des pages Hugo - LLMs sur Ollama

Dans ce test, je suis en train de comparer comment différents LLMs hébergés sur Ollama traduisent une page Hugo en anglais vers l’allemand.

Reclassement de textes avec Ollama et l'LLM d'embedding Qwen3 - en Go

Cet exemple de code Go pour le reranking appelle Ollama pour générer des embeddings pour la requête et pour chaque document candidat, puis les trie de manière décroissante selon la similarité cosinus.

Performance des LLM et voies PCIe : Points clés à considérer

Comment les canaux PCIe affectent les performances des LLM ? Selon la tâche. Pour l’entraînement et l’inférence multi-GPU, la baisse de performance est significative.

Convertir du contenu HTML en Markdown à l'aide d'un LLM et d'Ollama

Dans la bibliothèque de modèles Ollama, il existe des modèles capables de convertir du contenu HTML en Markdown, ce qui est utile pour les tâches de conversion de contenu. Ce guide fait partie de notre Outils de Documentation en 2026 : Markdown, LaTeX, PDF et Flux de Travail d’Impression hub.

Recherche vs Deepsearch vs Deep Research

La Recherche est idéale pour une récupération rapide et directe d’informations à l’aide de mots-clés.
Deep Search excelle dans la compréhension du contexte et de l’intention, offrant des résultats plus pertinents et complets pour les requêtes complexes.

Comparaison des assistants de codage par IA

Voici une liste d’outils d’assistance au codage basés sur l’intelligence artificielle (IA) et leurs avantages.

Fournisseurs de modèles de langage de cloud

L’utilisation des LLM n’est pas très coûteuse, il pourrait ne pas être nécessaire d’acheter un nouveau GPU impressionnant. Voici une liste si fournisseurs de LLM en nuage avec les LLM qu’ils hébergent.

Test : Comment Ollama utilise les performances du processeur Intel et les cœurs efficaces

J’ai une théorie à tester - si l’utilisation de tous les cœurs d’un processeur Intel augmenterait la vitesse des LLM ? Cela me tracasse que le nouveau modèle gemma3 27 bit (gemma3:27b, 17 Go sur ollama) ne tienne pas dans les 16 Go de VRAM de mon GPU, et qu’il s’exécute partiellement sur le CPU.

Comparaison de la pertinence des GPU NVidia pour l'IA

Dans le milieu du chaos du monde moderne ici, je compare les spécifications techniques de différentes cartes adaptées aux tâches IA
(Deep Learning,
Détection d’objets
et LLMs).
Elles sont toutes extrêmement chères toutefois.

Comment Ollama gère les requêtes parallèles

Lorsque le serveur Ollama reçoit deux demandes en même temps, son comportement dépend de sa configuration et des ressources système disponibles.

Vibe coding est une approche de programmation pilotée par l’IA où les développeurs décrivent les fonctionnalités souhaitées en langage naturel, permettant aux outils d’IA de générer automatiquement du code.

J’ai utilisé MMDetection (mmengine, mdet, mmcv) assez souvent,
et maintenant il semble qu’il ait quitté la scène.
C’est une perte. J’aimais sa zoo de modèles.

DeepSeek’s première génération de modèles de raisonnement avec des performances comparables à celles d’OpenAI-o1, incluant six modèles denses distillés à partir de DeepSeek-R1 basés sur Llama et Qwen.

Ce Ollama CLI cheatsheet se concentre sur les commandes que vous utilisez tous les jours (ollama ls, ollama serve, ollama run, ollama ps, gestion des modèles et flux de travail courants), avec des exemples que vous pouvez copier/coller.

AI

Reclassement de documents avec Ollama et le modèle Qwen3 Reranker — en Go

Détection d'objets avec Tensorflow

Comparaison de la qualité de la traduction des pages Hugo - LLMs sur Ollama

Reclassement de textes avec Ollama et l'LLM d'embedding Qwen3 - en Go

Performance des LLM et voies PCIe : Points clés à considérer

Convertir du contenu HTML en Markdown à l'aide d'un LLM et d'Ollama

Recherche vs Deepsearch vs Deep Research

Comparaison des assistants de codage par IA

Fournisseurs de modèles de langage de cloud

Test : Comment Ollama utilise les performances du processeur Intel et les cœurs efficaces

Comparaison de la pertinence des GPU NVidia pour l'IA

Comment Ollama gère les requêtes parallèles

Vibe Coding - Sens et description

MMdetection n'est plus pris en charge.

Test de Deepseek-R1 sur Ollama

Feuille de rappel de la CLI Ollama : ls, serve, run, ps + commandes (mise à jour 2026)