Rost Glukhov | Site personnel et blog technique

Ollama derrière un proxy inversé avec Caddy ou Nginx pour le streaming HTTPS

Exécuter Ollama derrière un proxy inversé est le moyen le plus simple d’obtenir HTTPS, un contrôle d’accès facultatif et un comportement de streaming prévisible.

Embeddings de texte pour RAG et recherche - Python, Ollama, API compatibles OpenAI

Si vous travaillez sur la génération augmentée par récupération (RAG), cette section explique les incorporations de texte (text embeddings) en termes simples : ce qu’elles sont, comment elles s’intègrent dans la recherche et la récupération, et comment appeler deux configurations locales courantes depuis Python en utilisant Ollama ou une API HTTP compatible OpenAI (comme le font de nombreux serveurs basés sur llama.cpp).

Netlify pour Hugo et les sites statiques : tarification, offre gratuite et alternatives

Netlify est l’une des méthodes les plus adaptées aux développeurs pour déployer des sites Hugo et des applications web modernes avec un flux de travail de niveau production : URLs de prévisualisation pour chaque demande de fusion (pull request), déploiements atomiques, un CDN mondial et des capacités serverless et edge optionnelles.

Apache Flink sur K8s et Kafka : PyFlink, Go, opérations et tarification gérée

Apache Flink est un cadre pour les calculs à état sur des flux de données bornés et non bornés.

Base de données graphique Neo4j pour GraphRAG, installation, Cypher, vecteurs, opérations.

Neo4j est la solution à laquelle on se tourne lorsque les relations sont les données. Si votre domaine ressemble à un tableau blanc rempli de cercles et de flèches, le forcer dans des tables est douloureux.

IndexNow expliqué : notifier les moteurs de recherche lors de la publication

Les sites statiques et les blogs changent à chaque déploiement. Les moteurs de recherche prenant en charge IndexNow peuvent prendre connaissance de ces changements sans attendre le prochain cycle de crawl aveugle.

Comparatif des solutions d'e-mail hébergé pour domaines personnalisés : Workspace, Microsoft 365, Zoho, Proton et WorkMail.

Mettre en place un e-mail sur votre propre domaine semble être une tâche DNS de week-end. En pratique, il s’agit d’un petit système distribué avec un héritage de vingt ans.

Démarrage rapide de SGLang : Installation, configuration et déploiement de LLM via l’API OpenAI

SGLang est un framework de service haute performance pour les grands modèles de langage et les modèles multimodaux, conçu pour fournir une inférence à faible latence et à haut débit sur tout, d’une seule GPU à des clusters distribués.

Guide de prise en main rapide du sélecteur de modèles llama.swap pour les LLM locaux compatibles OpenAI

Bientôt, vous jonglerez avec vLLM, llama.cpp et plus encore — chaque pile sur son propre port. Tout ce qui se trouve en aval souhaite toujours une URL de base /v1; sinon, vous continuez à changer de ports, de profils et de scripts ponctuels. llama-swap est le proxy /v1 avant ces piles.

Démarrage rapide d'Apache Kafka - Installation de Kafka 4.2 avec CLI et exemples locaux

Apache Kafka 4.2.0 est la ligne de version actuellement supportée, et elle constitue la meilleure base pour un démarrage rapide moderne, car Kafka 4.x est totalement libre de ZooKeeper et construit autour de KRaft par défaut.

Oh My Opencode Avis : Résultats honnêtes, risques de facturation et quand cela vaut la peine

Oh My Opencode promet une « équipe de développement IA virtuelle » : Sisyphus orchestre des spécialistes, les tâches s’exécutent en parallèle et le mot magique ultrawork active tout cela.

Plongée approfondie et guide des modèles des agents spécialisés Opencode

Le saut de capacité le plus important dans OpenCode provient des agents spécialisés : séparation délibérée de l’orchestration, de la planification, de l’exécution et de la recherche.

« Oh My Opencode : Démarrage rapide pour OpenCode – Installation, configuration et exécution »

Oh My Opencode transforme OpenCode en un harnais de codage multi-agents : un orchestrateur délègue le travail à des agents spécialisés qui s’exécutent en parallèle.

Meilleurs LLMs pour OpenCode - De Gemma 4 à Qwen 3.6, testés localement

J’ai testé comment OpenCode fonctionne avec plusieurs LLM hébergés localement sur Ollama et llama.cpp, et j’ai ajouté pour comparaison quelques modèles gratuits provenant d’OpenCode Zen.

Début rapide de l'assistant de codage OpenHands : installation, options de ligne de commande et exemples

OpenHands est une plateforme open-source et agnostique des modèles pour les agents de développement logiciel pilotés par l’IA. Il permet à un agent de se comporter davantage comme un partenaire de codage que comme un simple outil de complétion automatique.

LocalAI QuickStart : Exécuter des LLM compatibles OpenAI localement

LocalAI est un serveur d’inférence auto-hébergé, conçu en priorité pour une utilisation locale, qui se comporte comme une API OpenAI de remplacement pour exécuter des charges de travail d’IA sur votre propre matériel (ordinateur portable, station de travail ou serveur sur site).

S'abonner