Aplicações de monitoramento de GPU no Linux/Ubuntu
Pequena lista de aplicativos para monitoramento de carga da GPU
Aplicações de monitoramento de carga da GPU: nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.
Pequena lista de aplicativos para monitoramento de carga da GPU
Aplicações de monitoramento de carga da GPU: nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.
Instalando o Kubernetes k3s em um cluster homelab
Aqui está um passo a passo para a instalação de um cluster K3s de 3 nós em servidores bare-metal (1 mestre + 2 workers).
Visão geral muito breve das variantes do Kubernetes
Comparando distribuições de Kubernetes auto-hospedado para hospedagem em servidores bare-metal ou domésticos, focando na facilidade de instalação, desempenho, requisitos de sistema e conjunto de recursos.
Escolhendo a melhor distribuição de Kubernetes para o nosso homelab
Estou comparando variantes auto-hospedadas do Kubernetes adequadas para um homelab baseado em Ubuntu com 3 nós (16 GB de RAM, 4 núcleos cada), focando na facilidade de configuração e manutenção, suporte a volumes persistentes e LoadBalancers.
Um pouco sobre as ações comuns do GitHub e sua estrutura.
GitHub Actions é uma plataforma de automação e CI/CD dentro do GitHub, usada para compilar, testar e implantar seu código com base em eventos como pushes, pull requests ou em um horário agendado.
A propósito, o docker-compose é diferente do docker compose...
Aqui está um minimamente de Docker Compose com exemplos anotados para ajudá-lo a dominar rapidamente arquivos e comandos Compose.
Sobre o Obsidian...
Aqui está uma análise detalhada de Obsidian como uma ferramenta poderosa para gestão de conhecimento pessoal (PKM), explicando sua arquitetura, recursos, pontos fortes e como ela suporta fluxos de trabalho modernos de conhecimento.
Em julho de 2025, em breve deverá estar disponível.
A Nvidia está prestes a lançar o NVIDIA DGX Spark - um pequeno supercomputador de IA baseado na arquitetura Blackwell, com mais de 128 GB de RAM unificada e desempenho de IA de 1 PFLOPS. Um ótimo dispositivo para executar LLMs.
Quais sistemas de análise web utilizar no seu site?
Vamos dar uma rápida olhada nos provedores e sistemas de análise web como Matomo, Plausible, Google e outros disponíveis para auto-hospedagem e compará-los.
Notas sobre a sequência de instalação padrão do Ubuntu 24.04
Aqui está o meu conjunto favorito de etapas ao realizar uma instalação limpa do Ubuntu 24.04. O que eu gosto aqui - não é necessário instalar os drivers da NVidia! Eles são instalados automaticamente.
Estava utilizando o Dokuwiki como base de conhecimento pessoal.
Dokuwiki é uma wikipedia hospedada no próprio servidor que pode ser hospedada facilmente nas próprias instalações e sem a necessidade de qualquer banco de dados. Eu estava rodando ela containerizada em meu cluster kubernetes de estimação.
Atualização de preços de GPUs adequadas para IA: RTX 5080 e RTX 5090
Vamos comparar os preços das principais GPUs de consumo, adequadas em particular para LLMs e para IA em geral. Especificamente, observe os preços da RTX 5080 e RTX 5090. Eles caíram ligeiramente.
Ótimo framework para ETS/MLOPS com Python
Apache Airflow é uma plataforma de código aberto projetada para criar, agendar e monitorar fluxos de trabalho de forma programática, inteiramente em código Python, oferecendo uma alternativa flexível e poderosa às ferramentas de fluxo de trabalho tradicionais, manuais ou baseadas em interface gráfica.
Implementando RAG? Aqui estão alguns trechos de código em Go - 2...
Como o Ollama padrão não possui uma API de rerank direta, você precisará implementar a rerank usando o Qwen3 Reranker em GO gerando embeddings para pares de consulta-documento e atribuindo pontuações a eles.
Qwen3 8B, 14B e 30B, Devstral 24B e Mistral Small 24B
Neste teste, estou comparando como diferentes LLMs hospedados no Ollama traduzem páginas do Hugo de inglês para alemão.
Implementando RAG? Aqui estão alguns snippets de código em Golang.
Este pequeno Exemplo de código Go para reranking que chama o Ollama para gerar embeddings é usado para a consulta e para cada documento candidato, ordenando em ordem decrescente por similaridade cosseno.