Hardware

Estrategias de segmentación en comparación de RAG: Alternativas, concesiones y ejemplos

Chunking es el hiperparámetro más subestimado en Generación Aumentada por Recuperación (RAG): silenciosamente determina lo que ve tu LLM, cuán costosa se vuelve la ingesta, y cuánto del contexto de la LLM consumes por respuesta.

Hardware de computación en 2026: GPUs, CPUs, memoria y estaciones de trabajo para IA.

A hub for compute hardware analysis covering GPUs, CPUs, memory trends, and AI-focused workstation infrastructure.

Autohospedaje de LLMs mantiene los datos, modelos e inferencia bajo su control: un camino práctico hacia la soberanía en IA para equipos, empresas y naciones.

Comparando el rendimiento de los LLMs en Ollama en una GPU con 16 GB de VRAM

Ejecutar modelos de lenguaje grandes localmente te brinda privacidad, capacidad para trabajar sin conexión y cero costos de API. Este benchmark revela exactamente lo que se puede esperar de 14 modelos populares LLMs en Ollama en una RTX 4080.

Aumentan los precios de las GPU y la RAM en Australia: RTX 5090 sube un 15%, la RAM un 38% - enero de 2026

Hoy nos estamos enfocando en las GPUs de consumo de alto nivel y módulos de RAM. Específicamente, me estoy enfocando en precios de RTX-5080 y RTX-5090, y 32GB (2x16GB) DDR5 6000.

Mejores emuladores de terminal para Linux: Comparativa de 2026

Uno de los herramientas más esenciales para los usuarios de Linux es el emulador de terminal.

Precios de DGX Spark AU: $6.249-$7.999 en principales minoristas

El NVIDIA DGX Spark (GB10 Grace Blackwell) ya está disponible en Australia en los principales minoristas de PC con stock local. Si has estado siguiendo los precios y disponibilidad globales del DGX Spark, te interesará saber que los precios en Australia oscilan entre $6.249 y $7.999 AUD, dependiendo de la configuración de almacenamiento y del minorista.

Autohospedaje de Cognee: Elegir LLM en Ollama

Cognee es un marco de Python para construir grafos de conocimiento a partir de documentos utilizando LLMs. ¿Pero funciona con modelos autohospedados?

Ubuntu perdió la red después de la actualización del kernel

Después de instalar automáticamente un nuevo núcleo, Ubuntu 24.04 ha perdido la conexión de red ethernet. Este problema frustrante ocurrió de nuevo para mí, así que estoy documentando la solución aquí para ayudar a otros que enfrenten el mismo problema.

Precio de la RAM en Australia - diciembre de 2025

Con esta loca volatilidad de los precios de la RAM, para formarnos y tener una mejor imagen, primero vamos a rastrear nosotros mismos el precio de la RAM en Australia.

Aumento de precios de la RAM: hasta un 619% en 2025

El mercado de la memoria está experimentando una volatilidad de precios sin precedentes a finales de 2025, con un aumento dramático en los precios de la RAM en todos los segmentos.

Precios de las tarjetas NVidia RTX 5080 y RTX 5090 en Australia - noviembre de 2025

Comparemos los precios de las GPUs de consumo de nivel superior, que son adecuadas para LLMs en particular y para la IA en general. Específicamente, estoy analizando precios de RTX-5080 y RTX-5090.

Infraestructura de IA en hardware de consumo

La democratización de la IA está aquí. Con modelos de lenguaje de gran tamaño (LLM) de código abierto como Llama, Mistral y Qwen rivalizando ahora con los modelos propietarios, los equipos pueden construir una infraestructura de IA utilizando hardware de consumo, reduciendo drásticamente los costos mientras mantienen el control total sobre la privacidad de los datos y el despliegue.

Añadir soporte para GPU de NVIDIA al ejecutor de modelos de Docker

Docker Model Runner es la herramienta oficial de Docker para ejecutar modelos de IA localmente, pero habilitar la aceleración de GPU de NVidia en Docker Model Runner requiere una configuración específica.

NVIDIA DGX Spark vs Mac Studio vs RTX-4080: Comparación del rendimiento de Ollama

Investigué algunos interesantes tests de rendimiento del modelo GPT-OSS 120b ejecutándose en Ollama en tres plataformas diferentes: NVIDIA DGX Spark, Mac Studio y RTX 4080. El modelo GPT-OSS 120b del repositorio Ollama tiene un tamaño de 65GB, lo que significa que no cabe en los 16GB de VRAM de un RTX 4080 (ni en el más reciente RTX 5080).

Docker Model Runner Cheatsheet: Comandos y ejemplos

Docker Model Runner (DMR) es la solución oficial de Docker para ejecutar modelos de IA localmente, introducida en abril de 2025. Esta guía rápida proporciona una referencia rápida para todos los comandos esenciales, configuraciones y mejores prácticas.