LLM

El uso de LLMs no es muy costoso, podría no haber necesidad de comprar una nueva GPU impresionante. Aquí hay una lista si proveedores de LLM en la nube con LLMs que alojan.

Prueba: Cómo Ollama está utilizando el rendimiento de la CPU de Intel y los núcleos eficientes

Tengo una teoría que quiero probar: ¿utilizar todos los núcleos en un procesador Intel aumentaría la velocidad de los LLMs? Me molesta que el nuevo modelo gemma3 de 27 bits (gemma3:27b, 17 GB en ollama) no entre en los 16 GB de VRAM de mi GPU, y se ejecute parcialmente en el CPU.

Comparando la idoneidad de las GPU de NVidia para la IA

En medio del caos del mundo moderno aquí estoy comparando especificaciones técnicas de diferentes tarjetas adecuadas para tareas de IA (Deep Learning, Detección de Objetos y LLMs). Aunque todas son increíblemente caras.

Cómo Ollama maneja solicitudes en paralelo

Cuando el servidor Ollama recibe dos solicitudes al mismo tiempo, su comportamiento depende de su configuración y de los recursos del sistema disponibles.

¿Qué es Vibe Coding? Significado, herramientas, beneficios y riesgos en 2026

Programación con “vibe” es un enfoque de programación impulsado por IA donde los desarrolladores describen la funcionalidad deseada en lenguaje natural y dejan que las herramientas de IA generen el código automáticamente, con una escritura directa mínima.

DeepSeek’s primer generación de modelos de razonamiento con un rendimiento comparable al de OpenAI-o1, incluyendo seis modelos densos destilados de DeepSeek-R1 basados en Llama y Qwen.

Esta hoja de trucos de la CLI de Ollama se centra en los comandos que usas a diario (ollama ls, ollama serve, ollama run, ollama ps, gestión de modelos y flujos de trabajo comunes), con ejemplos que puedes copiar y pegar.

No hace mucho tiempo se lanzó. Vamos a ponernos al día y pruebe cómo se comporta Mistral Small en comparación con otros LLMs.

Reranking es un segundo paso en la Generación Aumentada por Recuperación (RAG) sistemas, situado justo entre la Recuperación y la Generación.

Recientemente, Black Forest Labs publicó un conjunto de modelos de IA de texto a imagen. Estos modelos se dicen que tienen una calidad de salida mucho mayor. Probémoslos

La comida increíble también es un placer para la vista. Pero en esta entrada compararemos dos sistemas de búsqueda basados en IA, Farfalle y Perplexica.

¡Eso es muy emocionante! En lugar de llamar a Copilot o Perplexity.ai y contarle al mundo entero lo que buscas, ¡ahora puedes alojar un servicio similar en tu propio PC o portátil!

Recientemente hemos visto la liberación de varios nuevos LLMs. Tiempo emocionante. Vamos a probar y ver cómo se desempeñan al detectar falacias lógicas.

Aún así, existen algunos enfoques comunes para escribir buenos prompts de manera que los modelos de lenguaje no se confundan al intentar entender lo que deseas.

Comparando las capacidades de resumen de los LLM

Prueba de cómo se comportan los modelos con diferentes números de parámetros y cuantización.

Después de instalar Ollama, es mejor reconfigurar Ollama para que los almacene en la nueva ubicación de inmediato. Así, cuando descargamos un nuevo modelo, no se descarga en la ubicación antigua.

Proveedores de LLM en la nube

Prueba: Cómo Ollama está utilizando el rendimiento de la CPU de Intel y los núcleos eficientes

Comparando la idoneidad de las GPU de NVidia para la IA

Cómo Ollama maneja solicitudes en paralelo

¿Qué es Vibe Coding? Significado, herramientas, beneficios y riesgos en 2026

Prueba de Deepseek-R1 en Ollama

Hoja de referencia de la CLI de Ollama: ls, serve, run, ps y comandos (actualización 2026)

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 y Phi - Prueba de modelos de lenguaje grande

Reordenamiento con modelos de incrustación

Modelo de IA Flux de texto a imagen

Farfalle frente a Perplexica

Autoalojamiento de Perplexica - con Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Escribir prompts efectivos para LLMs

Comparando las capacidades de resumen de los LLM

Mover los modelos de Ollama a una ubicación diferente