LLM

Сравнение структурированного вывода среди популярных поставщиков LLM — OpenAI, Gemini, Anthropic, Mistral и AWS Bedrock

Вот сравнение поддержки структурированного вывода (получение надежного JSON) среди популярных поставщиков LLM, а также минимальные примеры на Python

LLM и структурированный вывод: Ollama, Qwen3 & Python или Go

Большие языковые модели (LLM) мощные, но в производстве мы редко хотим свободноформатных абзацев. Вместо этого нам нужны предсказуемые данные: атрибуты, факты или структурированные объекты, которые можно передать в приложение. Это Структурированный вывод LLM.

Распределение памяти и планирование моделей в новой версии Ollama - v0.12.1

Здесь я сравниваю, сколько VRAM новая версия Ollama выделяет для модели по сравнению с предыдущей версией. Новая версия работает хуже.

Ollama быстро стал одним из самых популярных инструментов для запуска локальных моделей большого языка (LLM). Его простой интерфейс командной строки и упрощенное управление моделями сделали его предпочтительным вариантом для разработчиков, которые хотят работать с моделями ИИ вне облака.

Интерфейсы чатов для локальных экземпляров Ollama

Локально размещённый Ollama позволяет запускать большие языковые модели на вашем собственном устройстве, но использование его через командную строку не очень удобно. Вот несколько открытых проектов, которые предоставляют интерфейсы в стиле ChatGPT, подключающиеся к локальному Ollama.

NVIDIA DGX Spark — новый компактный суперкомпьютер для искусственного интеллекта

Nvidia вот-вот выпустит NVIDIA DGX Spark — компактный ИИ-суперкомпьютер на архитектуре Blackwell с более чем 128 ГБ объединенной памяти и производительностью 1 ПФЛОПС для задач искусственного интеллекта. Отличное устройство для запуска больших языковых моделей (LLM).

Протокол контекста модели (MCP) и заметки о реализации сервера MCP на Go

Здесь представлено описание Протокола Контекста Модели (MCP), краткие заметки о том, как реализовать MCP сервер на Go, включая структуру сообщений и спецификации протокола.

Переранжирование документов с помощью Ollama и модели Qwen3 Reranker на языке Go

Поскольку стандартный Ollama не имеет прямого API для пересчета рангов (rerank), вам потребуется реализовать пересчет рангов с использованием Qwen3 Reranker на GO путем генерации эмбеддингов для пар «запрос-документ» и их оценки.

Сравнение качества перевода страниц Hugo с использованием языковых моделей на Ollama

В этом тесте я сравниваю, как разные ЛЛМ, размещенные на Ollama, переводят страницы Hugo на английском языке на немецкий.

Переранжирование текстов с помощью Ollama и модели встраивания Qwen3 LLM на языке Go

Этот небольшой пример кода на Go для пересортировки вызывает Ollama для генерации эмбеддингов для запроса и для каждого кандидата-документа, затем сортирует их по убыванию косинусного сходства.

Модели встраивания и переупорядочивания Qwen3 на Ollama: передовые показатели производительности

Модели встраивания и переупорядочивания Qwen3 являются новейшими релизами в семействе Qwen, специально разработанными для продвинутых задач встраивания текста (embedding), поиска и переупорядочивания результатов (reranking).

Производительность ЛЛМ и PCIe-каналы: ключевые аспекты

Как количество PCIe-полос влияет на производительность LLM? Зависит от задачи. Для обучения и многопроцессорной инференции - значительное падение производительности.

Конвертируйте содержимое HTML в Markdown с использованием LLM и Ollama

В библиотеке моделей Ollama есть модели, способные конвертировать HTML-контент в Markdown, что полезно для задач преобразования контента. Это руководство является частью нашего Инструменты документации в 2026: Markdown, LaTeX, PDF и рабочие процессы печати хаба.

Поиск против Глубокого поиска против Глубокого исследования в 2026 году

Поиск лучше всего подходит для быстрого получения простой информации с использованием ключевых слов.
Глубокий поиск превосходит в понимании контекста и намерений, предоставляя более релевантные и полные результаты для сложных запросов.

Сравнение AI-ассистентов для программирования

Здесь я перечислю некоторые инструменты для программирования с помощью ИИ и ИИ-ассистентов для написания кода, а также их преимущества.

Использование языковых моделей не требует больших затрат, возможно, не потребуется покупать новый мощный GPU. Вот список провайдеров языковых моделей в облаке.

Сравнение структурированного вывода среди популярных поставщиков LLM — OpenAI, Gemini, Anthropic, Mistral и AWS Bedrock

LLM и структурированный вывод: Ollama, Qwen3 & Python или Go

Распределение памяти и планирование моделей в новой версии Ollama - v0.12.1

Оллама Эншитификация: ранние признаки

Интерфейсы чатов для локальных экземпляров Ollama

NVIDIA DGX Spark — новый компактный суперкомпьютер для искусственного интеллекта

Протокол контекста модели (MCP) и заметки о реализации сервера MCP на Go

Переранжирование документов с помощью Ollama и модели Qwen3 Reranker на языке Go

Сравнение качества перевода страниц Hugo с использованием языковых моделей на Ollama

Переранжирование текстов с помощью Ollama и модели встраивания Qwen3 LLM на языке Go

Модели встраивания и переупорядочивания Qwen3 на Ollama: передовые показатели производительности

Производительность ЛЛМ и PCIe-каналы: ключевые аспекты

Конвертируйте содержимое HTML в Markdown с использованием LLM и Ollama

Поиск против Глубокого поиска против Глубокого исследования в 2026 году

Сравнение AI-ассистентов для программирования

Поставщики облачных LLM