Rost Glukhov | 개인 사이트 및 기술 블로그

Apache Kafka 빠른 시작 - CLI 및 로컬 예제를 사용하여 Kafka 4.2 설치하기

Apache Kafka 4.2.0 는 현재 지원되는 릴리스 라인이며, Kafka 4.x 는 완전한 ZooKeeper-free 구조로 KRaft를 기본으로 구축되어 있어 현대적인 Quickstart 를 위한 가장 이상적인 기준선입니다.

오픈코드 리뷰: 솔직한 결과, 청구 리스크, 그리고 투자할 가치가 있는 경우

Oh My Opencode 는 “가상의 AI 개발 팀"을 약속합니다. Sisyphus 가 전문가들을 지휘하고, 작업이 병렬로 실행되며, 마법 같은 ultrawork 키워드가 모든 것을 활성화합니다.

Oh My Opencode 는 OpenCode 를 **멀리 에이전트 코딩 하네스 (multi-agent coding harness)**로 변신시킵니다. 오케스트레이터가 작업을 병렬로 실행하는 전문 에이전트에게 위임합니다.

OpenCode 가 Ollama 로 로컬 호스팅된 여러 LLM 과 함께 작동하는 방식을 테스트해 보았고, 비교를 위해 OpenCode Zen 에서 제공하는 무료 모델 몇 가지를 추가했습니다.

OpenCode 의 가장 큰 능력 향상은 전담 에이전트 (specialised agents) 에서 비롯됩니다: 오케스트레이션, 계획, 실행, 연구의 의도적인 분리입니다.

OpenHands 는 AI 기반 소프트웨어 개발 에이전트를 위한 오픈소스, 모델 불특정 플랫폼입니다. 이 플랫폼은 에이전트가 단순한 자동 완성 도구가 아닌, 실제 코딩 파트너처럼 행동할 수 있도록 합니다.

LocalAI 빠른 시작: OpenAI 호환 대형 언어 모델을 로컬에서 실행하기

LocalAI 는 자신의 하드웨어 (노트북, 워크스테이션, 온프레미스 서버) 에서 AI 워크로드를 실행하기 위해 설계된 자체 호스팅, 로컬 우선 추론 서버로, OpenAI API 와의 호환성을 제공하여 기존 도구를 그대로 사용할 수 있도록 합니다.

저는 로컬 추론을 위해 llama.cpp를 계속 사용합니다. 이는 Ollama 및 기타 도구가 추상화하는 것을 직접 제어할 수 있게 해주며, 작동이 매우 간단합니다. llama-cli를 사용하여 GGUF 모델을 간단하게 실행하거나 llama-server를 통해 OpenAI-compatible HTTP API를 노출시킬 수 있습니다.

OpenCode 빠른 시작: 터미널 AI 코딩 에이전트 설치, 구성 및 사용

OpenCode 는 터미널 (TUI + CLI) 에서 실행할 수 있으며, 선택적으로 데스크톱과 IDE 인터페이스를 지원하는 오픈 소스 AI 코딩 에이전트입니다. 이것이 바로 OpenCode 빠른 시작: 설치, 검증, 모델/공급자 연결, 그리고 실제 워크플로우 (CLI + API) 실행입니다.

개발자 및 DevOps를 위한 Airtable - 계획, API, Webhooks 및 Go/Python 예제

Airtable는 주로 협업하는 “데이터베이스처럼” 된 스프레드시트 UI를 기반으로 한 저코드 애플리케이션 플랫폼으로 생각하는 것이 가장 좋습니다. 비개발자들이 친근한 인터페이스를 필요로 하지만, 개발자들도 자동화와 통합을 위한 API 표면이 필요할 때 매우 빠르게 운영 도구를 생성하는 데 적합합니다(내부 트래커, 가벼운 CRM, 콘텐츠 파이프라인, AI 평가 대기열 등).

생산 환경에서 LLM 추론 모니터링(2026): vLLM, TGI, llama.cpp용 Prometheus 및 Grafana

LLM 추론은 “단순한 API처럼” 보일 수 있지만, 지연 시간이 급격히 증가하고 대기열이 다시 쌓이기 시작하며, GPU가 95% 메모리 사용률에 도달하면서도 명확한 설명이 없을 때 문제가 발생합니다.

OpenClaw 빠른 시작: Docker로 설치 (Ollama GPU 또는 Claude CPU)

OpenClaw은 로컬 LLM 런타임(예: Ollama) 또는 클라우드 기반 모델(예: Claude Sonnet)과 함께 실행되는 자체 호스팅 AI 어시스턴트입니다.

가라지 vs MinIO vs AWS S3: 오브젝트 스토리지 비교 및 기능 매트릭스

AWS S3는 객체 저장소의 “기본” 기준으로 남아 있습니다: 완전히 관리되며, 강한 일관성을 가지며, 극히 높은 내구성과 가용성을 위해 설계되었습니다.
Garage와 MinIO는 자가 호스팅, S3 호환 대체 옵션: Garage는 가볍고, 지리적으로 분산된 소규모에서 중규모 클러스터를 위한 설계가 되었으며, MinIO는 S3 API 기능 범위를 광범위하게 지원하고, 대규모 배포에서의 고성능을 강조합니다.

Go에서 Temporal을 사용하여 워크플로우 애플리케이션을 구현하는 완전한 가이드

Temporal은 개발자가 익숙한 프로그래밍 언어인 Go를 사용하여 내구성 있고 확장성이 높고 오류에 강한 워크플로우 애플리케이션을 구축할 수 있도록 하는 오픈소스, 기업용 등급의 워크플로우 엔진입니다.

Garage은 소규모에서 중간 규모 배포에 적합한 오픈소스, 자체 호스팅, S3 호환 오브젝트 스토리지 시스템으로, 강력한 내구성과 지리 분산에 중점을 두고 설계되었습니다.

LLM 시스템을 위한 관찰 가능성: 메트릭, 트레이스, 로그 및 프로덕션에서의 테스트

LLM 시스템은 전통적인 API 모니터링으로는 감지할 수 없는 방식으로 실패할 수 있습니다. 큐는 조용히 채워지고, GPU 메모리가 CPU가 바쁜 상태가 되기 훨씬 전에 포화 상태가 되며, 지연은 애플리케이션 계층이 아닌 배치 계층에서 급증합니다. 이 가이드는 LLM 추론 및 LLM 애플리케이션에 대한 종단간 관찰 전략 을 다룹니다:
측정해야 할 항목, Prometheus, OpenTelemetry, Grafana로 어떻게 기기를 설정할지, 그리고 텔레메트리 파이프라인을 대규모로 어떻게 배포할지에 대해 설명합니다.

Apache Kafka 빠른 시작 - CLI 및 로컬 예제를 사용하여 Kafka 4.2 설치하기

오픈코드 리뷰: 솔직한 결과, 청구 리스크, 그리고 투자할 가치가 있는 경우

오픈코드(OpeCode) 퀵스타트: 설치, 설정 및 실행 가이드

로컬 테스트를 거친 오픈코드용 최고의 LLM

오 마이 오픈코드: 전문 에이전트 심층 분석 및 모델 가이드

OpenHands 코딩 비서 빠른 시작: 설치, CLI 플래그, 예시

LocalAI 빠른 시작: OpenAI 호환 대형 언어 모델을 로컬에서 실행하기

llama.cpp CLI 및 서버로 빠르게 시작하기

OpenCode 빠른 시작: 터미널 AI 코딩 에이전트 설치, 구성 및 사용

개발자 및 DevOps를 위한 Airtable - 계획, API, Webhooks 및 Go/Python 예제

생산 환경에서 LLM 추론 모니터링(2026): vLLM, TGI, llama.cpp용 Prometheus 및 Grafana

OpenClaw 빠른 시작: Docker로 설치 (Ollama GPU 또는 Claude CPU)

가라지 vs MinIO vs AWS S3: 오브젝트 스토리지 비교 및 기능 매트릭스

Go에서 Temporal을 사용하여 워크플로우 애플리케이션을 구현하는 완전한 가이드

가이드 - S3 호환 오브젝트 스토리지 빠른 시작

LLM 시스템을 위한 관찰 가능성: 메트릭, 트레이스, 로그 및 프로덕션에서의 테스트