AI - Page 5 - Rost Glukhov | 개인 사이트 및 기술 블로그

Ollama 와 Qwen3 Reranker 모델을 사용한 Go 언어 기반 문서 리랭킹

표준 Ollama 에는 직접적인 rerank API 가 없으므로, 쿼리 - 문서 쌍에 대한 임베딩을 생성하고 점수를 매기는 방식으로 GO 에서 Qwen3 Reranker 를 사용한 재순위 지정 을 구현해야 합니다.

한 여름의 추운 날, 호주에서는 여름이 아니라 겨울이죠…
AI 모델을 훈련하여 비캡된 콘크리트 강화 철근을 감지하는 것이 급한 필요성을 느꼈습니다…

이 테스트에서는 Ollama에 호스팅된 다양한 LLM이 Hugo 페이지를 영어에서 독일어로 번역하는 방식을 비교하고 있습니다. 다른 LLM이 호스팅된 Ollama에서 Hugo 페이지를 영어에서 독일어로 번역하는 방식 비교.

Ollama 와 Qwen3 임베딩 LLM 을 활용한 텍스트 재랭킹 - Go 로 구현

이 작은 Go 코드 예시는 쿼리와 각 후보 문서에 대해 임베딩을 생성하기 위해 Ollama 를 호출합니다 그리고 코사인 유사도 기준으로 내림차순으로 정렬합니다.

PCIe 랜의 수가 LLM 성능에 미치는 영향? 작업에 따라 다릅니다. 훈련 및 멀티 GPU 추론의 경우 성능 저하가 상당합니다.

LLM과 Ollama를 사용하여 HTML 콘텐츠를 Markdown으로 변환하세요.

Ollama 모델 라이브러리에는 HTML 콘텐츠를 Markdown으로 변환할 수 있는 모델이 포함되어 있습니다. 이는 콘텐츠 변환 작업에 유용합니다. 이 가이드는 우리의 2026년 문서화 도구: Markdown, LaTeX, PDF 및 인쇄 워크플로우 허브의 일부입니다.

Search(검색) 는 키워드를 사용하여 빠르고 직관적인 정보 검색에 가장 적합합니다.
Deep Search 는 맥락과 의도를 이해하는 데 뛰어내어 복잡한 쿼리에 대해 더 관련성 높고 포괄적인 결과를 제공합니다.

여기 몇 가지 AI 지원 코딩 도구와 AI 코딩 어시스턴트 및 그들의 장점을 나열할 것입니다.

LLM을 사용하는 것은 매우 비용이 많이 들지 않으며, 새로운 고성능 GPU를 구매할 필요가 있을 수도 있습니다.
클라우드에서 제공하는 LLM 제공업체 목록을 확인해보세요. 이 목록에는 제공업체가 호스팅하는 LLM이 나와 있습니다.

테스트: 인텔 CPU 성능과 효율적인 코어를 어떻게 Ollama가 사용하는가

제가 테스트하고 싶은 이론은, 인텔 CPU에서 모든 코어를 사용하면 LLM의 속도가 빨라질까?입니다.
새로운 gemma3 27비트 모델(gemma3:27b, ollama에서 17GB)이 제 GPU의 16GB VRAM에 맞지 않아, 부분적으로 CPU에서 실행되고 있다는 점이 제게 짜증을 주고 있습니다.

현대 세계의 혼란 속에서 저는 다른 카드의 기술 사양 비교를 진행하고 있습니다. 이는 AI 작업에 적합한 카드들입니다.
(딥러닝,
객체 감지,
LLMs).
하지만 이 모든 카드는 매우 비싸죠.

Ollama 서버가 동일한 시간에 두 개의 요청을 받을 경우, 그 동작은 구성 설정과 사용 가능한 시스템 자원에 따라 달라집니다.

바이브 코딩은 개발자가 자연어로 원하는 기능을 설명하고, AI 도구가 이를 자동으로 코드로 생성하는 AI 기반의 프로그래밍 접근 방식입니다.

저는 MMDetection (mmengine, mdet, mmcv)를 꽤 많이 사용해왔고,
이제는 그게 게임에서 벗어났다는 것 같네요.
유감스럽습니다. 저는 그 모델 저장소를 좋아했습니다.

DeepSeek’s 첫 세대 추론 모델로, OpenAI-o1과 유사한 성능을 보입니다. 이 모델은 Llama와 Qwen을 기반으로 한 DeepSeek-R1에서 추출한 6개의 밀집 모델입니다.

이 Ollama CLI 빠른 참고서는 매일 사용하는 명령어(ollama ls, ollama serve, ollama run, ollama ps, 모델 관리, 일반적인 워크플로우)와 예제를 포함하고 있습니다. 복사/붙여넣기할 수 있는 예제가 포함되어 있습니다.

AI

Ollama 와 Qwen3 Reranker 모델을 사용한 Go 언어 기반 문서 리랭킹

텐서플로우를 사용한 객체 감지

Hugo 페이지 번역 품질 비교 - Ollama 상의 LLMs

Ollama 와 Qwen3 임베딩 LLM 을 활용한 텍스트 재랭킹 - Go 로 구현

LLM 성능과 PCIe 라인: 주요 고려사항

LLM과 Ollama를 사용하여 HTML 콘텐츠를 Markdown으로 변환하세요.

검색 vs 딥서치 vs 딥 리서치

AI 코딩 어시스턴트 비교

클라우드 LLM 제공업체

테스트: 인텔 CPU 성능과 효율적인 코어를 어떻게 Ollama가 사용하는가

NVIDIA GPU의 AI 적합성 비교

Ollama가 병렬 요청을 처리하는 방식

비브 코딩 - 의미와 설명

MMdetection은 더 이상 지원되지 않습니다.

Ollama에서 Deepseek-R1 테스트

Ollama CLI 빠른 참고서: ls, serve, run, ps + 명령어 (2026년 업데이트)