
Apache Airflow 在 MLOPS 和 ETL 中的应用 - 介绍、优势与示例
用于 ETS/MLOPS 的 Python 框架,设计精良
Apache Airflow 是一个开源平台,旨在通过 Python 代码以编程方式创建、安排和监控工作流,为传统手动或基于用户界面的工作流工具提供了一个灵活且强大的替代方案。
用于 ETS/MLOPS 的 Python 框架,设计精良
Apache Airflow 是一个开源平台,旨在通过 Python 代码以编程方式创建、安排和监控工作流,为传统手动或基于用户界面的工作流工具提供了一个灵活且强大的替代方案。
实现 RAG?这里有一些 Go 代码片段 - 2...
由于标准 Ollama 没有直接的重排序 API,
您需要通过生成查询-文档对的嵌入向量并对其进行评分来实现 使用 Qwen3 重排序器在 GO 中进行重排序。
qwen3 8b、14b 和 30b,devstral 24b,mistral small 24b
在这项测试中,我正在比较不同LLMs在Ollama上如何将Hugo页面从英语翻译成德语。
我测试的三页内容涉及不同主题,其中包含一些结构良好的markdown内容:标题、列表、表格、链接等。
实现 RAG?这里有一些用 Golang 编写的代码片段。
这个小的 Go代码示例重新排序调用Ollama生成嵌入 用于查询和每个候选文档, 然后按余弦相似度降序排序。
价格现实检验 — RTX 5080 和 RTX 5090
仅仅三个月前,我们还看不到RTX 5090在商店里出售,而现在它们已经上市了,但价格略高于MRSP。
让我们来比较一下澳大利亚最便宜的RTX 5080和RTX 5090的价格,看看情况如何。
自托管一个网络搜索引擎?简单!
YaCy 是一个 去中心化、点对点(P2P)搜索引擎,其设计目的是无需依赖集中式服务器,使用户能够创建本地或全球索引,并通过查询分布式对等节点来执行搜索。
更多内存,更低的功耗,但价格依然昂贵……
顶级自动化系统用于某些令人惊叹的工作。
Ollama 现已推出全新强大的 LLM
Qwen3 Embedding 和 Reranker 模型 是 Qwen 系列的最新发布,专为高级文本嵌入、检索和重排序任务而设计。
将所有与页面相关的内容放在一个文件夹中...
有一段时间,我一直被一个烦人的问题困扰着,那就是如何将页面的缩略图放入静态目录中。这适用于 Mainroad、Rodster 和类似的 Hugo 主题。
考虑安装第二块GPU用于大型语言模型吗?
这取决于具体任务。对于训练和多GPU推理,性能下降非常明显。
在 AWS S3 上设置好 Gitea 和 Hugo 之后...
下一步是实施一些 CI/CD 并设置 Gitea Actions for Hugo website, to push website to AWS S3 当 master 分支更新时自动推送网站到 AWS S3。
使用LLM从HTML中提取文本...
在 Ollama 模型库中,有一些模型可以 将 HTML 内容转换为 Markdown,这对内容转换任务非常有用。
游标AI对比GitHub Copilot对比Cline AI对比...
以下是一些AI辅助编码工具及其优点的列表。
随着技术的发展,这些工具已经取得了显著的进步。 vibe 编程概念
这里我列出并概述一些目前较为突出的AI编码工具。许多工具都是作为IDE扩展实现的,例如 VS Code 扩展 。
Ollama 在 Intel CPU 上的效率核心与性能核心对比
我有一个理论要测试——如果利用所有Intel CPU核心是否能提高LLMs的速度?。
困扰我的是,新的gemma3 27位模型(gemma3:27b,17GB在ollama上)无法适应我GPU的16GB显存,部分运行在CPU上。
有用的 MinIO 命令
MinIO 提供两种标准的用户界面:(1) MinIO 控制台 - 这是一个网页界面,以及
(2) MinIO 命令 - 这是一个命令行 工具 mc
。