نماذج Qwen3 Embedding & Reranker على Ollama: أداء متميز المستوى العالمي
LLMs رائعة جديدة متاحة في Ollama
النماذج Qwen3 Embedding و Reranker هي أحدث الإصدارات في عائلة Qwen، وتم تصميمها خصيصًا للمهام المتقدمة في تضمين النصوص، والبحث، والترتيب مرة أخرى.
سرور للعين
تُعد النماذج Qwen3 Embedding و Reranker تقدمًا كبيرًا في معالجة اللغة الطبيعية متعددة اللغات (NLP)، وتقدم أداءً متميزًا في مهام تضمين النصوص والترتيب مرة أخرى. هذه النماذج، التي تُنتمي إلى سلسلة Qwen المطورة من قبل علي بابا، تم تصميمها لدعم مجموعة واسعة من التطبيقات، من استرجاع المعاني إلى بحث الكود. بينما Ollama هو منصة شائعة ومفتوحة المصدر لاستضافة ونشر نماذج لغة كبيرة (LLMs)، إلا أن دمج نماذج Qwen3 مع Ollama لا يتم تفاصيله بشكل صريح في الوثائق الرسمية. ومع ذلك، يمكن الوصول إلى هذه النماذج عبر Hugging Face و GitHub و ModelScope، مما يتيح إمكانية نشرها محليًا من خلال Ollama أو أدوات مشابهة.
أمثلة على استخدام هذه النماذج
يرجى رؤية كود نموذجي بلغة Go باستخدام ollama مع هذه النماذج:
- ترتيب النصوص مرة أخرى باستخدام Ollama ونموذج Qwen3 Embedding - بلغة Go
- ترتيب النصوص مرة أخرى باستخدام Ollama ونموذج Qwen3 Reranker - بلغة Go
لمحة عامة عن النماذج الجديدة Qwen3 Embedding و Reranker على Ollama
هذه النماذج الآن متاحة للنشر على Ollama بمقاسات مختلفة، مما يوفر أداءً متميزًا ومرونةً لعدد واسع من التطبيقات المتعلقة باللغة والكود.
الميزات الرئيسية والقدرات
-
مقاسات النموذج والمرونة
- متاحة بمقاسات متعددة: 0.6B، 4B، و 8B من المعلمات لكل من مهام التضمين والترتيب مرة أخرى.
- النموذج 8B للتضمين يحتل المرتبة الأولى حاليًا في قائمة MTEB متعددة اللغات (بحسب 5 يونيو 2025، مع درجة 70.58).
- تدعم مجموعة واسعة من خيارات التكميم (Q4، Q5، Q8، إلخ) لموازنة الأداء واستخدام الذاكرة والسرعة. يُنصح بـ Q5_K_M لمعظم المستخدمين لأنه يحافظ على أغلب أداء النموذج بينما يكون فعالًا من حيث الموارد.
-
البنية والتدريب
- تم بناؤها على أساس Qwen3، وتستخدم كلاً من المعمارية المزدوجة (للتضمين) والمعمارية المتقاطعة (للترتيب مرة أخرى).
- نموذج التضمين: يعالج قطع النص الفردية، ويستخرج تمثيلات معنوية من الحالة المخفية النهائية.
- نموذج الترتيب مرة أخرى: يأخذ زوجي النصوص (مثل الاستعلام والمستند) ويُخرج درجة الصلة باستخدام منهجية المعمارية المتقاطعة.
- تستخدم نماذج التضمين نموذجًا تدريبيًا ثلاثي المراحل: التدريب التبايني المسبق، التدريب المراقب مع بيانات عالية الجودة، والدمج النموذجي لضمان التعميم الأمثل والتكيف.
- تُدرب نماذج الترتيب مرة أخرى مباشرةً مع بيانات مُصنفة عالية الجودة لضمان الكفاءة والفعالية.
-
الدعم متعدد اللغات والمهام
- تدعم أكثر من 100 لغة، بما في ذلك لغات البرمجة، مما يوفر قدرات قوية في الاسترجاع متعدد اللغات، والاسترجاع عبر اللغات، والاسترجاع الكودي.
- تسمح نماذج التضمين بتعريفات متجانسة لل벡تورات وتعليمات مستخدمية مخصصة لتكييف الأداء مع المهام أو اللغات المحددة.
-
الأداء والتطبيقات
- نتائج متميزة في استرجاع النصوص، واسترجاع الكود، والتصنيف، والتوسيع، والاستخراج الثنائي.
- تتفوق نماذج الترتيب مرة أخرى في سيناريوهات استرجاع النصوص المختلفة ويمكن دمجها بسلاسة مع نماذج التضمين لخطوط إنتاجية استرجاعية من طرف إلى طرف.
كيفية استخدامها على Ollama
يمكنك تشغيل هذه النماذج على Ollama باستخدام الأوامر التالية:
ollama run dengcao/Qwen3-Embedding-8B:Q5_K_M
ollama run dengcao/Qwen3-Reranker-0.6B:F16
اختر إصدار التكميم الذي يناسب أفضل متطلباتك من حيث الأجهزة والأداء.
جدول ملخص
نوع النموذج | المقاسات المتاحة | المزايا الرئيسية | الدعم متعدد اللغات | خيارات التكميم |
---|---|---|---|---|
التضمين | 0.6B، 4B، 8B | أعلى درجات MTEB، مرنة، فعالة، متميزة | نعم (100+ لغة) | Q4، Q5، Q6، Q8، إلخ |
الترتيب مرة أخرى | 0.6B، 4B، 8B | تتفوق في تقييم الصلة بين زوجي النصوص، فعالة، مرنة | نعم | F16، Q4، Q5، إلخ |
أخبار ممتعة!
تُعد نماذج Qwen3 Embedding و Reranker على Ollama خطوة كبيرة في قدرات استرجاع النصوص والكود متعددة اللغات والمهام. مع خيارات نشر مرنة وأداء قوي في المعايير، فهي مناسبة جدًا للبيئات البحثية والتجارية.
حديقة النماذج - سرور للعين الآن
Qwen3 Embedding
https://ollama.com/dengcao/Qwen3-Embedding-8B
https://ollama.com/dengcao/Qwen3-Embedding-4B/tags
https://ollama.com/dengcao/Qwen3-Embedding-0.6B/tags
Qwen3 Reranker
https://ollama.com/dengcao/Qwen3-Reranker-8B
dengcao/Qwen3-Reranker-8B:Q3_K_M
dengcao/Qwen3-Reranker-8B:Q5_K_M
https://ollama.com/dengcao/Qwen3-Reranker-4B/tags
dengcao/Qwen3-Reranker-4B:Q5_K_M
https://ollama.com/dengcao/Qwen3-Reranker-0.6B/tags
رائع!
روابط مفيدة
- ترتيب النصوص مرة أخرى باستخدام Ollama ونموذج Qwen3 Embedding - بلغة Go
- ترتيب النصوص مرة أخرى باستخدام Ollama ونموذج Qwen3 Reranker - بلغة Go
- دليل Ollama
- نقل نماذج Ollama إلى محرك أو مجلد مختلف
- استضافة Perplexica ذاتيًا - مع Ollama
- اختبار: كيف يستخدم Ollama أداء وحدات المعالجة المركزية من إنتل ووحدات المعالجة الفعالة
- مقارنة سرعة نماذج اللغة الكبيرة
- مقارنة قدرات تلخيص نماذج اللغة الكبيرة
- مزوّجو نماذج اللغة الكبيرة في السحابة
- كيف يتعامل Ollama مع الطلبات المتزامنة
- مقارنة جودة ترجمة صفحات Hugo - نماذج لغة كبيرة على Ollama