غبطة البطريرك يونان يحتفل بقداس الأحد الجديد ويرفع الصلاة راحةً لنفس المثلَّث الرحمات قداسة البابا فرنسيس      سيادة المطران بشار وردة: حضور نيجيرفان بارزاني في وداع البابا فخر لكوردستان والعراق      أمسية تاريخية في المركز الاكاديمي الاجتماعي في عنكاوا      البطلة إيلاريا يوسف غسان تحصد المركز الأول في القفز والحركات الأرضية للمرة الثانية تواليًا      رئيس اقليم كوردستان نيجيرفان بارزاني يشارك في تشييع البابا فرنسيس إلى مثواه الأخير      مراسم جنازة البابا فرنسيس      غبطة البطريرك يونان يصلّي ويلقي نظرة الوداع على جثمان المثلَّث الرحمات قداسة البابا فرنسيس المسجَّى في بازيليك القديس بطرس في الفاتيكان      صور.. القداس الإلهي بمناسبة تذكار القديس مار بينا / ارموطا      صور.. تذكار مار كوركيس في قرية تن بحضور سيادة المطران مار أزاد شابا      صلاة لراحة نفس البابا فرنسيس في عنكاوا كاتدرائية ماريوسف الكلدانية      لا تجربوا الأدوية على أطفالكم!.. أدوية للبالغين تشكل خطورة كبيرة على الأطفال      شباب برشلونة وسيداته فازوا بالثلاثية والرجال يقتربون      في السابع من أيار مايو بداية الكونكلاف      اجتماع "جيد" للحزب الديمقراطي والاتحاد الوطني دون حسم للمناصب      إطلاق مشروع المدارس الرقمية في اقليم كوردستان      استفحال ظاهرة تسول الأطفال يدفع الحكومة العراقية للتحرك      هواوي تختبر معالجاً قوياً قد ينافس منتجات إنفيديا      بدء عودة الكهرباء بعد انقطاع ضخم في إسبانيا والبرتغال      فانس يحذر: استمرار نزاع أوكرانيا قد يتحول لحرب نووية      في السابع من أيار مايو بداية الكونكلاف
| مشاهدات : 693 | مشاركات: 0 | 2025-04-08 09:31:18 |

DeepSeek تكشف عن تقنية "ثورية" لتشغيل نموذجها القادم R3 للاستدلال

شعار منصة DeepSeek تظهر على شاشة هاتف ذكي. 29 يناير 2025 - Bloomberg - Bloomberg

عشتارتيفي كوم- الشرق/

 

أعلنت شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي عن اعتماد نهج مبتكر يهدف إلى تحسين قدرات الاستدلال لدى النماذج اللغوية الكبيرة (LLMs)، وذلك في وقت يتزايد فيه الترقب لإصدار الجيل التالي من نماذج الشركة.

وكشفت الشركة بالتعاون مع باحثين من جامعة تسينغهوا الصينية، عن تقنية جديدة تعتمد على منهجيتين مبتكرتين أطلقت عليهما "نمذجة المكافآت التوليدية" (Generative Reward Modelling - GRM)، و"ضبط التقييم الذاتي المرتكز إلى المبادئ الذاتية" (Self-principled Critique Tuning)، بحسب ما جاء في ورقة بحثية نُشرت الجمعة، على منصة arXiv المتخصصة في الأبحاث العلمية.

وتهدف هذه المنهجية المزدوجة إلى تمكين النماذج اللغوية الكبيرة (LLMs)، من تقديم نتائج أكثر دقة وبوتيرة أسرع عند التعامل مع الأسئلة العامة.

 

أسلوب المكافآت

تعد نمذجة المكافآت التوليدية (Generative Reward Modeling - GRM)، طريقة لتعليم نموذج الذكاء الاصطناعي كيف يُفضّل البشر أن تكون الإجابات.

وبدلاً من أن يُقيّم الإنسان كل إجابة يعطيها النموذج، تُستخدم GRM لتدريب نموذج آخر يمكنه القيام بهذه المهمة بشكل تلقائي. هذا النموذج "الذكي" يتعلم كيف يقيّم الإجابات، ويمنحها "مكافآت" وفقاً لمدى جودتها وقربها من التفضيلات البشرية.

وتشبه الفكرة لعبة يحصل فيها الذكاء الاصطناعي على نقاط عندما يُعطي إجابات جيدة، ويفقد نقاطاً عندما يُخطئ.

وبمرور الوقت، يتعلم النموذج كيف يجيب بشكل أفضل لينال أعلى قدر ممكن من المكافآت، ما يؤدي إلى تحسين قدراته الاستدلالية وتقديمه لإجابات أكثر دقة ومواءمة لما يتوقعه المستخدم.

وأكد الباحثون أن نماذج DeepSeek-GRM الجديدة تفوقت على الطرق المعتمدة حالياً، بعدما "حققت أداءً تنافسياً" مقارنة بنماذج المكافآت العامة ذات الأداء القوي.

 

جيل جديد

وأوضح الفريق أن تقنية "نمذجة المكافآت Award Modelling" تُعد من الأساليب المستخدمة لتوجيه النماذج اللغوية نحو تفضيلات البشر، وهي بذلك تُسهم في تعزيز جودة الاستجابات. كما أشار الباحثون إلى أن الشركة تخطط لإتاحة نماذج GRM مفتوحة المصدر، لكنها لم تحدد موعداً زمنياً لذلك حتى الآن.

وجاءت هذه الورقة البحثية في ظل تزايد التكهنات بشأن الخطوة التالية لشركة DeepSeek، خاصة بعد أن نالت اهتماماً عالمياً واسعاً بفضل نموذجها الأساسي V3 ونموذج الاستدلال R1.

وكانت وكالة "رويترز" قد ذكرت في تقرير لها الشهر الماضي، أن الإصدار القادم، DeepSeek-R2، قد يُطرح في الأسواق خلال وقت مبكر من شهر أبريل الجاري، في إطار سعي الشركة للاستفادة من شعبيتها المتصاعدة.

وسرعان ما أثار التقرير حالة من الترقب في الأوساط التقنية العالمية، خاصة بعد أن أحدث نموذج DeepSeek-R1 ضجة واسعة لما قدّمه من أداء فعّال بتكلفة منخفضة، وهو ما جعله منافساً بارزاً لأقوى النماذج الموجودة حالياً.

لكن الشركة حافظت على صمتها إزاء التقارير التي تحدثت عن قرب إصدار R2، ولم تُصدر أي تعليق عبر قنواتها الرسمية.

وفي المقابل، أفادت وسائل إعلام صينية بأن حساب خدمة العملاء التابع لـ DeepSeek، نفى صحة هذه المعلومات ضمن مجموعة محادثة خاصة مع عملاء تجاريين.

وكانت الشركة قد أجرت في مارس الماضي، تحديثاً رئيسياً على نموذج V3 الخاص بها، إذ أطلقت الإصدار "DeepSeek-V3-0324"، والذي قالت إنه يقدّم "قدرات استدلال مُعزّزة، وتحسينات في تطوير الواجهات الأمامية لمواقع الإنترنت، فضلاً عن تعزيز كفاءة الكتابة باللغة الصينية".

وفي فبراير الماضي، فتحت الشركة 5 من مستودعاتها البرمجية لتكون مفتوحة المصدر، ما أتاح للمطورين حول العالم مراجعة الشيفرات البرمجية والمساهمة في تطويرها، مؤكدة في بيانها التزامها بـ"تحقيق تقدم حقيقي بشفافية كاملة".

 










أربيل - عنكاوا

  • رقم الموقع: 07517864154
  • رقم إدارة القناة: 07504155979
  • البريد الألكتروني للإدارة:
    [email protected]
  • البريد الألكتروني الخاص بالموقع:
    [email protected]
جميع الحقوق محفوظة لقناة عشتار الفضائية © 2007 - 2025
Developed by: Bilind Hirori
تم إنشاء هذه الصفحة في 0.5901 ثانية