تشغيل LLM AI محلي على جهاز كمبيوتر صغير بدون وحدة معالجة الرسومات NVIDIA

تشغيل LLM AI محلي على جهاز كمبيوتر صغير بدون وحدة معالجة الرسومات NVIDIA
محرر الخبر سمر منصور
حجم الخط

الذكاء الاصطناعي المحلي، أصبح اليوم خياراً عملياً لمن يريد تشغيل نماذج الذكاء الاصطناعي داخل بيئته الخاصة من دون الاعتماد الكامل على الخدمات السحابية، ومع ارتفاع تكلفة العتاد وازدحام السوق بالمواصفات المتقدمة، يبرز سؤال مهم حول إمكانية بناء تجربة مفيدة ومستمرة على جهاز محدود الطاقة والإمكانات.

لماذا يتجه كثيرون إلى الذكاء الاصطناعي المحلي؟

يشهد العالم توسعاً سريعاً في أدوات الذكاء الاصطناعي التجارية، من ChatGPT إلى Gemini وClaude وGrok، إضافة إلى محاولات دمج المساعدات الذكية في أنظمة التشغيل والتطبيقات اليومية، لكن هذا الانتشار الواسع لا يلغي الحاجة إلى تشغيل النماذج محلياً، حيث تبقى البيانات داخل الجهاز، وتظل السيطرة كاملة للمستخدم أو الجهة المالكة للنظام.

هذا التوجه لا يرتبط فقط بالخصوصية، بل أيضاً بالاعتماد العملي، فهناك حالات كثيرة تحتاج فيها الأنظمة المنزلية أو المختبرية أو الصغيرة إلى أداة ذكية تعمل دون اتصال دائم، وتستجيب بسرعة مقبولة، وتؤدي مهام محددة من دون رسوم اشتراك متكررة أو قيود خارجية على الاستخدام.

هل يمكن تشغيله من دون إنفاق مبالغ كبيرة؟

في هذا المشروع، لم تكن الفكرة بناء منصة باهظة الثمن، بل اختبار مدى إمكانية تشغيل LLM محلي باستخدام جهاز صغير نسبياً، بعد الاستفادة من NUC قديم نسبياً تم الحصول عليه أواخر العام الماضي، ثم إعادة توظيفه ليخدم هدفاً جديداً يتناسب مع موجة الذكاء الاصطناعي الحالية.

المشكلة الأساسية في هذا النوع من التجارب أن السوق يشهد ضغطاً كبيراً على الذاكرة العشوائية ووحدات التخزين، وهذا الضغط يجعل الأسعار أقل استقراراً، لذلك جاء التركيز على حلول متينة وموثوقة يمكن الاعتماد عليها في العمل المستمر، من دون الذهاب إلى فئة الأجهزة المخصصة للذكاء الاصطناعي أو وحدات الرسوميات المكلفة.

مكونات المنصة المستخدمة

اعتمدت التجربة على جهاز ASUS ExpertCenter PN53، وهو جهاز صغير الحجم لكنه يحمل مواصفات تسمح له بالدخول في هذا النوع من الاستخدامات، خصوصاً مع ضبط التوازن بين الأداء واستهلاك الطاقة، إذ إن الهدف لم يكن الوصول إلى أعلى سرعة ممكنة، بل إلى منصة مستقرة وقابلة للتشغيل المستمر.

وقد جرى تعزيز الجهاز بقطع من Kingston، وهي Kingston KC3000 M2 PCIe 4.0 NVMe SSD، وذاكرة FURY Impact KF556S40IB بسعة 32 جيجابايت في وحدة واحدة، مع وجود قابلية للوصول إلى 64 جيجابايت لاحقاً إذا أثبتت التجربة جدواها، وهو خيار عملي يتيح مرونة أكبر في إدارة الأحمال.

المواصفات الأساسية للجهاز

  • الموديل: اسوس اكسبيرت سنتر PN53.
  • المعالج: AMD Ryzen 7 7735HS، بثماني أنوية و16 خيطاً.
  • البنية: Zen 3+، تحديث رامبرانت.
  • السرعة الأساسية: 3.2 جيجا هرتز، مع تعزيز يصل إلى 4.75 جيجا هرتز.
  • استهلاك الطاقة: 35 وات TDP افتراضي، قابل للتكوين حتى 54 وات.
  • الرسومات المدمجة: AMD Radeon 680M، ببنية RDNA 2.

الذاكرة والتخزين

  • ذاكرة الوصول العشوائي: 32 جيجابايت كينجستون KF556S40IB.
  • التخزين: كينغستون KC3000 M2 PCIe 4.0 NVMe SSD.

الاتصال والمنافذ

  • الاتصال اللاسلكي: Wi-Fi 6E وBluetooth 5.2.
  • الشبكة السلكية: 2.5 جيجابت RJ45 مدمجة.
  • المنافذ الأمامية: منفذ USB4 Type-C واحد، ومنفذا USB 3.2 Gen1 Type-A، ومقبس صوت واحد.
  • المنافذ الخلفية: منفذ USB4 Type-C يدعم إدخال الطاقة، و3 منافذ USB 3.2 Gen1 Type-A، ومنفذا HDMI 2.1، ومنفذ قابل للتكوين يبدو أنه DisplayPort أو HDMI.

كيف جرى تشغيل النظام البرمجي؟

جرى تثبيت Proxmox VE على الجهاز بوصفه منصة افتراضية أساسية، ثم تم تشغيل Ubuntu داخل LXC، وهي خطوة أظهرت أن البيئة مناسبة لهذا النوع من المشاريع بفضل خفة Proxmox وسهولة إدارته، خصوصاً لمن يريد توزيع الموارد على أكثر من خدمة في الوقت نفسه.

بعد ذلك تم تثبيت Ollama، وهي الأداة التي تسمح بسحب النماذج وتشغيلها محلياً، ثم Open WebUI لتوفير واجهة رسومية مألوفة تشبه تجربة ChatGPT، بحيث لا يضطر المستخدم إلى التعامل مع سطر أوامر فقط، وهو ما جعل التجربة أكثر قابلية للاستخدام اليومي.

الخطوات التي واجهت الجزء الأصعب

كان التحدي الأكبر هو تشغيل النموذج على معالج رسومي غير معتمد على CUDA، لأن النظام يعمل عبر ROCm، وهو مختلف عن المسار الذي تدعمه بطاقات Nvidia، لذلك احتاج الضبط إلى وقت وجهد كبيرين حتى يتمكن البرنامج من استغلال AMD Radeon 680M iGPU بدل العودة إلى الاعتماد الكامل على المعالج المركزي.

وللوصول إلى هذه النتيجة، تم استخدام المتغير HSA_OVERRIDE_GFX_VERSION=10.3.0، وهو ما ساعد على التعامل مع Radeon 680M iGPU كأنه بنية مدعومة منفصلة، وقد أدى ذلك إلى تحسين طريقة التشغيل، حتى لو لم تصل السرعة إلى مستوى الأنظمة السحابية أو أجهزة الرسوميات المخصصة.

ما أبرز الملاحظات العملية أثناء التشغيل؟

أظهرت التجربة أن تشغيل الذكاء الاصطناعي المحلي على جهاز صغير ليس مستحيلاً، لكنه يفرض حدوداً واضحة، فكلما زادت متطلبات النموذج ارتفع الحمل على الجهاز، وازدادت الحرارة، وتطلب الأمر إدارة حرارية أدق، وهذا ما يجعل التبريد واستقرار الأداء جزءاً أساسياً من نجاح المنظومة.

كما أن لوحة التحكم في Home Assistant أصبحت تراقب بعض المؤشرات بشكل مباشر، ومنها سلوك Kingston KC3000 الحراري أثناء المهام الثقيلة، وهو ما يعكس طبيعة هذا المشروع الذي لا يعتمد على القوة الخام بقدر ما يعتمد على التوازن بين المكونات، والتحمل، واستهلاك الطاقة المحدود الذي لا يتجاوز 54 وات.

ما الذي أثبتته التجربة؟

النتيجة الأساسية أن تشغيل LLM محلياً أصبح ممكناً فعلاً داخل جهاز صغير من دون إنفاق آلاف الدولارات على بطاقات الرسوميات وحدها، حتى لو كان الأداء أقل بكثير من حلول السحابة، فالفكرة هنا ليست الوصول إلى أقصى سرعة، بل إثبات أن الاستخدام المحلي يمكن أن يخدم أغراضاً محددة ومفيدة.

وفي هذه المرحلة، يجري استخدام المنصة ضمن بيئة Proxmox VE التي تضم Ollama مع Open WebUI، وHome Assistant، ونظام Linux من Bunsen Labs، وTiny10، ومع استمرار الاختبارات ستتضح أكثر فائدة هذا الترتيب في أتمتة المنزل والمهام الذكية اليومية، وقدمت بوابة مصر هذا العرض كقراءة تقنية مبسطة لواحد من أكثر الاتجاهات حضوراً في الوقت الحالي.

تاريخ آخر تحديث للخبر
تابع الآن أهم الأخبار عبر Google News
متابعة
سمر منصور

سمر منصور محرر الخبر

سمر منصور - كاتبة محتوى تقني، أعمل في كتابة المقالات عن قناعة وحب، كاتبة في موقع غاية السعودية في مجال التقنية مُتخصصة ومُتمرسة في الكتابة بقسم الاتصالات والشبكات، أحاول جاهدة وبشتى الطُرق تقديم كل ما هو مفيد من مقالات تخص شبكات الهاتف المحمول، واحرص دائما علي تقديم المعلومات الصحيحة حول تلك المقالات.