التكامل المتطور: تقوم شركة Tether بتنشيط تقنية Powerhouse AI من Google على أجهزة المستهلك القياسية

جدول المحتويات أصدرت مجموعة أبحاث الذكاء الاصطناعي التابعة لشركة Tether نسخة إنتاجية مفتوحة المصدر من TurboQuant، وهي خوارزمية لضغط الذاكرة تم تطويرها في الأصل بواسطة Google Research. يعد الإصدار جزءًا من QVAC SDK 0.12.0 ويستهدف أجهزة الكمبيوتر المحمولة والهواتف وأجهزة الحافة والشبكات اللامركزية. فهو يسمح لنماذج الذكاء الاصطناعي المحلية بالتعامل مع جلسات أطول دون الاعتماد على البنية التحتية السحابية. يمثل هذا تحولًا عمليًا في كيفية إدارة الذكاء الاصطناعي الموجود على الجهاز للمهام كثيفة الاستهلاك للذاكرة. لطالما كانت الذاكرة عائقًا أمام تشغيل نماذج الذكاء الاصطناعي القادرة على الأجهزة الاستهلاكية. عندما يقوم مساعد الذكاء الاصطناعي بمعالجة مستند أو محادثة طويلة، فإنه يخزن هذا السياق فيما يسمى ذاكرة التخزين المؤقت KV. عند ما يقرب من 262000 رمزًا، يمكن أن تستهلك ذاكرة التخزين المؤقت KV لطراز 4B حوالي 8 جيجابايت من الذاكرة وحدها. يمكن لأربع جلسات متزامنة أن ترفع هذا الرقم إلى 32 جيجابايت قبل حساب النموذج نفسه. يعالج TurboQuant هذه المشكلة عن طريق ضغط ذاكرة التخزين المؤقت KV بما يصل إلى خمس مرات مع الحفاظ على جودة الإخراج قريبة من النموذج غير المضغوط. يمكن للمستخدم الآن أن يطلب من مساعد يعتمد على الكمبيوتر المحمول تحليل مستند قانوني مكون من مائة صفحة دون تحميله على خادم بعيد. تعمل Tether AI على ترقية QVAC SDK، وإحضار TurboQuant إلى الأجهزة اليومية، وتوفير ذاكرة بحجم مركز بيانات الذكاء الاصطناعي المحلي. تعرف على المزيد: https://t.co/mF2uwDB8rv - Tether (@tether) 1 يونيو 2026 يمكن للطلاب والمطورين والصحفيين والباحثين الاستفادة من جلسات الذكاء الاصطناعي الأطول والأكثر وعيًا بالسياق على الأجهزة التي يمتلكونها بالفعل. وفي حديثه عن الأسباب الأوسع وراء الإصدار، أشار باولو أردوينو، الرئيس التنفيذي لشركة Tether، إلى الفجوة بين البحث والبرامج العملية. وقال: "أظهر بحث جوجل أن ذاكرة الذكاء الاصطناعي يمكن ضغطها بكفاءة أكبر بكثير مما يفترضه معظم الناس". "إن عملنا يحقق هذا التقدم في برامج الإنتاج التي يمكن للمطورين والشركات الناشئة والمستخدمين البناء عليها بالفعل." يشتمل إصدار الإنتاج على خط أنابيب كامل للتكميم، ومحولات إطار العمل، ووثائق المطورين، وملفات تعريف تم ضبطها لأعباء العمل. تم تصميم هذه المكونات للبيئات الحقيقية خارج مراكز البيانات ذات الحجم الكبير، والتي تغطي الذاكرة المقيدة والأجهزة المختلطة وعمليات النشر الحساسة لزمن الوصول. يتم شحن TurboQuant كجزء من QVAC SDK 0.12.0، وهو مدمج مباشرة في Fabric، وهو مكون أساسي في حزمة QVAC. بدأ النسيج كشوكة llama.cpp ونما منذ ذلك الحين ليشمل العديد من التطورات البحثية. يوفر SDK للمطورين مجموعة موحدة من الأدوات والمكتبات ومكونات وقت التشغيل لبناء تطبيقات الذكاء الاصطناعي المحلية. بالنسبة للشركات الناشئة والمطورين المستقلين، فإن هذا يزيل الافتراض بأن منتجات الذكاء الاصطناعي الكبيرة تتطلب مجموعات GPU باهظة الثمن. يمكن للفرق الآن التصميم لنوافذ سياقية أطول وأحمال عمل ملفات أكبر ونشر مرن عبر الأجهزة الاستهلاكية وأجهزة الحافة. وهذا يفتح مسارات عملية لبناء منتجات الذكاء الاصطناعي بدون بنية سحابية فقط. لمعالجة المخاوف المتعلقة بخصوصية البيانات والاعتماد على السحابة، أوضح Ardoino ضرورة الاحتفاظ بمهام الذكاء الاصطناعي على الأجهزة المحلية. وقال: "يجب أن يكون الناس قادرين على أن يطلبوا من مساعد الذكاء الاصطناعي قراءة مستند طويل أو العمل من خلال المعلومات الخاصة دون فرض كل مهمة من خلال مركز بيانات بعيد". وبهذا المعنى، يمنح TurboQuant الذكاء الاصطناعي المحلي مساحة تشغيلية أكبر. تركز استراتيجية Tether على الذكاء الاصطناعي الذي يقترب من المستخدمين عبر الأجهزة الشخصية والشبكات اللامركزية. وترى الشركة أن كفاءة البرمجيات وقابلية النقل هي عوامل محددة في المرحلة التالية من تطوير الذكاء الاصطناعي، إلى جانب البنية التحتية الحاسوبية واسعة النطاق.