وقتی دادههای اسپارس (sparse data) را در نظر میگیریم، الگوریتمهای تحلیلی باید مقدار زیادی جمع و ضرب با صفر را انجام دهند. برای تصور چنین وضعیتی، مثالی میزنیم از جدول بزرگ مشتریان آمازون در برابر تمام محصولات این شرکت - برای هر محصول خریداری شده توسط یک مشتری عدد 1 و برای زمانی که هیچ خریدی انجام نمیشود عدد 0، اختصاص داده میشود. برای جلوگیری از دردسر مواجه شدن با صفرها، برنامهنویسان کد اختصاصی مینویسند که بسیار پیچیده است و در مسائل معدودی قابل اجراست.
تیم محققان MIT برای رسیدگی به این موضوع، با همکاری Adobe Research و French Alternative Energies و Atomic Energy Commission یک سیستم جدید به نام Tensor Algebra Compiler (Taco) ایجاد کردند. در علم کامپیوتر، اصطلاح Tensor برای ماتریس با ابعاد بالاتر استفاده میشود. کد Taco جدید افزایش سرعت 100 برابری را در مقایسه با پکیجهای نرمافزاری غیربهینهسازی شده موجود عرضه میکند. برای کنترل دادههای تنک، عملکرد سیستم با کد بهینهسازی شده دستی رقابت میکند. این یعنی یک برنامهنویس باید کار کمتری در پایان انجام دهد.
به گفته سامان اماراسینگه- استاد مهندسی برق و علوم کامپیوتر MIT – این تیم با حذف نیاز به عملیات ماتریس خلوت (sparse matrix) اختصاصی، به ما "امکان میدهند تا برای هر عبارت تانسور-جبری در زمانی که ماتریسها خلوت هستند، کد بسازیم."
با وجود Taco، یک برنامه نویس باید اندازه تانسور و محل فایلی که باید از آن مقادیر را وارد کند، مشخص نماید. سپس یک نقشه سلسله مراتبی ایجاد میکند که جفتهای صفر را حذف کرده و محاسبات را به هم وصل میکند.
بعلاوه، Taco از یک طرح شاخصگذاری بهتر استفاده میکند تا فقط مقدار غیرصفر تانسورهای خلوت را ذخیره نماید. یک تانسور عمومی منتشر شده توسط آمازون که با صفر، حدود 107 اگزابایت دادهها جا اشغال میکند، بدون صفرها فقط 13 گیگابایت جا میگیرد.
ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را میتوانید از کتابخانههای عمومی سراسر کشور و نیز از دکههای روزنامهفروشی تهیه نمائید.
ثبت اشتراک نسخه کاغذی ماهنامه شبکه
ثبت اشتراک نسخه آنلاین
کتاب الکترونیک +Network راهنمای شبکهها
- برای دانلود تنها کتاب کامل ترجمه فارسی +Network اینجا کلیک کنید.
کتاب الکترونیک دوره مقدماتی آموزش پایتون
- اگر قصد یادگیری برنامهنویسی را دارید ولی هیچ پیشزمینهای ندارید اینجا کلیک کنید.
نظر شما چیست؟