داده‌کاوی کلید حل مشکلات امروز
اگر به اطراف و پیرامون خود نگاه کنید، کامپیوترها، شبکه‌ها و تجهیزات خانگی را مشاهده می‌کنید که حجم عظیمی از داده‌ها را تولید می‌کنند. بر همین اساس است که آژانس‌های دولتی و موسسات علمی منابع مالی هنگفتی را برای جمع‌آوری و ذخیره‌سازی داده‌ها اختصاص داده‌اند. با این‌حال، مقدار کمی از این داده‌ها قابل استفاده است، زیرا در بیشتر موارد، حجم داده‌هایی که باید مدیریت شوند بیش از اندازه بزرگ هستند یا ساختارهای داده‌ای بسیار پیچیده‌ای دارند که بتوان به شکل موثر آن‌‌هارا تجریه و تحلیل کرد. چرا این اتفاق می‌افتد؟

پاسخ روشن است. تلاش برای مدیریت مجموعه بزرگی از داده‌ها به عوامل مختلفی نظیر عملکرد تجهیزات ذخیره‌ساز، معماری که قرار است داده‌ها را از منابع اطلاعاتی واکشی کند و نحوه عملکرد معماری که برای تجزیه و تحلیل داده‌ها استفاده می‌شود بستگی دارد. فناوری‌های مدرن مرتبط با کامپیوترها، شبکه‌ها و حس‌گرها روند جمع‌آوری و سازمان‌دهی داده‌ها را بیش از اندازه پیچیده، طاقت‌فرسا و زمان‌گیر کر‌ده‌اند. به رغم دشواری‌ها و پیچیدگی‌های موجود، سازمان‌ها به جمع‌آوری و ضبط داده‌ها نیاز دارند، زیرا باید از اطلاعات پالایش شده‌ای که در اصطلاح تخصصی به آن بینش می‌گوییم برای اتخاذ تصمیمات راهبردی استفاده کنند. به‌طور سنتی، وظیفه استخراج اطلاعات مفید از داده‌های ضبط شده بر عهده تحلیل‌گران است، با این حال، حجم فزاینده داده‌های تولید شده در مشاغل و علوم مختلف به‌کارگیری روش‌های مبتنی بر کامپیوترهای شخصی را اجتناب‌ناپذیر کرد. با توجه به این‌که مجموعه‌های داده‌ای از نظر اندازه و پیچیدگی رشد کرده‌اند، هیچ راهی وجود ندارد جز این‌که فرآیند تجزیه‌و تحلیل داده‌ها به شکل خودکار و توسط کامپیوترها انجام شود، زیرا در دنیای امروز یک تحلیل‌گر نمی‌تواند به تنهایی حجم بسیار گسترده‌ای از بزرگ‌داده‌هایی که روزانه تولید می‌شوند را تجزیه و تحلیل کند. به‌کارگیری ابزارها و متدولوژی‌های پیچیده که همگی بر مبنای سامانه‌های کامپیوتری کار می‌کنند و تمامی آن‌ها سعی دارند با اتکا بر تکنیک‌های جدید الگوهای مستتر در داده‌ها را کشف کنند در اصطلاح تخصصی داده‌کاوی نامیده می‌شود. در دنیای تجارت از داده‌کاوی می‌توان برای شناسایی ترندهای جدید خرید، هوش تجاری، برنامه‌ریزی راهبردی سرمایه‌گذاری و شناسایی هزینه‌های غیر ضروری در بخش حسابداری استفاده کرد. رویکرد فوق می‌تواند کمپین‌های بازاریابی را بهبود بخشد و از نتایج به‌دست آمده برای پشتیبانی مطلوب‌تر از مشتریان استفاده کند. علاوه بر این، تکنیک‌های داده‌کاوی را می‌توان برای برطرف کردن مشکلات مهندسی مجدد فرآیندهای کسب‌و‌کار که هدف درک بهتر تعاملات و ارتباط میان شیوه‌های تجاری و راهبردهای سازمانی است، به کار گرفت. آمارها نشان می‌دهند که بسیاری از نهادهای قانونی و تحقیقاتی که ماموریت آن‌ها شناسایی فعالیت‌های متقلبانه و کشف جرم‌ است با استفاده از داده‌کاوی به موفقیت‌های بزرگی رسیده‌اند. به‌طور مثال، این روش‌ها می‌توانند به تحلیل‌گران در شناسایی الگوهای رفتاری مهم، شناسایی ارتباط میان باندهای خرابکار سازمان‌یافته، شناسایی معاملاتی که با هدف پولشویی انجام می‌شوند و گردش‌های مالی که توسط شرکت‌هایی که وجود خارجی ندارند کمک کنند.

علاوه بر این، تکنیک‌های داده‌کاوی این ظرفیت را دارند تا توسط افراد شاغل در نهادهای دولتی که دسترسی به منابع بزرگی از داده‌ها دارند به کار گرفته شود تا هرگونه فعالیت مشکوکی که مرتبط با مسائل امنیت ملی است به سرعت شناسایی شود. در حالی که سازمان‌های بزرگ علاقه افراط‌گونه‌ای نسبت به پیاده‌سازی سنتی استراتژی‌هایی دارند که به اشتباه تدوین می‌شوند؛ در نقطه مقابل داده‌کاوی این ظرفیت را تا دارد تا با ارائه عملکرد پایداری به سازمان‌ها در تدوین استراتژی‌های کارآمد کمک کند. فراموش نکنید که داده‌کاوی برای استفاده عملی در دنیای تجارت تکامل یافته و سازگار شده است.

اگر به تعاریف ارائه شده توسط نویسندگان مختلف در خصوص داده‌کاوی نگاهی داشته باشیم، مشخص می‌شود که هنوز دیدگاه جامع و مشخصی در ارتباط با تعریف داده‌کاوی یا آن‌چه به‌نام داده‌کاوی وجود دارد ارائه نشده است. آیا داده‌کاوی تلفیق محاسبات آماری با تئوری‌های یادگیری غنی است یا یک تحول بنیادین بزرگ است؟ به عقیده اینجانب، اکثر راه‌حل‌ها و تکنیک‌هایی که توسط داده‌کاوی ارائه می‌شوند، ریشه در تحلیل داده‌های کلاسیک دارند. مباحث آماری و یادگیری ماشین دو علم کاملا تاثیرگذار بر داده‌کاوی هستند. 

مباحث آماری ریشه در ریاضیات دارند و بنابراین از منطق سخت‌‌گیرانه ریاضیات پیروی می‌کنند که بر این نکته تاکید دارد که هر مفهومی قبل از آن‌که به شکل عملی آزمایش شود باید به لحاظ نظری معقول باشد. در نقطه مقابل، مبدا شکل‌گیری یادگیری ماشین در علوم کاربردی و عملی کامپیوتری است و تمایل به این مبحث دارد که قبل از آن‌که هر مفهومی به شکل رسمی به اثبات برسد باید آزمایشی شود تا میزان کارکرد آن مفهوم به‌دست آید. 

اگر جایگاه ریاضیات و قانون‌مندسازی یا به عبارت دقیق‌تر انطباق علوم با نظریه‌های اثبات شده یکی از تفاوت‌های عمده میان رویکردهای آماری و یادگیری ماشین در مبحث داده‌کاوی باشد، تفاوت دیگر آن‌ها در تأکید نسبی مدل‌ها و الگوریتم‌ها است. مباحث آماری مدرن تقریباً متاثر از مفهوم مدل هستند. این یک ساختار فرضی است یا یک تقریب ساختاری است که می‌تواند منجر به شکل‌گیری داده‌ها شود. به جای تأکید آماری روی مدل‌ها، یادگیری ماشین تمایل به تاکید بر الگوریتم‌ها دارد. البته این موضوع چندان هم عجیب نیست. واژه "یادگیری" در برگیرنده مفهومی است که اشاره به یک الگوریتم ضمنی دارد.

ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را می‌توانید از کتابخانه‌های عمومی سراسر کشور و نیز از دکه‌های روزنامه‌فروشی تهیه نمائید.

ثبت اشتراک نسخه کاغذی ماهنامه شبکه     
ثبت اشتراک نسخه آنلاین

 

کتاب الکترونیک +Network راهنمای شبکه‌ها

  • برای دانلود تنها کتاب کامل ترجمه فارسی +Network  اینجا  کلیک کنید.

کتاب الکترونیک دوره مقدماتی آموزش پایتون

  • اگر قصد یادگیری برنامه‌نویسی را دارید ولی هیچ پیش‌زمینه‌ای ندارید اینجا کلیک کنید.

ایسوس

نظر شما چیست؟