وابستگی مفرط به دادهها باعث شکلگیری مفاهیم نوظهوری همچون علم دادهها شده است. علم دادهها دانش میان رشتهای است که فرآیندها، الگوریتمها و مدلهای مختلف را به کار میگیرد تا از دل دادههای فاقد ساختار و ساختیافته اطلاعات را استخراج و پردازش کند و بینشی قابل فهم در اختیار سازمانها قرار دهد. زمانیکه درباره کاربرد علم دادهها صحبت میکنیم، مخاطب صنایع یا سازمانهای خاص نیستند، بلکه هر سازمانی میتواند با استناد به دادههای پردازش شده به شکل دقیقتری برنامههای استراتژیک خود را تدوین کند. در حوزه تجارت این دانش میتواند در تدوین خطمشیها، ارزیابی فعالیتهای تجاری رقبا، شناسایی بازارهای هدف، استمرار خط تولید یا متوقف کردن خط تولید یک محصول و موضوعات مشابه استفاده شود. در شرایطی که سازمانها به شکل فزایندهای به بزرگ دادهها وابسته هستند، مهارت در تحلیل دادهها به یکی از تخصصهای کلیدی مورد تقاضای کسبوکارها تبدیل شده است. کارشناسان پیشبینی میکنند در آینده نزدیک مشاغل مرتبط با دادهکاوی و تحلیل دادهها در صدر آگهیهای شغلی قرار میگیرند.
یکی از پارامترهای مهم مشاغل فناوریاطلاعات در آینده، تسلط بر اینترنت اشیا و مفاهیم مرتبط با این صنعت است. اینترنت اشیا تحول تاثیرگذاری بر جوامع بشری گذاشته و اجازه داده مصرفکنندگان به شکل مستقیم با تجهیزات غیر هوشمند به تعامل بپردازند. پریز هوشمندی را تصور کنید که گزارشی درباره میزان مصرف برق دستگاههای متصل به پریز ارائه میکند و هر زمان درجه حرارت دستگاه متصل به پریز افزایش پیدا کرد (بهطور اتصال آداپتور لپتاپ به پریز برق که در فصل تابستان گرم زیادی تولید میکند) برق دستگاه را قطع میکند. تجهیزاتی که پیش از این غیر هوشمند بودند، امروزه حجم زیادی از دادهها را تولید میکنند. دادههایی که برای سرورهای ابری ارسال میشوند تا کارشناسان آنها را تحلیل کنند. اگر به دنبال شغلی منحصر به فرد هستید که دستمزد خوبی داشته باشد و حتا اجازه دهد از راه دور کار خود را انجام دهید، تسلط بر تحلیل دادهها در پیشبرد این هدف کمک میکند. برای آنکه به یک تحلیلگر دادهها تبدیل شوید به یکسری مهارتهای کاربردی نیاز دارید و باید بدانید اولین گام ورود به این مسیر چیست.
تحلیلگر دادهها چه کاری انجام میدهد؟
تحلیلگر دادهها، فردی است که الگوها و تصاویر مفیدی از بزرگ دادهها ترسیم میکند. به بیان دیگر، تحلیلگر دادهها اعداد را به زبان ساده و قابل فهمی ترجمه میکند. تحلیلگران برای نمایش اطلاعات موردنظرشان به گزارش و عناصر گرافیکی دادهها را تبدیل میکنند تا ارتباط میان دادهها آشکار شود. سازمانها از این اطلاعات برای تدوین خطمشیهای تجاری یا تغییر الگوهای جاری استفاده میکنند. بهطور مثال، در ارتباط با حوزهای همچون بازاریابی، تحلیلگر داده میتواند به کشف این موضوع بپردازد که چند درصد از مشتریانی که محصول مشخصی را خریداری کردهاند، جوان و دانشجو بودهاند. در مرحله بعد میتواند برای بازاریابیهای آینده جمعیت بیشتری که قرار است مشتریان هدف باشند را پیشنهاد دهد. به عبارت سادهتر، به سازمانها پیشنهاد دهند برای جذب بیشتر جوانان و دانشجویان چه محصولات مشابهی را آماده عرضه کند. تحلیلگران دادهها میتوانند با استمرار این فرآیند روندهای دیگر در حال شکلگیری را شناسایی کنند و متوجه شوند گروههای سنی مختلف به چه محصولات یا خدماتی علاقهمند هستند. این همان بینشی است که به یک کسبوکار اجازه میدهد سرمایهگذاری ایمن انجام دهد، حتا در شرایطی که رقبا اطلاع چندانی در این زمینه ندارند. یک مثال، مشهود در این زمینه سایت forecastwatch.com است. این سایت هزاران گزارش پیشبینی هوا را گردآوری کرده و در ادامه گزارشهای بهدست آمده را با نمونههای مردمی مرتبط با شرایط جوی مقایسه میکند تا پیشبینیها را به شکل دقیقتری در اختیار مخاطبان خود قرار دهد. در حالت کلی سازمانها انتظار دارند تحلیلگر دادهها در زمینه جمعآوری و تفسیر دادهها، تحلیل نتایج، گزارش نتایج به مدیران و سایر ذینفعان، شناسایی الگوها و رویههای موجود در مجموعه دادهها و کار با تیمهای کسبوکار و مدیریتی برای پاسخگویی به نیازهای تجاری تجربه و مهارت کافی را داشته باشد.
منابع داده و نقشها
بزرگ دادهها از منابع مختلفی جمعآوری میشوند که از آن جمله میتوان به آمار فروش، کارتهای هدیه، حسابهای کاربری، بازخوردهای مشتریان، اطلاعات دریافتی از برنامههای کاربردی، تحلیل ترافیک سایت، تحقیقات میدانی بازار، مطالعات آزمایشگاهی، شبیهسازیهای مبتنی بر دادههای پیشین و موارد دیگر اشاره کرد. یکی از وظایف مهم تحلیلگران دادهها، آمادهسازی گزارشهایی است که اشاره به بینش و روندهایی دارند که برای مدیران اجرایی قابل استفاده است. تحلیلگران دادهها زمانی که دادههای موجود در منابع مختلف را جمعآوری کردند در مرحله بعد باید دادهها را به گونهای پردازش کنند که در اصطلاح رایج دادهها حرف بزنند. در این فرآیند لازم است دادههای غیرمرتبط و نادرست حذف شوند و دادهها کاملا غربالگری شوند تا همسو با اهداف سازمان شوند. تحلیلگر دادهها در گروه شغلهای جذاب و پر تقاضای آینده است، زیرا نقش تاثیرگذاری بر خطدهی استراتژیهای سازمانی دارد، با اینحال ممکن است برای همه مردم جالب نباشد. بهطور مثال، گاهی اوقات در جستوجوی جدولی هستید که درون برنامههای صفحهگسترده پنهان شده و لازم است زمان زیادی صرف پیدا کردن جدول شود. بدیهی است همه مردم به انجام چنین کاری علاقه چندانی ندارند. به همین دلیل نقش و مسئولیتهای یک فرد به عنوان تحلیلگر دادهها بسته به سازمانی که در آن استخدام میشود و جایگاهی که برای شغل او تعریف شده بستگی دارد.
تحلیلگر دادهها و متخصص علوم دادهها دو مفهوم متفاوت از هم هستند
برخی از مردم تصور میکنند تحلیلگر داده و متخصص علوم دادهها دو اصطلاح یکسان و مترادف یکدیگر است، در حالی که اینگونه نیست. درست است که مرز میان تحلیلگر دادهها و متخصص علوم دادهها خیلی به هم نزدیک است، اما در حالت کلی متخصص علوم دادهها، عمدتا با مواردی همچون یادگیری ماشین و مدلهای پیشبینیکننده وقایع در ارتباط است. این افراد از دادههای در دسترس برای پیشبینی اتفاقات آینده استفاده میکنند و بهطور کلی در زمینه ریاضیات، علوم آماری و برنامهنویسی پیشزمینه قوی دارند. بخش اعظمی از وقت این افراد در ارتباط با هوش مصنوعی و یادگیری ماشین سپری میشود. یادگیری ماشین از الگوریتمهای خاصی استفاده میکند تا به جستوجوی الگوهای مستتر در بزرگ دادهها بپردازد. این کنکاش میتواند برای شناسایی عناصر خاصی در تصاویر (شبیه به شناسایی علایم بیماریها در تصاویر) یا تصمیمگیری در ارتباط با تبلیغات باشد. متخصصان علوم دادهها عمدتا از پایتون، آر و اسکیوال برای دستیابی به دادههای مدنظر و بهکارگیری آنها استفاده میکنند. گزارش سایت Indeed.com نشان میدهد میانگین درآمد یک تحلیلگر داده در ایالات متحده 65 هزار دلار در سال است، در حالی که میانگین درآمد متخصص علوم دادهها بیش از 120 هزار دلار در سال است.
تحلیلگر دادهها به چه ابزارها و مهارتهایی نیاز دارد؟
در حالت کلی، سازمانهای بزرگ افرادی را استخدام میکنند که در رشتههای ریاضیات، علوم کامپیوتر، آمار، اقتصاد یا تجارت فارغالتحصیل باشند، البته این شرط به تدریج در حال کم رنگ شدن است و برای برخی از سازمانها تنها تخصص افراد ملاک عمل است. در رابطه با مهارتهای کاربردی اکثر سازمانها سختگیر هستند و به دنبال افرادی هستند که مسلط به مهارتهای زیر هستند:
اکسل
در نگاه اول عجیب به نظر میرسد، اما بخش اعظمی از وقت تحلیلگران دادهها صرف کار با اکسل، ساخت جداول در این برنامه و انجام محاسبات دقیق میشود. زمانیکه به عنوان کارورز یا تحلیلگر دادهها در شرکتی مشغول به کار میشوید، مشاهده خواهید کرد که تسلط بر اکسل یک مهارت اجتنابناپذیر است.
اسکیوال
زبان محاوره ساختیافته SQL سرنام Structure Query Language برای ذخیره و بازیابی اطلاعات پایگاههای داده استفاده میشود. بهطور مثال، زمانی که در نظر دارید اطلاعات کاربری را از یک وبسایت (فروشگاه آنلاین) بازیابی کنید، محاوره شما روی بانکاطلاعاتی ذخیره شده در سرور اجرا میشود. این محاوره بر مبنای ترکیب نحوی اسکیوال انجام میشود. محاورههای اسکیوال در نگاه اول کمی پیچیده به نظر میرسند، اما با صرف کمی وقت قادر به انجام کارهای قدرتمندی با اسکیوال هستید.
تجزیه و تحلیل ترافیک با Google Analytics
سرویس گوگل آنالیتیکس یکی از ابزارهای کاربردی موردنیاز متخصصان سئو و مدیران وبسایتها است. ابزاری که اجازه میدهد به دقیقترین شکل ممکن به تجزیه و تحلیل عملکرد وبسایت بپردازید. سرویس فوق اطلاعاتی در ارتباط با تعداد بازدیدکنندگان، مکانی که افراد به سایت یا برنامه شما مراجعه کردهاند، صفحاتی که بیشتر مشاهده کردهاند، نوع دستگاهی که برای ورود به وبسایت از آن استفاده کردهاند و.... ارائه میکند. ابزار فوق گزارش کامل و دقیقی درباره صفحاتی که بازدیدکنندگان به آنها مراجعه کرده یا در آن محصولی را خریداری کردهاند بهدست آورید.
پایتون
تمامی متخصصانی که شغل آنها با هوش مصنوعی، یادگیری ماشین و علم دادهها عجین شده مجبور هستند به یک یا دو زبان برنامهنویسی مسلط باشند. پایتون انتخاب اول متخصصان هوش مصنوعی، متخصصان علوم دادهها و تحلیلگران دادهها است. یادگیری پایتون کمک میکند تا دادهها را به شکل دقیقتری از منابع مختلف استخراج کنید، از دادهها به شکل کارآمدتری استفاده کنید یا دادهها را در قالب عناصر گرافیکی زیبا به مشتریان یا مدیران نشان دهید. پایتون یک زبان برنامهنویسی همه منظوره است که ترکیب نحوی سادهای داشته و کدهای آن خوانایی زیادی دارند.
آپاچی هدوپ
هدوپ مجموعهای از ابزارهای متنباز طراحی شده توسط بنیاد آپاچی است. ابزار فوق کمک میکند تا بزرگ دادههایی که به شکل توزیعی در سرورهای مختلف ذخیره شدهاند را دستکاری و ویرایش کنید. در زمان کار با بزرگ دادهها که برای ذخیرهسازی آنها به چند سرور نیاز است، هدوپ ابزار کاملا کاربردی و قدرتمندی است. هدوپ با استفاده از مدل نرمافزار نگاشتکاهش (MapReduce) یک چارچوب نرمافزاری برای ذخیره و پردازش بزرگدادهها ارائه میکند. در شرایطی که هدوپ در ابتدا برای استفاده از رایانشخوشهای روی سیستمهای ضعیف و متوسط استفاده میشد، به مرور زمان در سختافزارهای پرقدرت نیز به کار گرفته شد. آپاچی هدوپ قابلیت کار با هزاران گره و چندین پتابایت داده را دارد. هدوپ با الهام از نگاشتکاهش (یک چارچوب نرمافزاری که توسط شرکت گوگل برای پشتیبانی از رایانش توزیعی ارائه شده است. این رایانش روی مجموعههای داده که متشکل از خوشههای کامپیوتری است انجام میشود.) و برخی مستندات شرکت گوگل طراحی و پیادهسازی شده است.
آپاچی اسپارک
یک چارچوب رایانش توزیعی متنباز است که ابتدا توسط دانشگاه کالیفرنیا، برکلی توسعه داده شد و بعدها کد آن در اختیار بنیاد نرمافزاری آپاچی قرار گرفت. اسپارک یک رابط برنامهنویسی کاربردی برای برنامهنویسی تمام خوشهها با موازیسازی دادههای ضمنی و تحمل خطا فراهم میکند. اسپارک از حافظه اصلی برای نگهداری دادههای برنامه استفاده میکند تا برنامهها سریعتر اجرا شوند. یکی دیگر از مواردی که باعث افزایش کارایی اسپارک میشود، استفاده از مکانیسم حافظه نهان هنگام استفاده از دادههایی است که قرار است دوباره در برنامه استفاده شوند. رویکرد فوق کاهش سربار ناشی از خواندن و نوشتن از دیسک را به همراه دارد. یک الگوریتم برای پیادهسازی در مدل نگاشت/کاهش، ممکن است به چندین برنامه مجزا تقسیم شود و در هنگام اجرا هر بار باید دادهها از دیسک خوانده شده، پردازش شوند و دوباره در دیسک نوشته شوند. اما با استفاده از مکانیسم حافظه نهان در اسپارک، دادهها یکبار از دیسک خوانده میشوند، در حافظه اصلی کَش میشوند و عملیاتهای متفاوت روی آنها اجرا میشود. در نتیجه استفاده از این روش باعث کاهش چشمگیر سربار ناشی از ارتباط با دیسک در برنامهها و بهبود کارایی میشود. ابزار فوق به بهترین شکل با مجموعه برنامه هدوپ هماهنگ شده تا متخصصان مشکل خاصی از بابت کار کردن با آن نداشته باشند.
شغل تحلیلگر دادهها برای چه افرادی مناسب است؟
اگر تعامل با دادهها را دوست دارید، این شغل برای شما مناسب است. تحلیلگر داده برای افرادی که به دنبال شغلی هستند که به مرور زمان جای پیشرفت داشته باشد و مهمتر از آن خطری از بابت جایگزینی آنها را تهدید نکند مناسب است. همانگونه که ابتدای مطلب به آن اشاره شد، اینترنت اشیا و یادگیری ماشین نقش تاثیرگذاری در شکلدهی بازار کار آینده دارند، به همین دلیل انتخاب شغلی شبیه به تحلیلگر داده، تضمینکننده امنیت شغلی است. فراموش نکنید، در مقایسه با برخی از مشاغل، امکان انجام کارها از راه دور برای تحلیلگران دادهها امکانپذیر است، البته به شرطی که توانمندیهای خود را برای سازمان مربوطه اثبات کنید.
ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را میتوانید از کتابخانههای عمومی سراسر کشور و نیز از دکههای روزنامهفروشی تهیه نمائید.
ثبت اشتراک نسخه کاغذی ماهنامه شبکه
ثبت اشتراک نسخه آنلاین
کتاب الکترونیک +Network راهنمای شبکهها
- برای دانلود تنها کتاب کامل ترجمه فارسی +Network اینجا کلیک کنید.
کتاب الکترونیک دوره مقدماتی آموزش پایتون
- اگر قصد یادگیری برنامهنویسی را دارید ولی هیچ پیشزمینهای ندارید اینجا کلیک کنید.
نظر شما چیست؟