نمایش بصری داده‌ها
مصورسازی داده‌ها چیست و به چه صورتی انجام می‌شود؟
مصورسازی داده‌ها (Data Visualization)، به معنای تبدیل داده‌ها به نمودار یا تصویری قابل فهم و تفسیر است. هدف اصلی مصورسازی داده‌ها، ارائه یک نمایش بصری از داده‌ها است که به کاربران کمک می‌کند الگوها، روابط و ویژگی‌های جالب داده‌ها را شناسایی کرده و اطلاعات مفیدی را استخراج کنند. در علم داده‌ها، مصورسازی داده‌ها یکی از مهم‌ترین ابزارهایی است که کارشناسان برای تفسیر و ارائه داده‌ها در اختیار دارند، زیرا اجازه می‌دهد پیچیده‌ترین داده‌ها را با نمودارهای گرافیکی و بصری به‌شکل ساده نشان دهیم تا حتا افراد غیرمتخصص نیز قادر به درک اطلاعات باشند.

مصورسازی داده‌ها به چه روش‌هایی انجام می‌شود؟ 

مصورسازی داده‌ها می‌تواند با استفاده از روش‌ها و ابزارهای مختلفی انجام شود که برخی از روش‌ها و ابزارها به‌شرح زیر هستند: 

نمودارهای خطی

نمودار خطی (Line Chart) ساده‌ترین نوع مصورسازی داده‌ها است که با استفاده از خطوط متصل، تغییرات متغیرها در طول زمان را نمایش می‌دهد. در این نمودار، مقدار متغیر مستقل (معمولا زمان) در محور افقی (محور x) و مقدار متغیر وابسته در محور عمودی (محور y) قرار می‌گیرند. نمودار خطی برای نشان دادن الگوها، روندها، تغییرات و روابط زمانی بین داده‌ها مناسب است. این نمودار معمولا برای نمایش داده‌های پیوسته در طول زمان، مانند تغییرات قیمت‌ها، فروش، دما و غیره استفاده می‌شود. 

نمودارهای تفاضلی

نمودار تفاضلی (Difference Chart) نوعی دیگری از نمودارهای مصورسازی است که برای نشان دادن تفاوت‌ها و تغییرات بین دو یا چند متغیر استفاده می‌شود. این نمودار اجازه می‌دهد تا تغییرات نسبی و اختلاف‌های بین دو سری داده را به‌صورت بصری مشاهده کنیم. در نمودار تفاضلی، محور افقی (محور x) معمولا برای نمایش متغیر مستقل استفاده می‌شود. محور عمودی (محور y) نیز برای نمایش تفاوت‌ها و تغییرات بین دو سری داده یا چند سری داده استفاده می‌شود. تفاضل‌ها می‌توانند به‌صورت مطلق یا نسبی نمایش داده شوند. نمودار تفاضلی برای مواردی که تغییرات میان دو سری داده را می‌خواهیم بررسی کنیم یا می‌خواهیم تفاوت‌ها را به‌صورت بصری نمایش دهیم مفید است. 

نمودار حبابی

نمودار حبابی (Bubble Chart) اجازه می‌دهد سه متغیر را به‌طور همزمان نشان دهیم. این سه متغیر شامل متغیر مستقل محور x، متغیر مستقل محور y و متغیر وابسته اندازه حباب است. در نمودار حبابی، هر نقطه بیان‌گر یک حباب است که موقعیت آن نقطه را بر روی محورهای x و y نشان می‌دهد. در نمودار فوق اندازه حباب نشان‌دهنده مقدار متغیر وابسته است. نمودار حبابی می‌تواند برای نشان دادن روابط بین سه متغیر و بررسی الگوها، تفاوت‌ها و تغییرات در داده‌ها مفید باشد. علاوه بر این، می‌توان از رنگ‌ها برای نشان دادن متغیر‌ها استفاده کرد. از این‌رو، نمودار حبابی می‌تواند داده‌های پیچیده را به‌صورت قابل فهم نمایش دهد.  نقشه‌ها و نمودارهای جغرافیایی، راهکار دیگری برای درک بهتر الگوها، روابط و تفاوت‌های مکانی داده‌ها هستند. نقشه‌ها و نمودارهای جغرافیایی به روش‌های مختلفی ترسیم می‌شوند. 

به‌طور مثال نقشه کوروپلت (Choropleth Map) مناطق جغرافیایی مختلف را با استفاده از رنگ‌ها یا الگوها بر اساس مقدار یک متغیر مشخص (مثلا درصد جمعیت، درآمد، دما و غیره) نمایش می‌دهد. این نوع نقشه اجازه می‌دهد تا الگوها و تفاوت‌ها را در یک مقیاس بزرگ به‌راحتی تحلیل کنیم. نمودار پراکندگی (Scatter Plot) داده‌ها را به‌صورت نقاط بر روی نقشه نشان می‌دهد. در نموارد فوق، هر نقطه نمایان‌گر مکانی خاص است. 

نمودار شعاعی

نمودار شعاعی (Radial Chart) این نمودار در قالب یک دایره، توزیع مکانی داده‌ها را نشان می‌دهد. هر خط شعاعی نمایان‌گر یک مکان مشخص است و نقاط روی آن خط نمایانگر ویژگی‌های داده‌ها (مثل متغیرهای عددی) در آن مکان هستند. 

نقشه حرارتی

در نقشه حرارتی (Heat Map) در این نقشه، رنگ‌ها برای نشان دادن توزیع مکانی یک متغیر با مقادیر مختلف استفاده می‌شوند. در این نقشه، مناطقی با مقادیر زیاد با رنگ‌های تیره و مناطقی با مقادیر کم با رنگ‌های روشن‌تر نشان داده می‌شوند.

داشبوردهای تحلیل‌ داده‌ها

داشبوردهای تحلیل داده (Data Analysis Dashboards) برای نمایش و تحلیل داده‌ها و ارائه اطلاعات به‌شکل بصری استفاده می‌شوند. این داشبوردها توسط تیم‌های تحلیل‌گر استفاده می‌شوند تا به مدیران و تصمیم‌گیران کمک کنند داده‌ها را به‌شکل سریع و کارآمدی مورد بررسی قرار دهند. به‌طور کلی، داشبوردهای تحلیل داده شامل نمودارها و عناصر گرافیکی مختلف هستند که برای نمایش داده‌ها و الگوها استفاده می‌شوند. یکی از عناصر کلیدی داشبوردهای تحلیل داده‌ها، جداول هستند که داده‌ها را به‌صورت سازمان‌یافته و مرتب‌شده نشان می‌دهند. این جداول معمولا شامل جزئیات و مقادیر کمیت‌ها و ویژگی‌های مختلف هستند که کاربران می‌توانند به آن‌ها دسترسی داشته باشند و آن‌ها را فیلتر و مرتب کنند. به‌طور معمول، داشبوردهای تحلیل داده شامل ابزارهایی برای فیلتر داده‌ها و نمایش داده‌های خاص هستند. این ابزارها به کاربران اجازه می‌دهند تا داده‌ها را بر اساس شرایط مشخصی فیلتر و تحلیل کنند و نتایج مورد نظر را مشاهده کنند. نمایش زمانی را باید یکی از ویژگی‌های کارآمد داشبوردهای تحلیل داده‌ها توصیف کنیم که چگونگی تغییر داده‌ها در طول زمان را نشان می‌دهند. داشبوردهای تحلیل داده‌ها به انواع مختلفی مثل داشبورد تحلیل عملکرد، داشبورد تجزیه‌وتحلیل فروش، داشبورد تحلیل بازاریابی، داشبورد تحلیل مالی، داشبورد تحلیل عملیاتی و غیره تقسیم می‌شوند. 

چه ابزارها و زبان‌هایی برای مصورسازی داده‌ها در دسترس است؟

برای مصورسازی داده‌ها، مجموعه‌ای گسترده از ابزارها و زبان‌های برنامه‌نویسی در دسترس است. این ابزارها و زبان‌ها کمک می‌کنند تا داده‌ها را به‌صورت بصری و زیبا نمایش دهید و الگوها، روابط و نتایج مهم را به‌راحتی درک کنید. برخی از محبوب‌ترین ابزارها و زبان‌های برنامه‌نویسی برای مصورسازی داده‌ها به‌شرح زیر هستند: 

Tableau

تبلو یکی از قدرتمندترین ابزارهای مصورسازی داده‌ها است که توسط شرکت Tableau Software توسعه داده شده است. این ابزار برای ساخت داشبوردها، نمودارها و گرافیک‌های تحلیلی استفاده می‌شود و به کاربران امکان می‌دهد تا داده‌های خود را به‌صورت بصری و تعاملی نمایش دهند. با استفاده از تبلو، می‌توانید به‌سادگی داده‌های خود را از منابع مختلفی مانند پایگاه ‌داده‌ها، فایل‌های اکسل و فایل‌های CSV به پروژه وارد کنید و سپس به‌صورت تعاملی نمودارها، نقشه‌ها، جداول و نمایش‌های تحلیلی را بسازید. تبلو قابلیت تجزیه‌وتحلیل پیشرفته داده‌ها را دارد و ابزارهای متنوعی برای فیلترسازی، مرتب‌سازی، گروه‌بندی و محاسبه داده‌ها فراهم می‌کند. رابط کاربری تبلو بسیار ساده و بصری است و کاربران بدون نیاز به مهارت‌های برنامه‌نویسی می‌توانند با استفاده از تکنیک‌های کشیدن و رها کردن با نمودارها و داده‌ها کار کرده و نتایج را به‌شکل لحظه‌ای مشاهده کنند. علاوه بر نسخه دسکتاپی تبلو، شرکت Tableau Software نسخه‌های دیگری از ابزار خود نیز ارائه کرده است که Tableau Server نام دارد و اجازه می‌دهد داشبوردها و گزارش‌های ساخته‌شده را از طریق یک سرور به‌اشتراک بگذارید. همچنین، Tableau Online یک سرویس ابرمحور است که امکان اشتراک‌گذاری داشبوردها و گزارش‌ها در قالب یک پلتفرم آنلاین را فراهم می‌کند. استفاده از تبلو در صنایع مختلفی مانند تجارت، مالی، بازاریابی، علوم داده و اداری رایج است و بد نیست بدانید که این ابزار در ایران نیز بازار داغی دارد.

Power BI 

پاور بی‌آی یک ابزار قدرتمند مصورسازی داده‌ها است که توسط شرکت مایکروسافت توسعه داده شده است. این ابزار به کاربران اجازه می‌دهد تا داده‌های خود را به‌صورت تعاملی و دلخواه مصورسازی کنند و گزارش‌ها و داشبوردهای تحلیلی را ایجاد کنند. پاور بی‌آی از منابع مختلفی مانند پایگاه ‌داده‌ها، فایل‌های اکسل، سرویس‌های آنلاین مانند Dynamics 365 و غیره پشتیبانی می‌کند تا مشکلی از بابت وارد کردن داده‌ها به پروژه و تبدیل آن‌ها به گزارش‌ها، نمودارها، جداول و نمایش‌های تحلیلی وجود نداشته باشد. با استفاده از ابزارهای قدرتمند پاور بی‌آی می‌توانید الگوها و روابط مختلف را در داده‌ها کشف کنید و به‌راحتی تحلیل‌های پیشرفته انجام دهید.

این ابزار نیز رابط کاربری ساده‌ای دارد و به شما اجازه می‌دهد فرآیند مصورسازی را به‌شکل جامع و دقیقی مدیریت کنید. همچنین، پاور بی‌آی یک رابط کاملا تعاملی ارائه می‌کند و به کاربران اجازه می‌دهد با استفاده از فیلترها فرآیند مرتب‌سازی‌ها داده‌ها را انجام دهند و تغییرات را به‌شکل لحظه‌ای مشاهده کنند. پاور بی‌آی علاوه بر نسخه دسکتاپی، نسخه‌های دیگری نیز دارد. به‌طور مثال، Power BI Pro اجازه می‌دهد گزارش‌ها و داشبوردهای ساخته‌شده را با دیگران به اشتراک بگذارید و در سطح تیم با یک‌دیگر همکاری کنید. همچنین، Power BI Premium نسخه‌ای برای محیط‌های سازمانی است که امکانات بیشتری ارائه می‌دهد و قابلیت استقرار در سطح سازمان را فراهم می‌کند.

D3.js  

D3.js  یک کتاب‌خانه جاوااسکریپت منبع‌باز است که برای ساخت و مصورسازی داده‌ها بر روی وب استفاده می‌شود. D3.js  به کاربران اجازه می‌دهد از طریق فناوری‌هایی مثل HTML، CSS و SVG داده‌ها را به‌صورت تعاملی و بصری نمایش دهند. یکی از ویژگی‌های برجسته D3.js  انعطاف‌پذیری بالای آن است. با استفاده از D3.js، می‌توانید به‌طور مستقیم به داده‌ها دسترسی پیدا کنید و با استفاده از ابزارهای قدرتمندی که این کتاب‌خانه ارائه می‌دهد، نمودارها، نقشه‌ها را ایجاد کرده و مصورسازی‌ها را انجام دهید. مزیت اصلی D3.js در مقایسه با سایر کتاب‌خانه‌های مصورسازی داده‌ها، امکان سفارشی‌سازی بیشتر و کنترل دقیق‌تر است. D3.js از اصول و تکنیک‌های مدرن مصورسازی داده‌ها مانند نمودارهای شعاعی، نمودارهای شبکه، نمودارهای سلسله‌مراتبی و غیره پشتیبانی می‌کند. همچنین، این کتاب‌خانه امکاناتی برای مقیاس‌پذیری و پاسخ‌گویی در مقیاس کلان‌داده‌ها ارائه می‌کند. برای آن‌که بتوانید از D3.js  استفاده کنید به مهارت‌های برنامه‌نویسی به زبان‌های JavaScript، HTML و CSS نیاز دارید. 

matplotlib 

Matplotlib یکی دیگر از کتاب‌خانه‌های قدرتمند و پرکاربرد برای مصورسازی داده‌ها به زبان برنامه‌نویسی پایتون است. این کتاب‌خانه ابزارهای گوناگونی را برای ایجاد نمودارهای تحلیلی و تصاویر ارائه می‌دهد. با استفاده از Matplotlib، می‌توانید به‌سادگی نمودارها و تصاویر مختلف را ایجاد کنید. این کتاب‌خانه از نمودارهای خطی، نمودارهای نقطه‌ای، نمودارهای ستونی، نمودارهای دایره‌ای، نمودارهای پراکندگی و غیره به بهترین شکل پشتیبانی می‌کند. همچنین، می‌توانید سبک‌ها، رنگ، محورها، عناصر شبکه و خصوصیات دیگر نمودارها را به‌طور دقیق کنترل کنید. Matplotlib از ساختار شی‌ءگرایی پیروی می‌کند و قابلیت توسعه و سفارشی‌سازی بالایی دارد. این کتاب‌خانه در ترکیب با پایتون و کتاب‌خانه‌های دیگر مانند NumPy و Pandas، به‌طور گسترده در علوم داده، مهندسی، علوم زیستی، مالی، بازاریابی و دیگر حوزه‌ها مورد استفاده قرار می‌گیرد. با استفاده از Matplotlib، می‌توانید نمودارها را به‌صورت تعاملی یا غیرتعاملی ایجاد کنید. همچنین، این کتاب‌خانه امکاناتی برای ذخیره‌سازی نمودارها در فرمت‌های مختلف (PNG، PDF، SVG و غیره)، اضافه کردن عناصر توضیحی مانند عناوین، برچسب‌ها و توضیحات، قابلیت انتشار نمودارها در شکل‌ها و گزارش‌ها را در اختیار متخصصان قرار می‌دهد. 

ggplot2 

اگر در زمینه کار با زبان برنامه‌نویسی آر (R) تخصص دارید، ggplot2 کتاب‌خانه مصورسازی داده‌های قدرتمندی است که برای این زبان نوشته شده است. این کتاب‌خانه بر اساس زبان گرامر گرافیکی (Grammar of Graphics) ساخته شده است و اجازه می‌دهد به‌سادگی نمودارها و گراف‌های مختلف را به‌صورت قالب‌بندی‌شده و قابل تنظیم ایجاد کنید. ggplot2 بر مبنای تفکیک داده‌ها کار می‌کند و پشتیبانی خوبی از نمودارهای مرسوم به‌عمل می‌آورد. همچنین، این کتاب‌خانه امکاناتی برای ترکیب نمودارها، تغییر سبک‌ها، افزودن نشانگرها، تنظیم محورها و عناصر دیگر نمودار فراهم می‌کند. 

گرامر گرافیکی ggplot2 بر مبنای این تکنیک کار می‌کند که نمودار به‌عنوان ترکیبی از مولفه‌های مختلف مانند داده‌ها، نقاط، خطوط، هندسه‌ها، محورها و مقیاس‌ها در نظر گرفته می‌شود. با استفاده از این گرامر، می‌توانید به‌طور دقیق قوانین و قواعدی برای ایجاد نمودارها تعیین کنید و کنترل بیشتری در قالب‌بندی و ظاهر نمودارها به‌وجود آورید. علاوه بر این، ggplot2 از مفهوم لایه‌بندی (layering) برای ساخت نمودارها استفاده می‌کند. 

در این رویکرد، شما می‌توانید لایه‌های مختلفی را به نمودار اضافه کنید، مانند لایه‌های داده‌ای، لایه‌های هندسه‌ای، لایه‌های آماری و غیره. این قابلیت اجازه می‌دهد نمودارهای پیچیده‌تر و با ساختارهای چندلایه‌ای را ایجاد کنید. به‌طور کلی باید بگوییم که ggplot2 یکی از کتاب‌خانه‌های محبوب و قدرتمند در دنیای برنامه‌نویسی زبان آر است و در حوزه‌های مختلفی از جمله علوم داده‌ها استفاده می‌شود. 

چگونه مصورسازی داده‌ها را در پایتون انجام دهیم؟

اکنون که تا حدودی با مبحث مصورسازی داده‌ها و ابزارهایی که در این زمینه در دسترس قرار دارند آشنا شدیم، اجازه دهید به رسم مطالب پرونده‌ ویژ‌ه‌های قبلی مجله شبکه، مثالی از نحوه مصورسازی داده‌ها را در پایتون مورد بررسی قرار دهیم.  برای مصورسازی داده‌ها در پایتون، می‌توانید از کتاب‌خانه‌های مختلفی مانند Matplotlib، Seaborn و Plotly استفاده کنید. 

در ادامه، روش‌ ساده‌ای را برای مصورسازی داده‌ها با استفاده از کتاب‌خانه Matplotlib مورد بررسی قرار می‌دهیم. 

1. نصب کتاب‌خانه: قبل از شروع، مطمئن شوید کتاب‌خانه Matplotlib بر روی سیستم نصب شده باشد. در صورتی که نصب نیست، می‌توانید آن را با استفاده از دستور زیر نصب کنید:

   pip install matplotlib

2. وارد کردن کتاب‌خانه: بعد از نصب، باید کتاب‌خانه Matplotlib را در برنامه پایتون خود وارد کنید. این کار با استفاده از دستور import انجام می‌شود:

   import matplotlib.pyplot as plt

3. ایجاد نمودار: اکنون می‌توانید با استفاده از داده‌های خود، نمودار مورد نظر را ایجاد کنید. به‌عنوان مثال، برای ایجاد یک نمودار خطی از تابع plot استفاده می‌کنیم:

x = [1, 2, 3, 4, 5]

y = [2, 4, 6, 8, 10]

   plt.plot(x, y)

4. نمایش نمودار: بعد از ایجاد نمودار، می‌توانید آن را با استفاده از تابع show نمایش دهید:

   plt.show()

با اجرای این دستور، پنجره‌ای شامل نمودار نمایش داده خواهد شد.

به‌طور مشابه، می‌توانید از توابع دیگری مانند scatter برای ایجاد نمودارهای نقطه‌ای، bar برای ایجاد نمودارهای ستونی و غیره استفاده کنید. همچنین، می‌توانید سبک‌ها، رنگ، برچسب‌ها، محورها و عناصر دیگر نمودار را با استفاده از توابع مربوطه تنظیم کنید. 

مثال بالا تنها یک نمونه ساده از مصورسازی داده‌ها با استفاده از کتاب‌خانه Matplotlib بود، اما کتاب‌خانه‌های دیگری مانند Seaborn و Plotly نیز در زمینه مصورسازی داده‌ها در پایتون مورد استفاده قرار می‌گیرند. 

چگونه می‌توانیم نمودارهای نقطه‌ای را با استفاده از کتاب‌خانه Matplotlib ایجاد کنیم؟

برای ایجاد نمودارهای نقطه‌ای با استفاده از کتاب‌خانه Matplotlib، تابع قدرتمند scatter در اختیارمان قرار دارد. این تابع اجازه می‌دهد داده‌ها را به‌صورت نقاط در نمودار نشان دهیم. برای درک بهتر موضوع به مثال ساده زیر دقت کنید که نحوه ساخت یک نمودار نقطه‌ای با استفاده از کتاب‌خانه Matplotlib را نشان می‌دهد. 

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]

y = [2, 4, 6, 8, 10]

plt.scatter(x, y)

plt.xlabel(‘X-axis’)

plt.ylabel(‘Y-axis’)

plt.title(‘Scatter Plot’)

plt.grid(True)

plt.show()

در قطعه کد بالا، ابتدا کتاب‌خانه Matplotlib را وارد کردیم و سپس داده‌های x و y را تعریف کرده‌ایم. سپس، با استفاده از تابع scatter، نمودار نقطه‌ای را بر مبنای داده‌های x و y ایجاد کردیم. سپس با استفاده از توابع xlabel و ylabel، برچسب‌های محورها را تنظیم کرده‌ایم. در ادامه، با استفاده از تابع title عنوان نمودار را تعیین کردیم، با فراخوانی تابع grid(True)، خطوط شبکه در نمودار را نشان دادیم و در نهایت، با فراخوانی تابع show، نمودار را نشان دادیم. این قطعه کد می‌تواند به‌عنوان یک الگوی ساده برای ایجاد نمودارهای نقطه‌ای در Matplotlib دید روشنی در اختیارمان قرار دهد. البته، با استفاده از توابع و ویژگی‌های دیگر موجود در Matplotlib، می‌توانید نمودارهای پیچیده‌تری را ایجاد و سفارشی‌سازی کنید.

چگونه می‌توانیم نمودارهای نقطه‌ای را ذخیره کنیم؟

برای ذخیره نمودارهای نقطه‌ای ساخته‌شده در پایتون، کتاب‌خانه Matplotlib تابع savefig را در دسترس ما قرار می‌دهد. این تابع اجازه می‌دهد نمودار را به فرمت‌های مختلفی مانند PNG، JPEG، PDF و غیره ذخیره کنیم. فرآیند انجام این‌کار به‌شرح زیر است: 

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]

y = [2, 4, 6, 8, 10]

plt.scatter(x, y)

plt.xlabel(‘X-axis’)

plt.ylabel(‘Y-axis’)

plt.title(‘Scatter Plot’)

plt.grid(True)

plt.savefig(‘scatter_plot.png’)

در قطعه کد بالا، پس از ایجاد نمودار نقطه‌ای با استفاده از تابع scatter و تنظیم برچسب‌ها و عناصر دیگر نمودار، با استفاده از تابع savefig، نمودار به فرمت PNG با نام scatter_plot.png ذخیره می‌شود. شما می‌توانید نام و مسیر فایل ذخیره‌شده را بر اساس نیاز خود تغییر دهید. به‌جای فرمت PNG، می‌توانید از فرمت‌های دیگری مانند JPEG، PDF، SVG و غیره استفاده کنید. برای این کار، کافی است پسوند فایل مورد نظر را در آرگومان savefig تغییر دهید.

 

ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را می‌توانید از کتابخانه‌های عمومی سراسر کشور و نیز از دکه‌های روزنامه‌فروشی تهیه نمائید.

ثبت اشتراک نسخه کاغذی ماهنامه شبکه     
ثبت اشتراک نسخه آنلاین

 

کتاب الکترونیک +Network راهنمای شبکه‌ها

  • برای دانلود تنها کتاب کامل ترجمه فارسی +Network  اینجا  کلیک کنید.

کتاب الکترونیک دوره مقدماتی آموزش پایتون

  • اگر قصد یادگیری برنامه‌نویسی را دارید ولی هیچ پیش‌زمینه‌ای ندارید اینجا کلیک کنید.

ایسوس

نظر شما چیست؟