داغ ترین ها

ورود / عضویت

Diginaco

عضویت در سایت

فراموشی رمز عبور

کلان داده یا همان “Big Data” به مجموعه داده هایی اطلاق میشود که بسیار وسیع و حجیم میباشند و به منظور تصمیم گیری ویا بهینگی و ایجاد بینشی تازه در یک حوزه مورد پردازش قرار می گیرند و همچنین سرعت تولید بسیار بالایی دارند. میزان حجم این داده ها از چند ترابایت تا چندین پتابایت را شامل می شود. پردازش و تحلیل این داده ها می تواند نتایج بسیار مفیدی را برای کاربردهای گوناگونی نظیر بهداشت و درمان, آموزش, صنایع تولیدی, امور تجاری و امور اجتماعی در برداشته باشد در این مقاله قصد داریم به بررسی ۵ ابزار مهم و رایگان تحلیل کلان داده ها در سال ۲۰۱۸ بپردازیم پس با ما همراه باشید.

تحلیل صحیح و سریع کلان داده ها امری بسیار مهم و کلیدی است که در بدست آمدن نتایج درست و تصمیم گیری های دقیق نقشی اساسی دارد. در اینجا لیستی از ۵ ابزار محبوب و پرکاربرد تحلیل کلان داده ها را براساس میزان استفاده و محبوبیت در میان کاربران جهانی را معرفی می نماییم:

۱- Hadoop

Apache Hadoop معروفترین و شناخته شده ترین عنوان این لیست می باشد. این برنامه شامل مجموعه ای از ابزارهای متن باز و رایگان است که یک چارچوب نرم افزاری را برای ذخیره و پردازش کلان داده ها بکار می گیرد. این سامانه از قابلیت رایانش خوشه ای برخوردار است و میتواند هزاران گره را به طور همزمان مورد استفاده قرار دهد. پروژه هدوپ یکی از طرح های سطح بالای شرکت آپاچی می باشد و توسعه دهندگان و مشارکت کنندگان بسیاری دارد. یکی از این شرکت های حامی که بطور گسترده از آن بهره می برد شرکت یاهو می باشد و شرکت های دیگری نظیر آی بی ام, اچ پی و فیسبوک از مهمترین استفاده کنندگان آن بشمار می روند.

۲-   Apache Spark

Apache Spark دومین ابزار شناخته شده در صنعت تحلیل کلان داده هاست. این ابزار یک چارچوب رایانش بصورت کاملا توزیع شده می باشد که نخست توسط دانشگاه برکلی کالیفرنیا ابداع شد و بعد ها به بنیاد نرم افزار آپاچی اهدا گردید.نخستین نسخه این سامانه در ماه مه سال ۲۰۱۴ میلادی رونمایی شد و توسط مامی سیستم عامل های موجود پشتیبانی میگردد. این سامانه درواقع یک رابط برنامه نویسی برای برنامه نویسی در تمام خوشه ها می باشد  که امکان موازی سازی داده های ضمنی  و تحمل خطا را فراهم می کند.

۳- Apache Storm

Apache Storm یک چارچوب متن باز است که بصورت بلادرنگ و به منظور پردازش کلان داده هایی که به طور متوالی و سریع تولید میشوند مورد استفاده قرار می گیرد. این سامانه از تمام زبان های برنامه نویسی پشتیبانی می کند و ویژگی های منحصر بفردی نظیر مقیاس پذیری فوق العاده, تحمل خطای بالا, پشتیبانی از پروتکل هایی مانند JSON و…. دارد.

۴- Cassandra

Apache Cassandra یک نوع پایگاه داده توزیع شده می باشد که برای مدیریت مجموعه بزرگی از داده های روی سرور ها استفاده می شود. این سامانه یکی از بهترین ابزارهای کلان داده جهت پردازش داده های ساخت یافته می باشد و میتواند خدمات دردسترس و بدون خطایی ارایه نمایدو همچنین این سامانه امکان ارتباط با پایگاه داده های رابطه ای و NoSQL  را فراهم نماید. همچنین این سامانه از وییگی هایی نظیر:
در دسترس بودن مداوم به عنوان یک منبع داده

عملکرد مقیاس پذیر خطی

عملیات ساده

در سراسر مراکز داده ها، توزیع آسان داده ها

نقاط دسترسی  متعدد در Cloud

مقیاس پذیری وسیع

کارایی بالا

برخوردار است

۵- RapidMiner

RapidMiner یک پلتفرم نرم افزاری است که برای فعالیت های حوزه علوم داده گسترش یافته است و می تواند فعالیتهایی نظیر آماده سازی داده ها, یادگیری ماشین, یادگیری عمیق و…. را فراهم نماید این ابزار عملکردی فوق العاده در خصوص کلان داده ها دارد و دنبال یک مدل client / server که در آن سرور می تواند بر اساس پیش فرض قرار گیرد یا در یک زیرساخت ابر باشد. این در جاوا نوشته شده است و یک GUI برای طراحی و اجرای گردش کار فراهم می کند وازین طریق می تواند ۹۹ درصد راه حل پیشرفته تحلیلی را فراهم کند

بهزاد سامی

بهزاد سامی

بهزاد سامی هستم محقق ،مترجم،برنامه نویس و متخصص در حوزه فناوری اطلاعات و کسب و کارهای استارت آپی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *