فرآیند تجزیه و تحلیل داده ها

 

تجزیه و تحلیل داده ها فرآیندی ست برای جمع آوری، تبدیل، تمیز کردن و مدل سازی داده ها با هدف کشف اطلاعات مورد نیاز. نتایج به دست آمده ازاین فرآیند، باعث حمایت از تصمیم گیری درست می باشد. تجسم داده ها برای نشان دادن داده ها و سهولت کشف الگوهای مفید در داده ها مورد استفاده قرار می گیرد. اصطلاحات مدل سازی و تجزیه و تحلیل داده ها یکسان است.
فرآیندتجزیه و تحلیل داده ها شامل مراحل زیرمی باشد: 

  • مشخصات مورد نیاز داده ها
  • مجموعه داده ها
  • پردازش داده ها
  • تمیز کردن داده ها
  • تحلیل داده ها
  • ارتباطات

 

 


مشخصات مورد نیاز داده ها
اطلاعات مورد نیاز برای تجزیه و تحلیل بر پایه  یک سوال یا یک تشریح است . بر اساس الزامات افرادی که این تحلیل را انجام می دهند، به عنوان داده های مورد نیاز برای ورود به تجزیه و تحلیل شناسایی شده اند (به عنوان مثال، جمعیت مردم). متغیرهای خاصی در مورد جمعیت (به عنوان مثال، سن و درآمد) ممکن است مشخص شود و بدست آید. داده ها ممکن است عددی یا قطعی باشند.

 


مجموعه داده ها
جمع آوری داده ها نوعی از روند جمع آوری اطلاعات در مورد متغیرهای هدفمند است که به عنوان الزامات داده تعیین می شوند. تاکید بر اطمینان از جمع آوری دقیق و صادقانه داده ها است. مجموعه داده ها اطمینان می دهد که داده های جمع آوری شده دقیق هستند تا تصمیمات مربوطه معتبر باشند. مجموعه داده ها مبنایی برای اندازه گیری است و هدف را بهبود می دهد.
داده ها از منابع مختلف از پایگاه داده های سازمانی در صفحات وب جمع آوری شده است. داده های به دست آمده از این دست ممکن است ساختار نداشته و ممکن است حاوی اطلاعات نامناسب باشند. از این رو، داده های جمع آوری شده، مورد نیاز برای پردازش داده ها و تمیز دادن داده ها هستند.

 


پردازش داده ها
داده های جمع آوری شده باید تجزیه و تحلیل پردازش یا سازماندهی شوند. ساختار داده ها  ابزاری برای تجزیه و تحلیل آنها می باشد. برای مثال، ممکن است داده ها در سطر و ستون در یک جدول، در یک صفحه گسترده، یا برنامه آماری قرار داده شوند و یا ممکن است یک مدل داده ایجاد شود.

 


تمیز کردن داده ها
داده پردازش شده و سازماندهی شده ممکن است ناقص، حاوی تکرار یا حاوی خطا باشد. تمیز کردن داده ها روند جلوگیری و اصلاح این خطاها است. انواع مختلفی از تمیز کردن داده وجود دارد که به نوع داده بستگی دارد. به همین ترتیب، روش های داده های کمی نیز می توانند برای تشخیص خروجی مورد استفاده قرار گیرند که بعدا در تجزیه و تحلیل حذف خواهند شد.


تحلیل داده ها
داده هایی که پردازش شده، سازمان یافته و تمیز می شوند برای تجزیه و تحلیل آماده می شوند. تکنیک های تجزیه و تحلیل داده ها در دسترس برای درک، تفسیر و نتیجه گیری بر اساس الزامات هستند. تجسم داده همچنین ممکن است برای بررسی داده ها در فرمت گرافیکی ، و یا برای دستیابی به اطلاعات بیشتر در مورد پیام های درون داده ها مورد استفاده قرار گیرد.
مدل های آماری داده ها مانند همبستگی، تجزیه و تحلیل رگرسیون می تواند برای شناسایی روابط بین متغیرهای داده استفاده شود. این مدل هایی که از داده های توصیفی هستند، در ساده سازی ،تحلیل و ارتباط نتایج مفید هستند.
این فرآیند ممکن است نیاز به تمیز کردن داده های اضافی داشته باشد، و از این رو این فعالیت ها تکراری است.

 

ارتباطات
نتایج تجزیه و تحلیل داده ها باید به صورت فرمت گزارش شود تا کاربران از تصمیمات و اقدامات بعدی آگاه باشند. بازخورد از کاربران ممکن است باعث تحلیل بیشتر شود.
تحلیل گران داده ها می توانند تکنیک های تجسم داده، مانند جداول و نمودار ها را انتخاب کنند، که به طور واضح و کارآمد برای اطلاع رسانی به کاربران کمک می کند. ابزارهای تجزیه و تحلیل، ترسیم اطلاعات مورد نیاز را با کدهای رنگی و قالب بندی در جداول و نمودار فراهم می کنند.

 

 

بررسی اجمالی تجزیه و تحلیل داده ها 

تجزیه و تحلیل داده ها فرآیندی است برای بررسی، تمیز کردن، تبدیل و مدل سازی داده ها با هدف کشف اطلاعات مفید، به منظور نتیجه گیری و حمایت از تصمیم های درست .

 


انواع تجزیه و تحلیل داده ها
چندین تکنیک برای تجزیه و تحلیل داده ها وجود دارد که شامل انواع مختلفی از جمله تجزیه و تحلیل داده ها در زمینه کسب و کار، علم، علوم اجتماعی و غیره با نام های مختلف است.  رویکردهای تجزیه و تحلیل داده ها :

  •      داده کاوی
  •      هوش تجاری
  •      تحلیل آماری
  •      تجزیه و تحلیل پیش بینی
  •      تجزیه و تحلیل متن

 

داده کاوی
داده کاوی تجزیه و تحلیل مقدار زیادی از داده ها برای استخراج الگوهای ناشناخته و جالب وغیر معمول می باشد . توجه داشته باشید که درداده کاوی هدف، استخراج الگوها و دانش از مقادیر زیادی داده هاست ، نه استخراج اطلاعات.
تجزیه و تحلیل داده ها شامل روش های علوم رایانه ای در قسمت هوش مصنوعی، یادگیری،  آمار و سیستم های پایگاه داده می باشد.
الگوهای حاصل از استخراج داده ها می تواند به عنوان خلاصه ای از داده های ورودی مورد استفاده قرار گیرد که می تواند در تجزیه و تحلیل بیشتر مورد استفاده قرار گیرد و یا نتایج پیش بینی دقیق تر را با یک سیستم تصمیم گیری پشتیبانی کند.

 


هوش تجاری
تکنیک های کسب و کار، ابزاری برای تبدیل مقدار زیادی از داده های کسب و کار بدون ساختار برای کمک به شناسایی، توسعه و ایجاد فرصت های تجاری جدید استراتژیک است.

هدف از اطلاعات کسب و کار این است که اجازه ی تفسیر آسان از حجم زیادی از داده ها را برای شناسایی فرصت های جدید می دهد. این روش اجرای یک استراتژی موثر بر اساس بینش هایی است که می تواند کسب و کار را به یک مزیت رقابتی دراز مدت در بازار تبدیل کند.

 


تحلیل آماری
تحلیل آماری آمار مطالعه، جمع آوری، تجزیه و تحلیل، تفسیر، ارائه و سازماندهی داده ها است.
در تجزیه و تحلیل داده ها، دو روش اصلی آماری استفاده می شود:

  آمار توصیفی - در آمار توصیفی، داده ها از کل جمعیت یا یک نمونه با توصیف های عددی می باشد مانند:

  •  میانگین، انحراف استاندارد برای داده های پیوسته
  •  فرکانس، درصد برای داده های طبقه بندی شده

     آمار استنباط - از الگوها در داده های نمونه استفاده می کنند تا نتیجه گیری های مربوط به جمعیت ارائه شده یا حسابداری تصادفی را استخراج کنند. این نتیجه گیری می تواند به شکل زیر باشد:

  • پاسخ دادن با بله یا خیر، سوال در مورد داده ها (تست فرضیه)
  • ارزیابی ویژگی های عددی داده ها (برآورد)
  • توصیف انجمن ها در داده ها (همبستگی)
  • روابط مدل سازی درون داده ها (به عنوان مثال تجزیه و تحلیل رگرسیون)

 

پیش بینی تجزیه و تحلیل 
پیش بینی تجزیه و تحلیل ،استفاده از مدل های آماری برای تجزیه و تحلیل داده های جاری و تاریخی برای پیش بینی ها در مورد رویدادهای آینده و یا ناشناخته است. در کسب و کار، برای شناسایی خطرات و فرصت هایی که به  تصمیم گیری کمک می کند از پیش بینی تجزیه و تحلیل استفاده می شود.
تجزیه و تحلیل متن
تجزیه و تحلیل متن، همچنین به عنوان استخراج متن و یا فرآیند استخراج اطلاعات با کیفیت بالا از متن است. معادله متن معمولا شامل ساختار متن ورودی می شود، الگوهای درون داده های ساخت یافته ر ا ابزارهایی مانند یادگیری آماری و در نهایت ارزیابی و تفسیر خروجی، در بر می گیرد.

 


فرایند تجزیه و تحلیل داده ها
تجزیه و تحلیل داده ها توسط متخصص آمار John Tukey در سال 1961 تعریف شده است. فرایند تجزیه و تحلیل داده ها به عنوان روشی برای تکنیک های تفسیر نتایج رویه ها، روش های برنامه ریزی جمع آوری داده ها،  برای تجزیه و تحلیل ساده تر، دقیق تر، و تمام ماشین آلات و نتایج آمار (ریاضی) که برای تجزیه و تحلیل داده ها استفاده می شود می باشد.
بنابراین، تجزیه و تحلیل داده ها یک فرایند برای به دست آوردن داده های بزرگ و بدون ساختار از منابع مختلف و تبدیل آن به اطلاعاتی است که مفید است .

  •     پاسخ به سوالات
  •     فرضیه های آزمون
  •     تصمیم سازی
  •     تئوری های بازپس گیری

 

تجزیه و تحلیل داده ها با اکسل
مایکروسافت اکسل چندین روش برای تجزیه و تحلیل و تفسیر داده ها را فراهم می کند. داده ها می توانند از منابع مختلف باشند.  داده ها می توانند به روش های مختلف تبدیل و فرمت شوند. داده ها می توانند با دستورات، توابع و ابزار مربوط به اکسل مورد تجزیه و تحلیل قرار گیرد که شامل قالب بندی شرطی، محدوده ها، جداول، توابع متن، توابع تاریخ، توابع زمان، توابع مالی، توزیع مقدمات، تجزیه و تحلیل سریع، فرمول حسابرسی، ابزار پرس و جو، Solvers، Data Model، PowerPivot، PowerView، PowerMap و غیره... می باشد.
شما در حال مطالعه تکنیک های تجزیه و تحلیل اطلاعات با اکسل ، بخشی از دو بخش  زیر را میخوانید:

  •      تجزیه و تحلیل داده ها با اکسل 
  •      تجزیه و تحلیل داده های با اکسل پیشرفته

نظرات کاربران

نظر خودتان را بنویسید