بررسی اثر دادههای دور افتاده بر میانگین و انحراف معیار
دادههای دور افتاده میتوانند تأثیر قابل توجهی بر میانگین و انحراف معیار داشته باشند. میانگین به شدت تحت تأثیر دادههای دور افتاده قرار میگیرد زیرا مجموع دادهها را به تعداد دادهها تقسیم میکند. اگر دادهای بسیار بزرگتر یا کوچکتر از سایر دادهها باشد، میانگین را به سمت خود میکشد.
انحراف معیار نیز که معیاری برای پراکندگی دادهها است، تحت تأثیر دادههای دور افتاده قرار میگیرد. دادههای دور افتاده باعث افزایش پراکندگی و در نتیجه افزایش انحراف معیار میشوند.
بنابراین، جمله "برای جامعه آماری با دادههای دور افتاده، استفاده از میانگین و انحراف معیار کافی است" نادرست است. زیرا دادههای دور افتاده میتوانند میانگین و انحراف معیار را به شدت تحت تأثیر قرار دهند و این دو معیار ممکن است نمایانگر مناسبی از وضعیت جامعه آماری نباشند.
در چنین مواردی، استفاده از معیارهای مقاوم مانند میانه و دامنه بین چارکی میتواند مناسبتر باشد.