შესაჯამებლად, ზოგადად, თუ მონაცემთა განაწილება მარცხნივ არის გადახრილი, საშუალო მაჩვენებელი ნაკლებია ვიდრე მედიანა, რომელიც ხშირად ნაკლებია ვიდრე რეჟიმი. თუ მონაცემების განაწილება მარჯვნივ არის გადახრილი, რეჟიმი ხშირად საშუალოზე ნაკლებია, რაც საშუალოზე ნაკლებია.
რატომ მოქმედებს მედიანაზე ნაკლებად დახრილი მონაცემები?
რატომ არის მედიანაზე ნაკლებად ზეგავლენა დახრილი მონაცემებით, ვიდრე საშუალოზე? თუმცა, როდესაც მონაცემები ხდება დახრილი, საშუალო კარგავს თავის უნარს უზრუნველყოს მონაცემთა საუკეთესო ცენტრალური მდებარეობა, რადგან დახრილი მონაცემები აშორებს მას ტიპიური მნიშვნელობიდან..
რატომ არის მედიანა უკეთესი დახრილი მონაცემებისთვის?
გადანაწილებისთვის, რომლებსაც აქვთ უკიდეგანო ან დახრილი, მედიანა ხშირად არის ცენტრალური ტენდენციის უპირატესი საზომი, რადგან მედიანა უფრო მდგრადია გარედან, ვიდრე საშუალო.… გაითვალისწინეთ, რომ საშუალო იწელება დახრის მიმართულებით (ანუ კუდის მიმართულებით).
მარჯვნივ დახრილობისას საშუალოა?
მარჯვნივ დახრილი განაწილებისთვის, საშუალო ჩვეულებრივ მეტია მედიანაზე ასევე შენიშნეთ, რომ განაწილების კუდი მარჯვენა მხარეს (დადებითი) უფრო გრძელია, ვიდრე მარცხენა მხარე. ყუთისა და ულვაშის დიაგრამიდან ჩვენ ასევე შეგვიძლია დავინახოთ, რომ მედიანა უფრო ახლოს არის პირველ კვარტილთან, ვიდრე მესამე კვარტლი.
როგორ მოქმედებს დახრილობა მონაცემებზე?
დახრილობის ეფექტი
თუ მონაცემები ძალიან ბევრია, მაშინ ბევრი სტატისტიკური მოდელი არ მუშაობს, მაგრამ რატომ. ასე რომ, დახრილ მონაცემებში, კუდის რეგიონი შეიძლება იმოქმედოს როგორც გამოკვეთი სტატისტიკური მოდელისთვის და ჩვენ ვიცით, რომ უკიდეგანოები უარყოფითად მოქმედებს მოდელის მუშაობაზე, განსაკუთრებით რეგრესიაზე დაფუძნებულ მოდელებზე.