ნორმალიზაცია კარგია გამოსაყენებლად, როდესაც იცით, რომ თქვენი მონაცემების განაწილება არ მიჰყვება გაუსიან განაწილებას. … სტანდარტიზაცია, მეორე მხრივ, შეიძლება იყოს გამოსადეგი იმ შემთხვევებში, როდესაც მონაცემები მიჰყვება გაუსის განაწილებას.
გამოვიყენო ნორმალიზაცია თუ სტანდარტიზაცია?
ნორმალიზაცია სასარგებლოა, როდესაც თქვენს მონაცემებს განსხვავებული მასშტაბები აქვთ და ალგორითმი, რომელსაც იყენებთ, არ იძლევა ვარაუდებს თქვენი მონაცემების განაწილების შესახებ, როგორიცაა k-უახლოესი მეზობლები და ხელოვნური ნერვული ქსელები. სტანდარტიზაცია ვარაუდობს, რომ თქვენს მონაცემებს აქვს გაუსიანი (ზარის მრუდი) განაწილება.
სტანდარტიზაცია იგივეა რაც ნორმალიზაცია?
ბიზნეს სამყაროში "ნორმალიზაცია" ჩვეულებრივ ნიშნავს, რომ მნიშვნელობების დიაპაზონი "ნორმალიზებულია 0-დან.0-დან 1.0-მდე -მდე". "სტანდარტიზაცია" ჩვეულებრივ ნიშნავს, რომ მნიშვნელობების დიაპაზონი "სტანდარტიზებულია" იმის გასაზომად, თუ რამდენი სტანდარტული გადახრებია ეს მნიშვნელობა საშუალოდან.
ყოველთვის კარგია მონაცემთა ნორმალიზება?
ნორმალიზებით, თქვენ რეალურად აგდებთ გარკვეულ ინფორმაციას მონაცემების შესახებ, როგორიცაა აბსოლუტური მაქსიმალური და მინიმალური მნიშვნელობები. ასე რომ, არ არსებობს ცერის წესი. როგორც სხვებმა თქვეს, ნორმალიზაცია ყოველთვის არ გამოიყენება; მაგალითად. პრაქტიკული თვალსაზრისით.
როდის არ უნდა მოხდეს მონაცემების ნორმალიზება?
ზოგიერთი კარგი მიზეზი, რომ არ მოხდეს ნორმალიზება
- გაწევრიანება ძვირია. თქვენი მონაცემთა ბაზის ნორმალიზება ხშირად მოიცავს მრავალი ცხრილის შექმნას. …
- ნორმალიზებული დიზაინი რთულია. …
- სწრაფი და ჭუჭყიანი უნდა იყოს სწრაფი და ბინძური. …
- თუ იყენებთ NoSQL მონაცემთა ბაზას, ტრადიციული ნორმალიზება არ არის სასურველი.