მანქანური სწავლების მოდელები მოითხოვს, რომ ყველა შეყვანის და გამომავალი ცვლადი იყოს რიცხვითი. ეს ნიშნავს, რომ თუ თქვენი მონაცემები შეიცავს კატეგორიულ მონაცემებს, თქვენ უნდა დაშიფვროთ ისინი ნომრებზე, სანამ შეძლებთ მოდელის მორგებას და შეფასებას… კოდირება არის წინასწარი დამუშავების აუცილებელი ეტაპი მანქანისთვის კატეგორიულ მონაცემებთან მუშაობისას. სასწავლო ალგორითმები.
რატომ ვაშიფრავთ კატეგორიულ ცვლადებს?
კატეგორიული ცვლადი არის ცვლადი, რომლის მნიშვნელობები იღებს ეტიკეტების მნიშვნელობას. … მანქანათმცოდნეობის ალგორითმები და ღრმა სწავლის ნერვული ქსელები მოითხოვს, რომ შემავალი და გამომავალი ცვლადები იყოს რიცხვები. ეს ნიშნავს, რომ კატეგორიული მონაცემები უნდა იყოს კოდირებული ციფრებში, სანამ ჩვენ შევძლებთ მის გამოყენებას მოდელის მოსარგებად და შესაფასებლად.
რატომ არის კატეგორიული მონაცემები სასარგებლო?
კატეგორიული და რიცხვითი მონაცემები მონაცემების ძირითადი ტიპებია. ამ მონაცემთა ტიპებს შეიძლება ჰქონდეთ ქვეკატეგორიების იგივე რაოდენობა, თითოეულში ორი, მაგრამ მათ აქვთ მრავალი განსხვავება. ეს განსხვავებები მათ აძლევს უნიკალურ ატრიბუტებს, რომლებიც თანაბრად სასარგებლოა სტატისტიკურ ანალიზში. … შედარებისთვის, კატეგორიული მონაცემები არის თვისებრივი მონაცემების ტიპები.
რატომ არის საჭირო მონაცემთა დაშიფვრა?
დაშიფვრა ინახავს თქვენს მონაცემებს უსაფრთხოდ, რადგან ფაილები არ იკითხება, თუ არ გაქვთ წვდომა იმ ალგორითმებზე, რომლებიც გამოიყენებოდა მისი კოდირებისთვის. … ვინაიდან დაშიფრული მონაცემები უფრო მცირე ზომისაა, თქვენ უნდა შეძლოთ სივრცის დაზოგვა თქვენს შესანახ მოწყობილობებზე. ეს იდეალურია, თუ თქვენ გაქვთ დიდი რაოდენობით მონაცემები, რომლებიც საჭიროებს დაარქივებას.
რა არის კოდირების მაგალითი?
დაშიფვრა არის პროცესი აზრების კომუნიკაციად გადაქცევის ენკოდერი იყენებს 'მედიას' შეტყობინების გასაგზავნად - სატელეფონო ზარს, ელფოსტას, ტექსტურ შეტყობინებას, პირისპირ. შეხვედრა ან სხვა საკომუნიკაციო საშუალება.მაგალითად, თქვენ შეიძლება გააცნობიეროთ, რომ მშიერი ხართ და დაშიფვრეთ შემდეგი შეტყობინება, რომ გაუგზავნოთ თქვენს ოთახში: „მშიერი ვარ.