در این پروژه، دو پایگاه دادهی تایتانیک و iris با روشهای رگرسیون خطی، k نزدیکترین همسایگی، درخت تصمیم و جنگل تصادفی طبقهبندی میشود. گزارش این پروژه به معرفی دو پایگاهداده و روشهای بالا میپردازد. جزئیات به خوبی در این گزارش بیان شده است. شما میتوانید از آن برای مطالعه و یا پروژهی درسی استفاده کنید. بخشی از گزارش در ادامه ارایه شده است. (فرمت:pdf ، تعداد صفحه: 13) لینک دانلود پایگاه داده iris پایگاه داده titanic ...
این پروژه به پیاده سازی طبقه بند بیزین بر روی پایگاه داده ی Iris ( موجود در متلب و سایت UCI Machine Learning Repository ) خواهد پرداخت. این پایگاه داده 4 ویژگی از 3 نوع گل به نام های setosa،versicolor و virginica را شامل می شود. 4 ویژگی استفاده شده عبارت اند از طول و عرض گلبرگ و طول و عرض کاسه برگ. از هر نوع نوع گل50 نمونه وجود دارد بنابراین داده های این مجموعه را می توان شامل 150 مشاهده دانست که هر کدام از مشاهدات شامل 4 ویژگی می باشند. با توجه به تعداد پایگاه داده، کد به دو فولدر تقسیم شده است. در هر فولدر نیز، دو کد وجود دارد. در کد شماره 1 از تمام دادهها برای طبقهبند بیزین استفاده شده است. اما در کد دوم 80 درصد داده برای آموزش و 20 درصد برای تست هستند. نتیجهی نهایی طبقهبندی در فایل Accuracy قرار دارد. توزیع درنظر گرفته شده برای داده، توزیع گوسی است (رایج ترین نوع توزیع). ...