یادگیری درخت تصمیم گیری، Learning Decision Tree
اخیراً به لطف دکتر مهدی قاسمی، در حضور در کلاس هوش مصنوعی ایشان به عنوان مستمع آزاد، یک ارائه ای در این کلاس داشتم در مورد درخت تصمیم گیری، که در این پست محتوای اسلایدهایم را برایتان می گذارم.
همچنین لینک دانلود نرم افزاری که در کلاس در این مورد ارائه کردم هم در انتهای پست قرار دادم.
اما درخت تصمیم گیری ....
درخت تصمیم یکی از ابزارهای متداول برای دسته بندی و پیش بینی است. تولید یک درخت تصمیم روش کار آمدی برای ایجاد رده بندها یا طبقه بندی کننده ها بر روی داده هاست. این درخت با بکارگیری یک استراتژی بالا به پایین به ایجاد آزمون بر روی هر گره میپردازد. با توجه به ساختار بالا به پایین درخت تصمیم اولین آزمون در گره ریشه که بالاترین گره در درخت است اتفاق می افتد به این صورت که یک رکورد جدید که برچسب کلاس آن نامشخص است در گره ریشه وارد میشود و در این گره یک آزمون صورت میگیرد تا معلوم شود که این رکورد به کدام یک از گره های فرزند تعلق دارد. این فرایند انقدر ادامه پیدا میکند تا رکورد جدید به گره ی برگ برسد. هر گره ی برگ در درخت تصمیم معرف یک برچسب کلاس یا یک دسته ی مشخص میباشد، بنابراین تمام رکورد هایی که به یک برگ از درخت میرسند در یک دسته قرار میگیرند. نمونه ای از درخت تصمیم را در شکل زیر مشاهده می کنید.
درخت تصمیم در شکل بالا مفهوم خرید رایانه را نشان میدهد، اینکه آیا یک مشتری در یک فروشگاه محصولات رایانه ای علاقه مند به خرید کامپیوتر است یا خیر؟
همانطور که در شکل دیده میشود این درخت دارای دو برچسب کلاس متمایز yes و no در برگهای خود می باشد.
روشهای متفاوتی برای ایجاد درخت تصمیم وجود دارد. یکی از روش های معمول برای ایجاد درخت روشی است که در آن گره های بالایی به تعدادی زیر گره انشعاب می یابد و هر گره به دو گره ی پایین تر شکسته میشود که اصطلاحاً به آن درخت دودویی میگویند.