پروژه خوشه بندی و طبقه بندی رفتار قصد خرید برای مصرف کننده آنلاین در محیط تجارت الکترونیک با تکنیک های داده کاوی و یادگیری ماشین در نرم افزار پایتون(Jupyter Notebook)

350,000 تومان

توضیحات

پروژه خوشه بندی و طبقه بندی رفتار قصد خرید برای مصرف کننده آنلاین در محیط تجارت الکترونیک با تکنیک های داده کاوی و یادگیری ماشین در نرم افزار پایتون(Jupyter Notebook)

 

خرید آنلاین و تجارت الکترونیکی واقعیتی است که اخیرا توجه زیادی را به خود جلب کرده است. با نگاهی دقیق به رشد سریع تجارت الکترونیکی می توان گفت هنوز پتانسیل زیادی در بازار برای خرید آنلاین وجود دارد که فواید آن را به عنوان یک روند در حال رشد در بین مصرف کنندگان به وضوح نشان می دهد. محبوبیت خرید آنلاین باعث افزایش علاقه خرده فروشان برای هدف قراردادن این نوع از کسب و کار شده است. محیط تجارت الکترونیک که مبتنی بر اینترنت است، این امکان را به مشتریان می دهد تا برای جستجوی اطلاعات و خرید کالا و خدمات از طریق ارتباط مستقیم با فروشگاه های اینترنتی اقدام کنند. باید خاطرنشان کرد که خرید به صورت اینترنتی بر اساس تجربه واقعی از خرید کالا نیست، بلکه بر اساس ظواهری مانند تصویر، شکل، اطلاعات کیفی و تبلیغات از کالا استوار است. در این محیط ما به دنبال کسب یک بازدهی مناسب و ارائه متد های مختلف برای کمک به این امر می باشیم. هدف نهایی هر کسب و کاری نتیجه بخش بودن آن کسب و کار می باشد و برای این موضوع میتوان با تحلیل رفتار و مدیریت ارتباط با مشتری به نتایج بهتری دست یافت. رفتار مشتری به عادات خرید فرد از جمله روندهای اجتماعی ، الگوهای تناوب و عوامل پیش زمینه تأثیرگذار بر تصمیم آنها برای خرید هر چیزی اشاره دارد. مطالعه رفتار مشتری در هر کسب و کار برای درک مخاطب هدف و ایجاد محصولات ، خدمات و پیشنهاد های جذاب تر خرید ، مورد مطالعه قرار می گیرد. رفتار مشتری توصیف نمی کند که چه کسانی در فروشگاه های شما خرید می کند اما در عوض ، نحوه خرید آنها در فروشگاه های شما را نشان می دهد. این عوامل شامل خرید مشتری ، کالاهایی را که ترجیح می دهند و چگونگی درک بازاریابی ، فروش و ارائه خدمات به مشتری شما را شامل می شود . دانستن این جزئیات به کسب و کارها کمک می کند تا با مشتری به روشی عالی و لذت بخش ارتباط برقرار کنند. تحلیل رفتار مشتری بینش متغیرهای مختلفی را که در مخاطبان تأثیر می گذارد، در بر می گیرد. این ایده در مورد انگیزه ها ، اولویت ها و روش های تصمیم گیری مشتری در نظر گرفته می شود. این تجزیه و تحلیل به ما کمک می کند تا درک کنیم که مشتریان نسبت به شرکت چه احساسی دارند و همچنین اینکه آیا این درک با ارزش های اصلی آنها مطابقت دارد یا خیر. سودآوری و سهم بازار هر کسب و کاری بر پایه میزان مشتری های مربوطه می باشد. فروشندگان همیشه در تلاشند با بررسی رفتار های خرید مشتری و پیش بینی رفتار آنان با ایجاد استرتژی های مختلف به جذب مشتری بپردازند. این موضوع می تواند به بخش های فروش و بازاریابی کمک کند تا بتوانند روابط معنادارتری با مشتریان خود ایجاد کرده و از این طریق به فروش بیشتر که حاصل آن بهره وری بهتر می باشد، برسند.

تجارت الکترونیک:

تجارت الکترونیک که از مزایای گسترش اینترنت می باشد، عبارت است از خرید، فروش و مبادله ی کالا، خدمات و اطلاعات از طریق شبکه های رایانه ای از جمله اینترنت، به عبارت دیگر خرید و فروش از طریق شبکه اینترنت. ریپورت وجاورسکی(۲۰۰۱) نیز با توجه به نقطه ی آغاز و پایان مبادله، ۴ نوع گوناگون تجارت الکترونیکی که شامل مبادله ی شرکت با مشتری (B2C)، مبادله مشتری با شرکت (C2B)، مبادله شرکت با شرکت (B2B) و مبادله مشتری با مشتری (C2C) است را در فضای سایبر شناسایی کرده اند. یکی از انواع پرکاربرد تجارت الکترونیک B2C (شرکت با مشتری) است، در این روش خریدار به طور مستقیم با توزیع کننده از طریق اینترنت وارد معامله می شود. در این نوع از تجارت الکترونیکی مصرف کنندگان اغلب به جمع آوری اطلاعات و یا خرید محصولات و خدماتی چون کتاب، موسیقی، نرم افزارهای رایانه ای، بلیط هواپیما، رزرو هتل و… می پردازند. هم اکنون این روش در کشور ما مورد استفاده قرار می گیرد اما این خدمت هنوز به صورت عامه در میان مردم ما جا نیافتاده است، حتی در میان کاربران حرفه ای اینترنت در ایران استفاده از این روش کمتر مرسوم است. بررسی رفتار مصرف کننده و شناخت عوامل اصلی که بر انجام خرید از طریق اینترنت تأثیر می گذارد، اهمیت حیاتی دارد که برای شرکت های فعال در امر تجارت الکترونیک، گامی در نیل به موفقیت به شمار می رود.

رشد سریع اینترنت، مکان های جدیدی را برای تجارت و بازاریابی محصولات و خدمات ایجاد کرده و باعث شکل گیری تجارت الکترونیک شده است و واسطه ی معاملات نسبت به قبل در دسترس تر و ارزان تر گشته اند. در بین انواع تجارت الکترونیک، B2C بیشترین توجه را امروزه به خود جلب کرده است. على رغم رشد سریع تجارت الکترونیک B2C، تعداد زیادی از استفاده کنندگان از اینترنت هنوز خرید روی اینترنت را تجربه نکرده اند یا تعدادی از آن ها خرید الکترونیکی را قبل لذت نمی برند، زیرا تعامل مشتریان با فروشندگان لذت بخش نیست. تجارت الکترونیک B2C هم برای مشتریان هم برای شرکت ها مزایای زیادی دارد و از طرفی آن را یک فناوری غیرعادی تلقی می کنند. طبق آخرین آمارهای منتشر شده به طور متوسط در هر ۹ دقیقه یک حوزه اینترنتی به شبکه های آنلاین اضافه و هر ماه بالغ بر 23500 سایت به شبکه جهانی اینترنت اضافه می گردد.

قصد خرید آنلاین:

رفتاری منجر به رفتار واقعی می شود و به صورت قصد به انجام یک رفتار تعریف می گردد. مثلا در رابطه با تکنولوژی اطلاعات، می توانیم یک قصد رفتاری را قصد خرید آنلاین تعریف کنیم. قصد خرید آنلاین به عنوان قصد موردانتظار آن ها به ایجاد یک خرید آنلاین در آینده تعریف می شود.

رفتار مصرف کننده:

رفتار مصرف کننده شامل مجموعه فعالیت هایی است که مستقیما در جهت کسب، مصرف و دور انداختن کالا و خدمات صورت می پذیرد. این فعالیت ها شامل فرآیند تصمیماتی است که قبل از خرید و بعد از مصرف انجام می گیرد. همچنین رفتار مصرف کننده به عنوان مطالعه واحدهای خرید و فرآیندهای مبادله که شامل اکتساب، مصرف و کنارگذاری کالا، خدمات، تجارب و ایده ها است، تعریف می شود. کنارگذاری مرحله ای است که طی آن مصرف کننده تصمیم می گیرد تا بعد از استفاده از محصول چه کاری با آن انجام دهد. به علاوه این مرحله میزان رضایتی که مصرف کنندگان بعد از خرید کالا یا خدمت تجربه کردند را نشان می دهد. در هنگام مصرف و پس از مصرف یک کالا یا خدمت، احساس رضایت یا نارضایتی در مشتری ایجاد می گردد. در مبحث رفتار مصرف کننده سه دیدگاه(نگرش) اصلی مطرح است که رضایت مشتری از منظر هریک از این دیدگاهها بدین شرح است: طبق دیدگاه عقلانی(شناختی)، رضایت مشتری نتیجه تفاوت بین برداشت عقلایی مشتری از عملکرد مجموعه مشخصه های محصول یا خدمت و وضعیت مورد انتظار از این مشخصه ها است. از جنبه دیدگاه احساسی، رضایت مشتری بر مبنای نیازهای ذهنی احساس شده و خواسته ها و تجارب یادگیری های مشتری ارزیابی می گردد. نهایتا سومین دیدگاه یعنی دیدگاه ارتباطی و رفتاری، از یک سو پیامدهای رضایت مشتری(مثل رفتار شکایتی و وفاداری مشتری) را مورد توجه قرار می دهد و از سوی دیگر مبتنی بر تغییرات رضایت مشتری است.

رفتار مصرف کننده آنلاین:

رفتار مصرف کننده آنلاین مطالعه فرآیندهایی را در برمی گیرد که در آن افراد یا گروه ها از کالاهای خدمات و ایده ها به منظور ایجاد رضایت و تأمین نیازها و خواسته ها استفاده کنند. به منظور تحلیل تمایلات خرید آنلاین، چن و چانگ بر روی پنج عامل مهم که تمایلات خرید آنلاین را توصیف می کند، تمرکز کردند: ویژگی های فرد مصرف کننده، تأثیرات محیطی، ویژگی های محصول اخدمت، ویژگی های رسانه و ویژگی های واسطه. آنها روابط میان این پنج عامل و سه گام کلیدی لازم برای تشویق خرید آنلاین تکرار شونده را ساختند.

شرح پروژه:

در این پروژه خوشه بندی و طبقه بندی رفتار قصد خرید برای مصرف کننده آنلاین در محیط تجارت الکترونیک با تکنیک های داده کاوی و یادگیری ماشین در نرم افزار پایتون(Jupyter Notebook) انجام شده است. برای این منظور از تکنیک های مختلف خوشه بندی مانند k-means و الگوریتم های دسته بندی مانند درخت تصمیم، جنگل تصادفی، رگرسیون لجستیک، ماشین بردار پشتیبان استفاده شده است.

مجموعه داده:

در مجموعه داده طبقه بندی و پیش بینی قصد خرید مصرف کنندگان آنلاین صورت گرفته است. مدل قصد خرید به صورت یک مسئله دسته بندی باینری طراحی شده است بطوریکه قصد کاربر برای نهایی کردن تراکنش را مورد سنجش قرار می دهد. ویژگی های عددی و غیرعددی(کیفی) مورد استفاده در مدل پیش بینی قصد خرید در جداول زیر توصیف شده است.

جدول ویژگی های عددی مورد استفاده در مدل رفتار کاربر.

 

جدول ویژگی های غیرعددی(کیفی) در مدل رفتار کاربر.

 

در این مجموعه داده شامل 10 ویژگی عددی و 8 ویژگی غیرعددی(کیفی) است. ویژگی درآمد(Revenue) بیانگر برچسب کلاس است که نشان می دهد آیا بازدید از یک وبسایت با تراکنش نهایی شده است یا نه. ویژگی های Administrative، Administrative Duration، Informational، Informational Duration، Product Related و Product Related Duration بیانگر صفحات گوناگون بازدیدشده توسط بازدیدکننده در یک جلسه(session) و زمان سپری شده کلی در هریک از این دسته صفحات می باشد. مقادیر این ویژگی‌ها از اطلاعات URL صفحات بازدیدشده توسط کاربر بدست آمده است و در زمان واقعی که یک مصرف کننده اقدامی انجام می دهد مثلاً از یک صفحه به صفحه دیگر می رود به روزرسانی می شود. ویژگی های بانس ریت یا نرخ پرش( Bounce Rate)، نرخ خروج( Exit Rate ) و  ارزش صفحه(Page Value) بیانگر معیارهای اندازه گیری شده توسط گوگل آنالایتیک Google Analytics برای هر صفحه در وبسایت می باشد. ویژگی نرخ پرش یا بانس ریت( Bounce Rate ) که برحسب درصد نوشته می شود درواقع بیانگر درصد افرادی است که پس از وارد شدن به سایت و مشاهده صفحه فرود (Landing Page)  از آن وب سایت خارج شده اند و صفحات دیگر سایت را باز نکرده اند. وقتی در مورد نرخ پرش صحبت می‌کنیم، عبارت دیگری مطرح می‌شود و آن نرخ خروج (exit rate) است. تفاوت بین نرخ پرش و نرخ خروج گاهی به درستی درک نمی‌شود زیرا این دو تا حدی مشابه یکدیگر هستند. اگر نرخ پرش، تعداد بازدیدهای تک-تعاملی با یک صفحه وب باشد، نرخ خروج، تعداد افرادی است که یک صفحه خاص را ترک می‌کنند، حتی اگر اصلاً در ابتدا وارد آن نشده باشند. به عنوان مثال اگر یک شخص روی صفحه 1 از وبسایت شما فرود بیاید و کلید برگشت به عقب مرورگر را در صفحه مربوطه فشار دهد، این یک پرش محاسبه می‌شود. اما اگر روی صفحه 1 فرود بیاید، به صفحه 2 برود و سپس مرورگر را ببندد یا به سایت دیگری برود، این به عنوان یک خروج برای صفحه 2 در نظر گرفته می‌شود. چون او از صفحه 1 به صفحه دیگری کلیک کرده ‌است نمی‌توان آن را پرش تلقی کرد. در مورد صفحه 2 هم صدق می‌کند زیرا این اولین صفحه‌ای نیست که او روی آن فرود آمده است. از جنبه تحلیل، پرش می‌تواند نشان‌دهنده عدم علاقه به یک سایت باشد. اما نرخ خروج بالا می‌تواند نشان از وجود مشکلاتی در فرایند تبدیل کاربر به مشتری خبر دهد. اگرچه ممکن است شخصی علاقه کافی به سایت شما نشان داده و بیش از چند صفحه را بازدید کرده باشد اما در نهایت به موتور جستجو برمی‌گردد تا پاسخ سوالش را بیابد. مقدار ویژگی نرخ خروج برای یک صفحه وب خاص، برای تمامی مرورهای صفحه محاسبه می شود، که درصد آن در آخرین سشن(session) یا مراجعه است. سشن مجموعه‌ای از فعالیت‌های یک کاربر در سایت شماست که در یک بازه‌ی زمانی مشخص انجام می‌شود. هر فعالیتی که یک کاربر در سایت انجام می‌دهد، در ظرف یک سشن (مراجعه) می‌گنجد. به عنوان مثال، یک سشن می‌تواند شامل بازدید از ۵ صفحه‌ سایت، مقایسه‌ دو کالا و خرید یک محصول باشد. هر بار که شخصی وارد سایت شما می‌شود، به تعداد کاربران (Users) یک واحد افزوده می‌گردد اما در صورتی که یک کاربر در بازه‌ی زمانی تعریف شده، چندین بار وارد سایت شود، باز هم همان یک واحد به تعداد کاربران اضافه می‌گردد. بنابراین شاخص تعداد کاربران (Users) اطلاعاتی درباره‌ی تعداد دفعاتی که هر کاربر به سایت شما مراجعه کرده است، ارائه نمی‌کند. این در صورتی است که کاربران با هر مراجعه به وب‌سایت، یک واحد به شاخص تعداد مراجعات (Sessions)  اضافه می‌کنند.

ویژگی ارزش صفحات(Page Value) بیانگر ارزش میانگین برای یک صفحه وب است که کاربر قبل از تکمیل تراکنش الکترونیکی از آن صفحه بازدید می کند. Page Value  یا ارزش نسبی هر صفحه، به بهبود عمکلرد شما در بازاریابی کمک می‌کند. همانطور که می‌دانید تمامی پست‌ها و صفحات شما از نظر محبوبیت و تاثیر در جایگاه یکسانی قرار ندارند. ممکن است فقط تعدادی از این صفحات برای مخاطبین جذابیت داشته باشند. با محاسبه Page Value در گوگل آنالیتیکس شما می‌توانید صفحاتی که بازدید و بازخورد بیشتری دارند را تشخیص دهید و روی درآمدزایی از این صفحات تمرکز کنید، یا در آینده از روش‌های مشابهی استفاده کنید. همچنین می‌توانید صفحاتی که شکست خورده‌اند را شناسایی کنید و به دنبال راه حلی برای بهبود وضعیت آن‌ها بگردید. ویژگی روز خاص(Special Day) بیانگر نزدیکی زمان بازدید وبسایت به یک روز یا رویداد خاص(مثلاً روز مادر، روز ولنتاین) است که در آن مراجعات به سایت به احتمال بیشتری به تراکنش از آن نهایی می شود. مقدار این ویژگی باتوجه به پویایی تجارت الکترونیک مانند مدت زمان بین تاریخ سفارش و تاریخ تحویل تعیین می شود. برای مثال برای روز ولنتاین، مقدار این ویژگی یک مقدار غیرصفر بین 2 فوریه و 12 فوریه است، و قبل و بعد از این تاریخ مقداری صفر دارد مگر اینکه تاریخ آن به روز یا رویداد خاص دیگری نزدیک باشد، و ماکزیمم مقدار آن در تاریخ 8 فوریه برابر 1 است. همچنین این مجموعه داده شامل ویژگی های سیستم عامل(operating system)، مرورگر(browser)، منطقه(region)، نوع ترافیک(traffic type)، نوع بازدیدکننده به صورت بازدیدکننده مکرر یا بازدیدکننده جدید است.

 

نمونه نتایج: