مقاله کامل قیمت‌گذاری ‌بهینه‌ بیمه‌نامه ‌با ‌استفاده‌ از‌ روش های‌ داده‌کاوی‌

قیمت‌گذاری‌ بهینه‌ بیمه‌نامه‌ با‌ استفاده‌ از‌ روشهای‌ داده‌ کاوی‌
چکیده
صنعت بیمه یکی از بخش های حیاتی اقتصاد در هر کشوری است، به این دلیل که در حفظ و تضمین سرمایه نقش مهمی ایفا می کند. یکی از مسائلی که در بیمه از اهمیت بسیاری برخوردار است، دستیابی به رشد بازار و سودآوری است. تنظیم سطح قیمت متناسب با هزینه ها و هم زمان با آن حفظ مشتری موجود و جذب مشتریان جدید مسئله ای است که در صنعت بیمه همچون دیگر صنایع باید به آن توجه شود. شرکتهای بیمهای نیازمند استفاده از فناوری-هایی هستند که بر مبنای آن بتوانند داده‌ها را تبدیل به اطلاعات نمایند. یکی از انواع فناوری های اطلاعات قابل استفاده در خدمات بیمه ای، استفاده از فنون داده کاوی است. در این مقاله سعی شده است مروری بر پژوهش های کاربردی در حوزه بیمه که منجر به ارائه یک راه حل برای قیمتگذاری بهینه شده اند، صورت گیرد که راهنمایی برای محققان و مدیران این حوزه باشد. بر همین اساس پس از جست وجوی مقالات بیمه ای با رویکرد داده کاوی در پایگاه های علمی معتبر حدود 2 مقاله مطالعه شد. درنهایت روش های مورداستفاده در این مطالعات استخراج و دستهبندی شد.
کلمات‌کلیدی: صنعت بیمه، دادهکاوی، قیمت تمام شده، قیمتگذاری بهینه، اشتراک دانش
مقدمه‌
صنعت بیمه یک منبع با حجم زیاد مشکلات کسب وکار است که همواره موردتوجه محققان عملیاتی قرار میگیرد که در مسائلی نظیر قیمتگذاری میتواند با استفاده از فن های پژوهش عملیاتی سنتی ازجمله رگرسیون، برنامه ریزی آرمانی، برنامه ریزی خطی و رویکردهای جدید از قبیل
شبکههای عصبی، سامانه های خبره و داده‌کاوی حل شود(2002 ,(Smith et al.. بااین حال، شرکتهای بیمه در سازگاری با ابزارهای داده‌کاوی نسبتاً کند بودهاند که عمدتاً به علت عدم رقابت ناشی از مقررات محافظتی است؛ اما اکنون، آن ها دیگر نمیتوانند این موضوع را نادیده بگیرند که مواردی از قبیل اینترنت، مقررات زدایی، تثبیت و همگرایی بیمه با سایر خدمات مالی، به سرعت ساختار اصلی صنعت را تغییر میدهد (Sumathi and Sivanandam, 2006).
برای تعیین حق بیمه دقیق سالیانه در شرکت بیمه، تخمین دقیق و قابل اعتماد بسیار مهم است. یکی از ابزارهایی که میتواند به بیمهگر کمک کند داده‌کاوی است. داده‌کاوی مجموعهای از الگوریتمها است که به سازمانها کمک میکند تا بر مهم ترین اطلاعات و دانش موجود در پایگاههای داده خود تمرکز کنند. جکسون در تعریف داده‌کاوی دو روش متفاوت در انجام داده‌کاوی بیان میکند که طی آن یا به دنبال ساخت مدل و یا یافتن الگو از میان دادهها است. در رویکرد اول استخراج مدل از میان مجموعه داده‌ها برای شناسایی و توصیف ویژگیهای اصلی توزیع داده‌ها انجام میشود. به عبارت دیگر به دنبال نشان دادن روابط است. دومین رویکرد دادهکاوی، برای شناسایی الگوهای غیرمعمول رفتار از میان قوانین به کار میرود (2002 ,(Smith et al..
در رویکرد پژوهشی پیش رو از یافته های پژوهش های قبلی برای پیشنهاد راهکارهای مفید استفاده می شود. در این مقاله تلاش بر آن بوده که مطالعات برحسب کاربردهای داده کاوی توصیف و در اختیار خواننده قرار بگیرد.
ازاین رو پژوهش های مطالعه شده بر اساس کاربردهای داده کاوی در بیمه به جهت قیمتگذاری ارائه شده اند.‌در ادامه سعی بر آن شده است که ادبیات موجود در پایگاه های علمی گوناگون از قبیل Science ، Emerald، ScopusGoogle Scholar،
IEEE، Direct موردبررسی قرارگرفته و پژوهش های مرتبط قیمتگذاری در بیمه با رویکرد داده کاوی استخراج شود.
روش‌تحقیق‌
پژوهش حاضر به بررسی مطالعات موجود در حوزه تعیین حق بیمه مطلوب با رویکرد داده کاوی است، به گونه ای که بتواند جنبه های مختلف مؤثر بر قیمت گذاری در بیمه را ارائه بدهد. بنابراین رویکرد این پژوهش کاربردی توصیفی است. این پژوهش کاربردی است زیرا توسعه کاربرد دانش در یک حوزه خاص را بیان می کند. همچنین توصیفی است به این لحاظ که توصیف نتایج پژوهش صرفاً به بازنمود مسئله تحقیق می پردازد و به دنبال تحلیل محتوای مقاله های یافت شده است.
در این پژوهش، برخی مقاله های موجود در قیمتگذاری بیمه با رویکرد داده کاوی مطالعه شد. نتایج حاصل از این مقالات، دسته بندی شده و اطلاعات آنان ارائه می شود. درنهایت روند انجام پروژه طبق فلوچارت زیر رسم شده است.
روش‌های‌مختلف‌قیمت‌گذاری‌
با پیشرفت تکنولوژی توقع مشتریان در خصوص ارائه خدمات مطلوب بالاتر می رود. ارائه این خدمات مستلزم مدیریت درآمدها و هزینه ها است. در روش های کلاسیک قیمت گذاری، حق بیمه بر اساس تعرفه های ثابت و مشخص تعیین می شود. طبق پژوهشهای بررسی شده روش های مختلف داده‌کاوی برای تعیین حق بیمه مناسب در جهت جذب و حفظ مشتری در بیمه می تواند مؤثر باشد. در این بخش پژوهش هایی باهدف تعیین حق بیمه مناسب در جهت حفظ مشتریان با استفاده از الگوریتم های داده‌کاوی موردبررسی قرار خواهند گرفت.
در پژوهشی که توسط سونگ و همکاران در جهت حفظ مشتریان انجام شده، درخت تصمیم گیری و مدل رگرسیون لجستیک را
انتخاب می کند. مدل تولیدشده توسط درخت تصمیم گیری یک ساختار درخت است که میزان مشخصی که هر متغیر بر متغیر هدف اثر می گذارد را پیدا می کند. مدل رگرسیون لجستیک احتمال روی گردانی هر مشتری را محاسبه می کند (Song and Qiuhong, 2018). در مطالعه دوال و کولکارنی بر زمینه های مختلف بیمه عمر تمرکز شده است. در این مطالعه مشتریان طبق اطلاعات موجود خوشه بندی می شوند. قانون انجمن را می توان برای حفظ مشتری های موجود مورداستفاده قرارداد که با بررسی داده های قبلی و پیدا کردن ترکیب های موردنیاز با اطمینان و پشتیبانی، بیمهگر می تواند بیمه نامه های جدید را برای مشتریان موجود برای حفظ آن ها به فروش برساند. طبقه بندی می تواند برای هدف قرار دادن مشتریان و یا طراحی محصولات جدید مورداستفاده قرار گیرد(Kulkarni, R. V., & Devale, 2012). در پژوهش دیگری در مورداستفاده از روش های مدرن داده کاوی (DM) برای طراحی حق بیمه برای وسایل نقلیه موتوری بحث شده است. یک رویکرد دومرحله ای، شامل یک مدل تحلیل بقا و یک مدل رگرسیون خطی، برای برآورد سطح ریسک هر مشتری و ثبت فایل ادعا طراحی شده است.
درنهایت، نتایج حاصل از مدل های تصادف و سرقت برای جمع آوری ادعای کل مورد انتظار برای هر مشتری ترکیب شده است Kahane, Levin, Meiri, & Zahavi, 2007)). در پژوهش ساختیول و راجیتها بیان شده است که برای تعیین حق بیمه دقیق سالیانه در شرکت بیمه، تخمین دقیق و قابل اعتماد از تعداد ادعاهایشان و میزان کل ادعا بسیار مهم است. ازآنجاکه NN ها با استفاده از داده های اولیه موجود آموزش داده می شوند، خطا ممکن است کاهش یابد و همچنین در مقایسه با روش های دیگر برای پیش بینی اهمیت دارد، ANN با روش اعتبار بیزی، یک روش آماری برای پیش بینی
فراوانی ادعای آینده، تطبیق داده شده است. نتایج حاکی از آن است که ANN برآورد قابل توجهی از فرآیند ادعای واقعی را در مقایسه بااعتبار بیزی در مدل پواسون / گاما برای بیمه غیرزندگی فراهم می کند Sakthivel & Rajitha, 2017)). در پژوهش دیوید به منظور ایجاد حق بیمه خالص با توجه به ویژگی های بیمه گذاران بر اساس ضرب فراوانی پیش بینی شده و هزینه ادعا، حق بیمه محاسبه شده است. این مقاله یک تحلیل از مدل های خطی کلی را در نظر می گیرد؛ بنابراین، به عنوان مرحله اول، فراوانی ادعا توسط مدل رگرسیون پواسون برآورد شده است. در مرحله بعدی، با استفاده از مدل گاما، میانگین برآورد هزینه ادعایی مربوط به هر طبقه بیمه شده ها تعیین می شود David, 2015)). شن و همکاران تمرکز خود را بر بیمه محصولات کشاورزی معطوف کرده اند. یک چارچوب آماری در برآورد بیزی را ارائه کرده اند که اجازه می دهد تا ترکیب صریح از اطلاعات پیشین، مشاهدات محصول و نظرات کارشناسان باشد. وابستگی احتمالی ناحیه تولید در مناطق مختلف توسط یک واین کاپیولا گرفته شده است که قادر به ساخت ساختار وابسته به ابعاد بزرگ است (Shen, Odening and Okhrin, 2013). در پژوهشی دیگر مسئله ای موردتوجه قرار می گیرد که قیمت گذاری مناسب بیمه نامه است. بیمه های خودرو باید با استفاده از روش های Tweedie و ZAIG برآورد میزان ادعای کل را در نظر بگیرند. این سیستم نمره دهی شناساننده افرادی است که بیش ترین ریسک رادارند؛ بنابراین این مدل های برآورد شده ممکن است برای توسعه یک استراتژی برای قیمت گذاری حق بیمه استفاده شود (1102 ,(Bortoluzzo et al.. در پژوهش کیچن و هریس بیان می شود در بیمه، مهم ترین ملاحظات در قیمت گذاری بیمه گذار عبارت اند از: فراوانی خسارت و شدت خسارت )احتمال از دست
دادن و ارزش مالی از دست دادن(؛ بنابراین شبکه های عصبی مصنوعی و رگرسیون خطی را برای بیمه نامه های خصوصی اتومبیل های مسافری در یک رویه سه مرحله ای توسعه داده است (1102 ,(Bortoluzzo et al..
در پژوهشی که توسط بییان و همکاران انجام شده است، مدل قیمت گذاری بیمه خودرو مبتنی بر رفتار2(BVIP) و یک نمونه اولیه محاسبه حق بیمه خودرو برای بیمه خودرو شخص توسعه داده شده است (8102 ,(Bian et al.. مقاله گولمن تئوری بوستینگ گرادیان (GB) و کاربرد آن را در مسئله پیش بینی هزینه اتلاف تصادفات خودرو “مقصر” با استفاده از داده های یک بیمهگر کانادایی ارائه می دهد. دقت پیش بینی مدل در مقایسه با مدل خطی معمولی )GLM( مقایسه شده است .(Guelman, 2012) پرداخت بیمه به ازای میزان رانندگی روشی است که در برخی کشورها جهت محاسبه قیمت بیمه خودرو مورداستفاده قرار می گیرد. پژوهش فریرا و مینیکل از مدلهای پواسون و رگرسیون خطی برای تحلیل روابط بین متغیرها در این حالت استفاده کردند. یک طرح قیمت گذاری احتمالی م یتواند نرخ بیمه را به طور کامل به ازای هر مایل با هیچ هزینه ای سالیانه داشته باشد (Ferreira and Minikel, 2012(. مطالعه ییپ و یوان استفاده از توجیه شمارش ادعای مجموعه داده های بیمه اتومبیل، بر اساس مسئله -zeroinflation را پیشنهاد می کند که از چندین مدل zero-inflation استفاده شود. بر اساس یافته ها، مدل توزیع دوتایی منفی (NB) و مدلهای رگرسیون zero-inflated با توجه به داده های بیمه در اتومبیل مناسب است. مدل رگرسیون ZIDP بهترین شیوه برای داده‌ها را فراهم می آورد. در این مدل بخش پواسون در ZIP با استفاده از توزیع GP، NB و DP اصلاحشده است (Yip and Yau, 2005). در
پژوهش یونس و همکاران دودسته ادعا در نظر گرفتهشده است، یعنی آسیب دارایی شخص ثالث (TPPD) و آسیب شخصی (OD). دو مدل، یعنی فراوانی ادعا و شدت ادعا بر روی دودسته ادعاهای TPPD و OD مورد آزمایش قرار گرفتند. توسعه مدل شبکه عصبی بازگشت به عقب (BPNN) با استفاده از آزمون وخطا باهدف به دست آوردن بهترین نتیجه پیش بینی برای فراوانی ادعا و شدت ادعا آزمون می شود (6102 ,(Yunos et al.. در پژوهش لیو و همکاران بیان می کنند که الگوریتم آدابوست، یک روش پیش بینی محبوب و مؤثر برای پیش بینی فراوانی ادعای بیمه خودرو، نقش مهمی در شرکت های بیمه اموال دارد (Liu, Wang and Lv, 2014). در سنجش رابطه هزینه به عنوان متغیر پیوسته وابسته و سایر متغیرها در پژوهش هو و همکاران یک الگوریتم پیشنهاد می شود که به طور پویا برچسب مستمر در هر گره در طی روند القایی درخت را تشریح می کند. آزمایش های گسترده نشان می دهد که روش پیشنهادی از رویکرد پیش پردازش، رویکرد درخت رگرسیون و چندین الگوریتم مبتنی بر غیر درخت استفاده می کند. هدف در این مقاله توسعه یک الگوریتم نوآورانه DT، یعنی طبقه بندی کننده با برچسب مستمر (CLC)، برای انجام طبقه بندی بر روی برچسب های پیوسته عنوان شده است (Hu, Chen and Tang, 2009). طبق پژوهش چادو و همکاران فرضیه اساسی مدل پواسون کلاسیک لاندبرگ برای ارزیابی خسارات کلی در یک نمونه بیمه، استقلال بین وقوع یک ادعا و اندازه ادعای آن است.
یک مدل رگرسیون مشترک با یک گاما GLM حاشیه ای برای متغیر پیوسته از متوسط اندازه ادعا و یک GLM پواسون حاشیه ای برای متغیر گسسته برای تعداد ادعا ایجاد کرده است. GLM ها به وسیله رویکرد ترکیبی ارتباطی با یک
قاعده گاوسی ترکیب شده اند که دارای یک پارامتر برای ساختار وابستگی است (Czado et al, 2012). فریز و والدز طی پژوهشی مدل سازی دقیق و جزئی آماری رکورد بیمه های خودرو را توصیف می کنند. آن ها یک مدل سلسله مراتبی را برای سه جزء پیشنهاد می کنند که مربوط به فراوانی، نوع و شدت ادعا می شود. مدل اول، یک مدل رگرسیون دوجانبه منفی برای ارزیابی فراوانی ادعا است. دومین مدل لوجیت چندجمله ای برای پیشبینی نوع ادعای بیمه است. مدل سوم برای جزء شدت است. در اینجا از بتا تعمیم یافته نوع دوم توزیع دم طولانی برای مقادیر ادعا استفاده و متغیرهای پیش بینی را نیز ترکیب می کند. وابستگی معنی دار میان انواع ادعاهای مختلف را با استفاده از T-copula اندازه گیری می کند. از توزیع GB2 برای جا دادن ماهیت دم طولانی ادعاها استفاده شده است (Frees and Valdez, 2008).
یانگ و همکاران یک الگوریتم بوستینگ درخت گرادیانت برای پیش بینی را پیشنهاد می دهند و آن را برای مدل های پواسون ترکیبی تودی برای حق بیمه های خالص اعمال می کنند (Yang, Qian and Zou, 2018). گیلنکو و میرونوا عوامل فاجعه ای که تأثیر بسزایی در فراوانی ادعا و شدت ادعا در بیمه آسیب خودرو روسیه دارد را برای ارزیابی کار آیی مجموعه عوامل موجود مورداستفاده برای محاسبه های تعرفه بیمه مدرن، تحلیل می کنند. دو مدل اصلی مدل hurdle سنتی و GLM با توزیع گاما )مدل توزیع GLM-Gamma برای سادگی نامیده می شود( این مطالعه را تشکیل می دهند (Gilenko and Mironova, 2017). تاکوچی و همکاران در پژوهش خود بیان می کنند که روش های رگرسیونی باثبات سنتی فرض می کنند که توزیع نویز متقارن است و این به معنای نادیده گرفتن تأثیر نقاط پرت است. وقتی توزیع نویز نامتقارن است، این روش ها برآوردگرهای رگرسیون بایاس را منجر می
شود. درنتیجه با توجه به مشکلات داده کاوی در زمینه صنعت بیمه، یک رویکرد جدید برای رگرسیون باثبات برای مقابله با توزیع نویز نامتقارن پیشنهاد می دهند که می توان آن را به هر دو رگرسیون خطی و غیرخطی اعمال کرد (Takeuchi, Bengio and Kanamori, 2002). اسمیت و همکاران در پژوهشی به حفظ مشتری و تعیین سطح قیمت پرداخته اند. این پژوهش به سه بخش اصلی تقسیم شده است. طی بخش اول برای تجزیه وتحلیل داده ها رگرسیون، درخت تصمیم و شبکه عصبی باهم مقایسه شده اند. درنتیجه آن شبکه عصبی بهترین نتایج را برای طبقه بندی بیمه نامه ها به عنوان احتمال اتمام یا ادامه قرارداد به دست می دهد. ازآنجایی که قیمت گذاری بر اساس میزان ریسک پذیری دارندگان بیمه نامه صورت می گیرد بنابراین در مرحله دوم گروه های ریسک پذیر با استفاده از الگوریتم های خوشه بندی مشخص شدند. برای اینکه سودآوری هر خوشه موردبررسی قرار بگیرد، شاخص های عملکرد کلیدی با عنوان نسبت هزینه و نسبت تکرار برای هر خوشه بررسی شده و گروه های با نرخ هزینه های بالا و غیرقابل قبول )سودآوری پایین( در این روش شناسایی می شوند. درنهایت، نتایج حاصل از این دو تحلیل در یک چارچوب برای تعیین قیمت حق بیمه بهینه برای یک بیمه نامه منحصربه فرد ترکیب خواهد شد (Smith, Willis and Brooks, 2000). شاخص کلیدی نسبت هزینه در اینجا هزینه های ادعای خسارت دارنده بیمه نامه را نسبت به حق بیمه پرداخت شده می سنجد. همچنین شاخص کلیدی نرخ تکرار، میزان نسبت تعداد ادعا به تعداد واحدهای بیمه نامه را اندازه گیری می کند. در مقاله دوم که اسمیت و همکاران در سال منتشر کردند، گام سوم این پژوهش یعنی ارائه یک چارچوب برای تعیین حق بیمه بهینه انجام شد. طی مقاله دوم سعی بر آن شده که
درآمد بدون تأثیر نرخ فسخ بیمه نامه و سهم بازار افزایش یابد. طی این مقاله ترکیب بهینه دارندگان بیمه نامه برای تعیین نرخ فسخ به وسیله برنامه ریزی عدد صحیح غیرخطی بر اساس تئوری پورتفولیو مارکوویتز تع یینشده است (2002 ,(Smith et al.. پژوهش دیگری که در جهت حفظ مشتری و مدیریت ارتباط با مشتری (CRM) انجامشده است. خوشه بندی دومرحلهای یک فرم تجزیه خوشهای را فراهم می کند. این می تواند برای خوشه بندی مجموعه داده‌ها به گروه های متمایز زمانی که ما در ابتدا نمی دانیم که چه کسانی هستند، مورداستفاده قرار گیرد.
تجز یهوتحلیل خوشهای دومرحله ای نشان می دهد که چهار گروه وجود دارد که با معیار اطلاعات Bayesian توسعه داده شده اند. بعدها از روش تصم یمگیری درخت با استراتژی CHAID برای شناسایی نمایه مشتری استفاده نمودند. در مرحله بعدی ارتباط بین رضایت مشتری و کد مؤلفه برای شناسایی بیمه نامه های نامطمئن در بازار بکار رفت(2011(Bhatnagar, Ranjan and Singh,. در پژوهش دیگری پیش بینی رویگردانی، حفظ و دگر فروشی بر اساس پیشنهاد قیمت های2 آنلاین از یک وب سایت بیمه گر در شرایط خدمت به عنوان یک رویداد هدف ارزیابی شده است. بر اساس چنین نمونه هایی، یک مدل طبقه بندی تصادفی جنگل را برای پیشبینی فعالیت های خرید استفاده می کنند (Mau, Pletikosa and Wagner, 2018). مقاله آنتنیو و ولیدز یک مقاله پژوهشی در مورد ابزارهای آماری برای طبقه بندی خطر مورداستفاده در بیمه است. در انتخاب متغیرهای رتبه بندی برای اهداف طبقهبندی خطر، ابزار آماری اولیه درون مدلهای رگرسیون قرار میگیرند (Antonio and Valdez, 2012).
بحث و یافتهها

فایل : 21 صفحه

فرمت : Word

دیدگاهتان را بنویسید لغو پاسخ

کاربر گرامی، در این وب سایت تا حد امکان سعی کرده ایم تمام مقالات را با نام پدیدآورندگان آن منتشر کنیم، لذا خواهشمندیم در صورتی که به هر دلیلی تمایلی به انتشار مقاله خود در ارتیکل فارسی را ندارید با ما در تماس باشید تا در اسرع وقت نسبت به پیگیری موضوع اقدام کنیم.