فصلنامه علمی

نوع مقاله : مقاله علمی

نویسندگان

1 گروه مهندسی صنایع، دانشکده مهندسی صنایع و سیستمهای مدیریت، دانشگاه صنعتی امیرکبیر، تهران، ایران

2 گروه مهندسی مالی، دانشکده مهندسی صنایع و سیستم‌های مدیریت، دانشگاه صنعتی امیرکبیر، تهران، ایران

چکیده

هدف: امروزه مشتریان به عامل بسیار مهم و حیاتی در هدایت سرمایه­گذاران، تولیدکنندگان و حتی محققان و نوآوران مبدل گشته‌­اند. به همین دلیل، سازمان‌­ها نیاز دارند مشتریان خود را بشناسند و برای آنان برنامه­‌ریزی کنند. در این پژوهش، تلاش شده تا به یکی از اساسی­‌ترین سؤالات سازمان­‌های بیمه‌­ای، یعنی پیش­‌بینی سطح خسارت مشتریان، پاسخ داده شود.
روش تحقیق: در پژوهش حاضر از ابزار داده‌­کاوی برای داده­‌های مشتریان صنعت بیمه، بخش بیمه بدنه خودرو از سال 1394 تا 1396 استفاده شده‌است. تعداد کل داده‌ها که از ابتدا در این پژوهش مورد استفاده قرار می‌گیرد بیش از 19356 بوده که در ادامه و در طی آماده‌سازی آن‌ها با استفاده از نرم‌افزار Rapidminer 7.1 تعداد داده‌هایی که در نرم‌افزار لحاظ می‌شود 19356 است. پس از پردازش اولیه تلاش می‌شود، از بین ۱۵ متغیر موجود در پایگاه داده ویژگی استخراج شود که ملموس باشد و این پژوهش را در هدف خود یاری دهد. بدین منظور با به ­کارگیری خوشه­‌بندی، رانندگان بر اساس میزان مبلغ خسارت به خوشه­‌های مجزا تقسیم می­شوند و ویژگی­‌های هر خوشه بیان می­‌شود. در قسمت خوشه‌­بندی، ابتدا الگوریتم‌های k-means،  k-medoidsو DBSCAN استفاده شده‌­است. سپس الگوریتم‌­های بکار رفته به جهت زمان انجام محاسبات و میزان صحت با یکدیگر مقایسه شدند.
یافته‌ها: در نهایت الگوریتم k-means به عنوان الگوریتم بهینه برای این مجموعه داده انتخاب شد. در انتها به کمک درخت تصمیم مدلی پیش­بینی ارایه می­شود که شرکت­‌های بیمه را در جهت سودآوری بیشتر و کشف مشتریان سودآور کمک می­کند و برای برنامه‌­ریزی و تصمیم‌­گیری­‌های آتی سازمان قابل استفاده‌­است.
نتیجه‌گیری: برای پیش­بینی، درخت تصمیم، با میزان صحت 21/86% بهترین مدلی بود که در این پژوهش به آن رسیدیم و در مدل درخت تصمیم ارایه شده معیار درآمد بیمه­‌گذار به عنوان گره ریشه درنظرگرفته می‌­شود که همین نکته نشان­‌دهنده آن است روش بکار رفته می‌­تواند به شرکت­‌های بیمه کمک کند تا با تمرکز بر مشتریان سودآور به درآمد بیشتری برسند.
 

 

کلیدواژه‌ها

عنوان مقاله [English]

Discovering profitable customers by data mining approach

نویسندگان [English]

  • M. Nezhad-Afrasiabi 1
  • A. Esfahanipour 2
  • A. M. Kimiagari 2

1 Department of Department of Industrial Engineering, Faculty of Industrial Engineering and Management Systems, Amirkabir University of Technology, Tehran, Iran

2 Department of Financial Engineering, Faculty of Industrial Engineering and Management Systems, Amirkabir University of Technology, Tehran, Iran

چکیده [English]

Objective: Today, customers have become a critical factor in directing investors, producers, and even researchers and innovators. For this reason, organizations need to know about their customers and plan for them. Insurance companies and in general the insurance industry in each country, is one of the most important financial institutions active in financial markets, especially the capital market, which in addition to providing security for economic activities, can play a very fundamental role in providing insurance services. In other words, insurance companies play a vital role in the mobility, dynamic of financial markets and the provision of investable funds in economic activities. In this research, it has been attempted to answer one of the most important questions of insurance organizations, namely, predicting the level of customers’ losses and investing on profitable customers.
Methodology: Data mining methods were used to discover knowledge to meet business needs and customer relationship management strategies. In addition, an overview of the various applications of data mining in customer relationship management in various insurance companies has been done. In the model implementation stage, a real data-set is used to evaluate the proposed model. To perform the data mining techniques in the insurance industry as data of customers, the vehicle body insurance from 2015 to 2017 has been under investigation. The total number of data used in this study from the beginning was more than 19,356, which during data preparation using Rapidminer 7.1 software became 19,356. After the initial processing, an attempt is made to extract good features from the 15 variables in the data-set that is tangible and help this research in its goal. As a result, by using clustering, drivers are divided into separate clusters based on the amount of loss, and the characteristics of each cluster are expressed. In the clustering section, three algorithms of data mining are examined. First, k-means, k-medoids, and DBSCAN implemented on data-set. Then, the conclusion of three algorithms compared with each other based on the time of calculation and accuracy.
Finding: Data mining was a good tool in this research, owing to the large volume of data, to discover the needs and identify customers. The data mining technique which was the main approach of this study fully covered the information needs by methods such as classification, prediction and clustering. The k-means algorithm was selected as the most optimal one in time and accuracy. In the following, the implementation of the algorithms in the modeling step, the decision tree algorithm was selected and by the decision tree related to the forecasting model, it can be predicted future customers by what characteristics would be in what category. It will be valuable for the insurance companies. Using a decision tree, a forecasting model is proposed to help insurance companies to identify profitable customers which can be used for future plans of organizations.
Conclusion: The customer plays an important role in today's industry. Through studying the data obtained from customer behavior, appropriate action can be taken for marketing-related planning and customer acquisition. The use of predictive models and preventive roadmaps has always been one of the goals of the tools that various organizations have been looking for. In this research, the insurance industry as one of the most important pillars of economic in developing countries has been chosen. By reviewing the share of the insurance industry in the economy of a developing country, it can be seen that insurance has a significant role compared to other services.  In this study, the role of insurance companies in optimizing the investment process and ways to expand the interaction between insurance examined. Customers can lead to the growth and development of the insurance industry and the capital market and thus the growth and development of the national economy. Therefore, in the implementation of this research, the data of insurance customers have been used and a forecasting model has been presented. As a good prediction model, the decision tree with 86.21% accuracy was the best model that reached in this study. The insurers’ income criterion is considered as the node root, which shows the used method can help insurance companies make more profit by focusing on profitable customers.
JEL Classification: B31, C38, C22, D12

کلیدواژه‌ها [English]

  • Behavior of the Insurers
  • Clustering
  • Decision tree
  • K-means
  • Discover of Profitable Customers
مترجم، کیومرث و نیاکان، لیلی. (۱۴۰۰). سنجش و ارزیابی رضایت‎مندی مشتریان بیمه‌های زندگی. پژوهشنامه بیمه، 36(1): 119-87.
حاجی­حیدری، نسترن.، خاله­ء، سامرند‌ و فراهی، احمد. (1390). طبقه­بندی میزان ریسک بیمه­گذاران بیمه بدنه خودرو با استفاده از الگوریتم­های داده­کاوی (مورد مطالعه: یک شرکت بیمه). پژوهشنامه بیمه، ‌26(4): 129-107.
شهرابی، جمال. (1395). داده­کاوی. تهران: انتشارات دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران)، چاپ اول.
غضنفری، مهدی، علیزاده، سمیه و تیمورپور، بابک. (1387). داده­کاوی و کشف دانش. تهران: انتشارات دانشگاه علم و صنعت، چاپ اول.
قره­نژاد، سحر. (1389). لزوم حفظ مشتریان بیمه با استفاده از ابزارهای داده‌کاوی. تازه‌های جهان بیمه، 13(150-151): 23-15.
قره‌خانی، محسن و ابوالقاسمی، مریم. (1390). کاربردهای داده‌کاوی در صنعت بیمه. تازه­های جهان بیمه، 14(158)، 21-5.
Baecke, P. & Bocca, L. (2017). The value of vehicle telematics data in insurance risk selection processes. Decision Support Systems, 98: 69–79.
Balaji, S. & Srivatsa, S. K. (2012). Decision tree induction based classification for mining life insurance databases. International Journal of Computer Science and Information Technology & Security, 2(3): 699-703.
Bhowmik, R. (2011). Detecting auto insurance fraud by data mining techniques. Journal of Emerging Trends in Computing and Information Sciences, 2(4): 156-162.
Morik, K. & Kӧpcke, H. (2004). Analyzing customer churn in insurance data –A case study. European Conference on Principles of Data Mining and Knowledge Discovery, 325-336.
Oshini, G. T. L. & Caldera H. A. (2013). Mining life insurance data for customer attrition analysis. Journal of Industrial and Intelligent Information, 1(1): 52-58. ‌
Raedel, M., Hartmann, A., Priess, H. W., Bohm, S., Samietz, S., Konstantinidis, I. & Walter, M. H. (2017). Re-interventions  after  restoring  teeth—mining  an  insurance  database. Journal  of  Dentistry, 57: 14–19.
Rahman, M. S., Arefin, K. Z., Masud, S., Sultana, S. & Rahman, R. M. (2017). Analyzing life insurance data with different classification techniques for customers’ behavior analysis. Asian Conference on Intelligent Information and Database Systems, 15-25.
Ranjan, R. (2011). Self insurance and insurance demand under self-deception. Asia-Pacific Journal of Risk and Insurance, 5(2): 1-27.
Sundarkumar, G. G. & Ravi, V. (2015). A novel hybrid under sampling method for mining unbalanced datasets in banking and insurance. Engineering Applications of Artificial Intelligence, 37: 368–377.
Thakur, S. S. & Sing, J. K. (2013). Mining customer’s data for vehicle insurance prediction system using k-means clustering - An Application. International Journal of Computer Applications in Engineering Sciences, 3(4): 148-153.
Umamaheswari, K. & Janakiraman, S. (2014). Role of data mining in insurance industry. An International Journal of Advanced Computer Technology, 3(6): 961-966.
Wanke, P. & Barros, C. P. (2015). Efficiency drivers in Brazilian insurance: A two-stage DEA meta frontier-data mining approach. Economic Modelling, 53(C): 8–22.

نامه به سردبیر


سردبیر نشریه پژوهشنامه بیمه، هرگونه پیشنهاد و انتقاد دیگر نویسندگان و خوانندگان را در خصوص نقد و بررسی این مقاله مندرج در سامانه نشریه را ظرف مدت 3 ماه از تاریخ انتشار آنلاین مقاله در سامانه و قبل از انتشار چاپی نشریه، به منظور اصلاح و نظردهی امکان پذیر نموده است.، البته این نقد در مورد تحقیقات اصلی مقاله نمی باشد.
توجه به موارد ذیل پیش از ارسال نامه به سردبیر لازم است در نظر گرفته شود:
[1] نامه هایی که شامل گزارش آماری، واقعیت ها، تحقیقات یا نظریه پردازی ها هستند، لازم است همراه با منابع معتبر و مناسب همراه باشد، اگرچه ارسال بیش از زمان 3 نامه توصیه نمی گردد.
[2] نامه هایی که بجای انتقاد سازنده به ایده های تحقیق، مشتمل بر حملات شخصی به نویسنده باشند، توجه و چاپ نمی شود.
[3] نامه ها نباید بیش از 300 کلمه باشد.
[4] نویسندگان نامه لازم است در ابتدای نامه تمایل یا عدم تمایل خود را نسبت به چاپ نظریه ارسالی نسبت به یک مقاله خاص اعلام نمایند.
[5] به نامه های ناشناس ترتیب اثر داده نمی شود.
[6] شهر، کشور و محل سکونت نویسندگان نامه باید در نامه مشخص باشد.
[7] به منظور شفافیت بیشتر و محدودیت حجم نامه، ویرایش بر روی آن انجام می پذیرد.


 

CAPTCHA Image