信而富玩转大数据~~~~~~~~~~~~~~~~~~
信而富玩转大数据~~~~~~~~~~~~~~~~~~
大数据在互联网金融领域已经成为热词,但是如何利用对于开采者来说,却是“八仙过海、各显神通”。在信而富看来,“Test And Learn”,才是大数据应用于P2P风险管理的核心方法。
“Test And Learn”,意思为“测试与获知”,对信而富来说,意味着在放款实践中收集数据,通过建立风险模型和目标变量,研究客户数据与信用行为之间的关系,从而调整授信策略。
信而富对借款人采集的数据多达1500个,并须在“细枝末节”中寻找线索。比如,关注申请人的邮政编码最近12个月是否变更,关联的信用卡张数是否变化,最近3个月、6个月的信用卡消费总额、交易类别与交易次数是否出现异常等。这些变量构成了信而富自动化授信决策的重要依据。
但是数据的纷繁复杂会让开采者遭遇困境。在信而富设置的上千个数据纬度中,实际有用的数据可能只有100个。不同数据纬度间的逻辑关系,也很有可能产生冲突。不断地测试并且获取正确的数据维度和信息,构成了信而富的大数据应用的核心机密。
举个例子,在常识看来,手机用户的开户时间越长,手机号码从不改变且经常使用,是稳定性的标志。
但这其中仍有许多不确定的因素。手机号用多少年算长?是两年还是三年,或是十年?那么信而富须针对使用一年、两年、三年、五年号码乃至更多的手机用户分别作一些测试,通过这些用户的借款行为不断进行总结。假设公司发现使用手机号少于三年零两个月的用户借款风险较高,过了这个点后风险率显著下降,那么“三年零两个月”这个数字就是信而富的授信标准,也是公司的核心机密。
南京龙虎网-东方卫报
“Test And Learn”,意思为“测试与获知”,对信而富来说,意味着在放款实践中收集数据,通过建立风险模型和目标变量,研究客户数据与信用行为之间的关系,从而调整授信策略。
信而富对借款人采集的数据多达1500个,并须在“细枝末节”中寻找线索。比如,关注申请人的邮政编码最近12个月是否变更,关联的信用卡张数是否变化,最近3个月、6个月的信用卡消费总额、交易类别与交易次数是否出现异常等。这些变量构成了信而富自动化授信决策的重要依据。
但是数据的纷繁复杂会让开采者遭遇困境。在信而富设置的上千个数据纬度中,实际有用的数据可能只有100个。不同数据纬度间的逻辑关系,也很有可能产生冲突。不断地测试并且获取正确的数据维度和信息,构成了信而富的大数据应用的核心机密。
举个例子,在常识看来,手机用户的开户时间越长,手机号码从不改变且经常使用,是稳定性的标志。
但这其中仍有许多不确定的因素。手机号用多少年算长?是两年还是三年,或是十年?那么信而富须针对使用一年、两年、三年、五年号码乃至更多的手机用户分别作一些测试,通过这些用户的借款行为不断进行总结。假设公司发现使用手机号少于三年零两个月的用户借款风险较高,过了这个点后风险率显著下降,那么“三年零两个月”这个数字就是信而富的授信标准,也是公司的核心机密。
南京龙虎网-东方卫报
onelovemm- 帖子数 : 745
注册日期 : 14-07-28
您在这个论坛的权限:
您不能在这个论坛回复主题