本文探讨了风控算法选择与职场效率问题,分析不同模型在风控中的应用优势,指出应根据业务特点选择合适算法。同时强调职场中聚焦核心业务痛点的重要性,倡导提升工作价值而非沉迷无意义忙碌,为技术实践和职场发展提供启发。
做风控模型,很多人都会更愿意去做 xgb 而不是 lr 。因为 lr 有很多要求,xgb 关注效果就好了。甚至,很多人会做 xgb ,不会做 lr 模型。
做 lr ,有一系列变量筛选和变量处理的过程,例如空值率、psi、iv、相关性、多重共线性,怎么做,阈值设多少,对结果都会有影响。而且,woe 转化和最终模型变量的选择总要经过一些主观的判断。可以说,两个人做不出同一个 lr 模型。
xgb 不用关心这些细节,甚至你去关心反而是错的。lr 要做这一套流程,是因为不做不行,例如 iv 值低了变量不单调,例如相关性或者多重共线性高了,行列式无解或者有无数个解。xgb 不存在这个问题,你不辞辛苦去做这样一套流程,只能表示你懂一些技能,但不深知其然与不然,我不会曰“能”。
也就是说,lr 模型更简单,但开发更困难,xgb 模型更复杂,但开发更容易。这是必然的。因为复杂可以自动解决很多问题,当然复杂本身引入了新的问题。
非线形自然比线形难理解,这其实不算什么问题,xgb 的可解释性已经很强了。变量多是一个问题,实时加工更多的变量,监控更多的变量,这是最主要的麻烦。
神经网络也是如此。许多在小模型中有效的优化技巧,在大模型中变得不太适用甚至适得其反,例如 dropout 、早停、小学习率等等。在大模型中,指数级提升的复杂度显性或者隐形地解决掉了很多问题。更重要的问题变成了,数据的丰富度、分布式训练效率和显存优化。
关于算法更多的讨论,可以看这篇:什么是好算法
以上,我们聊了不同模型的算法差异,我们点到为止。我的目的不是帮助你对比不同模型的开发技巧,而是解决你做算法选择的问题。
论及算法选择,有必要补充另一种适合 lr 模型的情况。
当数据量很小,样本表现受到很多个性化策略的影响,例如大企业贷款,样本数量少,风险管理往往是一企一策,其逾期表现甚至不能完全用量化的方式可定,在这种情况下,数据规律的噪声很大,过拟合的错误性更大,用 lr 模型可能会更合适。这是显然的,分箱单调的要求是一种人为的去过拟合。
我们应该充分利用算法特性,做出合适的算法选择。
……
我们又来到了第二部分。我每次都是想写第二部分,而写了第一部分。
《自私的基因》中作者在谈及科学的创造力时,讲到拟人化:
「
分子生物学家雅克·莫诺考虑一个化学问题时,他会问自己:如果我是个电子,我会怎么做?
彼得·阿特金斯在探讨光束通过高折射率介质时速度减慢后的折射时,也采取了一个类似的拟人:光束好像想要最小化其到达终点的时间。在他的想象中,这如同海滩边的救生员冲过去拯救一个落水者一样。他不会按直线靠近落水者,因为跑步比游泳更快。他也不会跑到海滩边正对着目标的点,最小化游泳距离。他会凭感觉找到最佳行进角度。
阿特金斯总结道:这正是光线通过密度较大介质时的行为。但光线怎么能在进入之前就已经知道哪一个是最短的行程?它又为什么要在乎这个?
」
如果你是算法,你要尽可能地识别高风险用户,你会怎么做?你很可能会选择 xgb 的建模路径,它是高效且人性化的。
现在你是风控建模人员,你应该怎么做?你应该用更高效的方案,关注结果分析而不是建模过程,然后把时间投入到核心问题上。你应该优选 xgb 等集成树模型,而不是 lr,甚至也不是神经网络,如果没有其他考虑要素的话。这样,开发很省事,评审也很省事。
你要关注核心问题,少关注无用问题。核心问题是什么呢?当然是业务痛点,你应该把时间精力花在对业务的了解和分析上。
人做的事是大的,心也是大的;人做的事是小的,心也变小了。
我跟好几个特别熟的同事朋友都说过,不要听这个人那个人的去做这个做那个,你已经很烦了,为什么你都不认可还委屈自己去做呢?他们认同我,但是他们都不听。他们找到了那个“我不是你,我没办法啊”的理由。
大家都很不诚实。承认团队有问题容易,承认自己解决不了也容易,但大家都不承认解决办法存在是你不去解决。永远存在办法,只是你不去做而已。人权大于皇权,职场算什么。
当人类百米首次跑进十秒后,就有很多人跑进十秒。你相信和不相信,有着巨大的不同。
回到拟人化那段,电子也好,光束也好,它们会以效率最大化的方式呈现物理化学特性。物犹如此,何况人乎?
效率,不是这个世界的运行法则,但是对你个体而言,必须以效率为先,你才有时间和精力去探索更多的新奇性和可能性。
……
我发现如果文章没有特别严谨的结构,和精妙绝伦的论点,我就会失去兴趣。写完了会没有发的欲望,似乎内心认定我写的就是一坨屎。
然后在这个没有发的时间里,我突然有一个猜想:
大家上班内卷,花巨量的时间做无意义的工作,该下班时不回家,一方面当然是公司要求,还有一方面,有没有可能是大家自己需要做无意义的事情,使自己不停下来?
因为大部分人已经失去了与朴素事物打交道的能力,他们几个小时几个小时地刷手机玩游戏,但并不能从中获得快感。他们之所以这样做,是为了避免陷入觉知到自己没有享受闲暇的能力的恐慌。
本文由人人都是产品经理作者【雷帅】,微信公众号:【雷帅快与慢】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。