大数据征信学习与思考

关于信用评估

信用由你的过去决定,未来决策也影响你的信用。

关于企业征信与个人征信

企业征信难于个人征信。企业由于对利益的诉求,往往在信用造假上更愿意冒险。

中小企业征信难于大型企业征信。中小企业信用数据信息更为匮乏、离散。

关于数据征信的输入输出

数据源

数据验证

  • 实名验证(身份证拍照)
  • 学历信息(学信网)
  • 手机实名验证
  • 银行卡实名验证
  • 人脸对比

黑名单

  • 法院黑名单
  • 金融黑名单(银行,P2P,小贷)

授权数据

  • 申请注册信息
  • 消费画像
  • 乘机记录(航旅纵横,12306)
  • 央行信用报告
  • 通讯信息(通讯记录、通讯录、短信)
  • 电商消费(淘宝,京东等)
  • 银行流水,信用卡流水

移动数据(基于移动设备)

  • 手机号码
  • 手机设备ID,设备属性
  • 常见地理位置
  • 通讯信息(通讯记录、通讯录、短信)
  • App使用信息
  • 网络信息(需要虚拟代理)

模型

模型特点

  • 多场景模型
  • 多维度模型
  • 级联模型(多源数据Mapping后的关联分析模型)

模型支撑

  • 逻辑回归+机器学习(算法支撑)
  • 真实贷款数据(数据支撑)
  • 国内外行业经验+专业经验(经验支撑)

反欺诈

  • 多重借贷(有利益诉求时候,往往会有刷信用,跨利益集体的复合借贷)
  • 反欺诈规则

技术支撑

  • OCR,爬虫(主要适用于公开数据爬取与授权数据读取)
  • 规则引擎,知识图谱(迅速寻找数据变量之间的关联)

信用报告

反馈评估结果

  • 模型评分
  • 审批建议
  • 额度建议
  • 利率建议
  • 久期建议(借贷周期)

小结

关于征信、金融业务,还有许多重要环节,例如放贷类业务的催收环节。不过核心的路径,有个取巧方式,可以从行业中各个公司的用户协议获取一些关键信息 🙂