本篇主要提供[包邮现货] [套装书]智能风控:原理、算法与工程实践+数据中台:让数据|8067561电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
书名: | [套装书]智能风控:原理、算法与工程实践+数据中台:让数据用起来(2册)|8067561 |
图书定价: | 178元 |
图书作者: | 梅子行 付登坡 江敏 任寅姿 孙少忆 |
出版社: | 机械工业出版社 |
出版日期: | 2020/1/3 0:00:00 |
ISBN号: | 9782003102294 |
开本: | 16开 |
页数: | 620 |
版次: | 1-1 |
作者简介 |
---------------------------智能风控:原理、算法与工程实践--------------------------- 梅子行 著:作者介绍 梅子行 资深风控技术专家、AI技术专家和算法专家,现就职于满帮科技,负责机器学习在风控领域的算法优化。历任多家知名金融科技公司的风控算法研究员、数据挖掘工程师。 师承Experian、Discover等企业的资深风控专家,擅长深度学习、复杂网络、迁移学习、异常检测等非传统机器学习方法,热衷于数据挖掘以及算法的跨领域优化实践。 公众号与知乎专栏:“大数据风控与机器学习”。 ---------------------------数据中台:让数据用起来--------------------------- 付登坡 江敏 任寅姿 孙少忆 等著:付登坡(花名:天湛) 资深大数据专家,数澜科技联合创始人&地产事业部总经理 有10余年?数据领域从业经验,擅长数据建模、海量数据产品架构设计与实现。原阿?巴巴集团?数据专家,曾在阿里集团负责消费者数据标签体系、DMP平台等大数据项?设计与实施。2015年以创始人身份组建阿?巴巴集团的“11维数据创新工作室”,探索数据创新与数据商业化。 2016年6?离职,联合创办数澜科技,在数澜科技先后负责技术部、咨询服务部、地产事业部。 江敏(花名:江敏) 资深大数据专家,数澜科技联合创始人&CTO 有10年大数据平台规划、数据安全交换使用、数据应用场景建设方面的实践经验。曾任职于阿里数据平台事业部、阿里云数据事业部,负责阿里数据能力及平台的行业客户赋能,ID-Mapping体系能力构建及服务化的核心参与者,并打造行业的数据共享交换,数据交易模式早期探索者。 数澜科技联合创始人,负责管理公司产品技术团队,为客户输出构建和经营数据中台的能力,基于数据中台建设的实践经验,带领团队打造一站式数据应用基础设施-数栖,并完成实施多家行业龙头客户基于数栖的数据中台建设。 任寅姿(花名:影姿) 资深数据产品专家,数澜科技创新事业部总经理 曾任阿里巴巴数据产品专家、数据创新梧桐工作室负责人等。对大数据资产设计、资产服务、资产应用在实践的基础上形成了一套完整的数据标签类目体系方法论;擅长对各种复杂业务场景进行需求拆解、数据抽象和数据应用建模,关注于采用大数据方法切实解决场景痛点提升业务效率。 孙少忆(花名:守正) 资深数字化转型咨询专家,数澜科技战略副总裁 20年企业信息化工作经验,积累信息化内部运营、解决方案销售及交付等领域实践经验。拥有MBCI、CISSP-ISSMP、CGEIT、COBIT5、ITILExpert、P3O等国际专业资质证书。曾任职华为ICT规划咨询部,面向企业、政府提供“以数据为核心,聚焦业务场景和价值”的流程信息化与数字化转型规划和落地咨询业务。 武凯(花名:行竹) 资深数据产品专家,数澜科技COO 有10余年数据产品经验,曾任阿里巴巴集团数据平台产品与运营部负责人,是营销、零售和医疗健康等领域数据应用的探索实践者,专注于企业大数据资产化及应用增值。 沈金(花名:铁平) 资深数据业务架构专家,数澜科技解决方案总监 10余年数据行业经验,擅长业务架构、数据架构、技术架构的规划和落地实施。曾在阿?巴巴担任DBA,后参与阿里数据中台建设,拥有用户识别、标签设计、动态数据组织多个发明专利。 2017年加入数澜科技,负责解决方案团队,推动数据中台在零售、地产、金融、集团等客户案例落地。 蔣珍波(花名:乐天) 大数据咨询专家,数澜科技高级咨询专家 15年信息化和大数据行业从业经验,具备广阔的知识面,丰富的咨询经验,擅长创造性地为客户提供解决方案,尤其擅长数据治理方面的咨询规划和产品设计,服务过数十家政府和大中型企业客户。 |
内容简介 |
---------------------------智能风控:原理、算法与工程实践--------------------------- 内容介绍 本书基于Python全面介绍了机器学习在信贷风控领域的应用与实践,从原理、算法与工程实践3个维度全面展开,包含21种实用算法和26个解决方案。 作者是智能风控、人工智能和算法领域的资深专家,曾在多加知名金融科技企业从事风控算法方面的研究与实践,经验丰富,本书得到了风控领域9位专家的高度评价。 全书一共8章,每个章节都由问题、算法、案例三部分组成,具有系统性和实战性。 第1-2章讲解了信贷业务的基础知识以及常用的规则引擎、信用评估引擎的建模方法。 第3章以项目冷启动为背景,讲解了风控领域应用广泛的迁移学习方法。 第4-5章介绍了幸存者偏差与不均衡学习中所使用的无监督学习与半监督学习方法。 第6章阐述了无监督的异常识别算法,该算法常用于数据清洗与冷启动项目,是反欺诈引擎中常用的个体欺诈检测方法。 第7章分享了一些经作者实践证明效果较好的模型优化方法,并对模型融合的思路进行了较为详细的介绍。 第8章重点讲解了知识图谱相关的复杂网络基础知识及网络表示学习方法,其中的社区发现算法常用于团伙欺诈检测。此外,本章中的部分方法对信用评估模型的优化也有很大帮助。 ---------------------------数据中台:让数据用起来--------------------------- 内容简介 什么是数据中台? 什么样的企业需要建数据中台? 数据中台应该如何架构与设计? 建设数据中台的系统方法论是什么? 一个完整的数据中台有哪些组成部分? 如何从0到1实现一个数据中台? 数据中台应该如何运营? 数据中台的安全如何保障? …… 以上所有问题都能在本书中找到答案! 这是一部系统讲解数据中台建设、管理与运营的著作,旨在帮助企业将数据转化为生产力,顺利实现数字化转型。 本书由国内数据中台领域的领先企业数澜科技官方出品,几位联合创始人亲自执笔,7位作者都是资深的数据人,大部分作者来自原阿里巴巴数据中台团队。他们结合过去帮助百余家各行业头部企业建设数据中台的经验,系统总结了一套可落地的数据中台建设方法论。本书得到了包括阿里巴巴集团联合创始人在内的多位行业专家的高度评价和推荐。 全书一共11章,从建设、管理、运营、安全等维度全方位地讲解了数据中台。 第1~2章全面介绍了数据中台产生的背景、发展阶段、企业应该具备的3个认知,以及什么是数据中台、数据中台的4个核心能力、数据中台的业务价值与技术价值等; 第3~4章详细讲解了数据中台的架构设计、建设方法论,以及企业建设数据中台的成熟度评估和应用场景分析; 第5~9章深入地讲解了数据汇聚与联通、数据开发、数据体系建设、数据资产管理、数据服务体系建设等数据中台的核心模块,以及如何从0到1实现一个数据中台; 第10~11章详细地讲解了数据中台的管理、运营和安全保障。 |
目录 |
---------------------------智能风控:原理、算法与工程实践--------------------------- 推荐序 前言 第1章 风控建模与规则挖掘 / 1 1.1 信贷与风险 / 1 1.1.1 信贷业务与互联网金融风控体系 / 1 1.1.2 信贷风险与控制 / 4 1.2 工业建模流程 / 5 1.2.1 抽象业务 / 6 1.2.2 定义标签 / 6 1.2.3 样本选取 / 7 1.2.4 特征工程与模型调优 / 9 1.2.5 上线监控与评估报表 / 10 1.3 规则挖掘方案 / 13 1.4 本章小结 / 20 第2章 集成模型评分卡 / 21 2.1 特征工程解析 / 21 2.1.1 特征与模型 / 22 2.1.2 信用模型的特征 / 22 2.2 特征衍生方案 / 24 2.3 离散处理 / 27 2.3.1 one-hot编码 / 27 2.3.2 WOE编码 / 28 2.4 迭代特征筛选方案 / 33 2.5 自动化调参 / 38 2.5.1 自动化调参策略 / 38 2.5.2 参数搜索方案 / 39 2.5.3 调参框架搭建 / 40 2.6 递归特征删除方案 / 43 2.7 评分卡制作 / 44 2.7.1 逻辑回归评分卡 / 45 2.7.2 集成模型的评分映射 / 55 2.7.3 针对业务改写评价函数 / 59 2.8 本章小结 / 60 第3章 迁移学习与冷启动 / 61 3.1 迁移学习基础 / 61 3.1.1 应用场景 / 62 3.1.2 概念介绍 / 62 3.2 迁移学习方法论 / 63 3.2.1 三类常见算法 / 63 3.2.2 迁移的实现方法 / 64 3.3 少量有标签样本的迁移方案 / 65 3.3.1 TrAdaBoost模型 / 65 3.3.2 跨场景迁移模型 / 67 3.4 无标签样本迁移之JDA / 76 3.4.1 JDA模型 / 76 3.4.2 模型应用 / 79 3.5 无标签样本迁移之DTELM / 80 3.5.1 ELM模型 / 81 3.5.2 DTELM模型 / 82 3.5.3 模型应用 / 84 3.6 迁移样本筛选方案 / 88 3.6.1 背景介绍 / 88 3.6.2 算法框架概览 / 88 3.6.3 搭建融合框架 / 89 3.7 本章小结 / 93 第4章 幸存者偏差 / 95 4.1 幸存者偏差的含义 / 95 4.2 增量学习 / 96 4.3 生成对抗网络 / 97 4.3.1 GAN模型介绍 / 98 4.3.2 GAN与幸存者偏差 / 99 4.4 高斯混合模型 / 100 4.4.1 GMM算法原理 / 101 4.4.2 GMM简单应用 / 103 4.4.3 GMM中的概率模型 / 104 4.4.4 GMM样本生成 / 107 4.5 信息准则 / 110 4.5.1 赤池信息准则 / 110 4.5.2 贝叶斯信息准则 / 111 4.5.3 AIC与BIC比较 / 111 4.6 本章小结 / 112 第5章 不均衡学习 / 113 5.1 样本不均衡 / 113 5.2 代价敏感加权方案 / 114 5.3 插值过采样方案 / 115 5.3.1 SMOTE算法 / 115 5.3.2 过采样算法实践 / 116 5.4 半监督学习方案 / 121 5.4.1 前提假设 / 122 5.4.2 S3VM / 122 5.4.3 LP / 127 5.5 本章小结 / 130 第6章 异常检测 / 132 6.1 离群点与欺诈检测 / 133 6.2 z-score检验 / 134 6.3 LOF异常检测法 / 134 6.3.1 原理与算法流程 / 135 6.3.2 LOF样本清洗方案 / 137 6.4 IF异常检测法 / 139 6.4.1 原理与算法流程 / 139 6.4.2 PreA模型与冷启动 / 141 6.5 本章小结 / 144 第7章 模型优化 / 145 7.1 多损失函数分段预测 / 145 7.1.1 两种损失函数 / 146 7.1.2 融合流程 / 146 7.2 树模型特征衍生 / 149 7.2.1 GBDT离散化 / 149 7.2.2 融合方案详解 / 150 7.2.3 特征衍生细节 / 151 7.2.4 案例 / 151 7.3 时间序列建模 / 160 7.3.1 RNN / 160 7.3.2 LSTM / 163 7.3.3 门控结构 / 164 7.3.4 LSTM行为评分卡案例 / 166 7.4 高维稀疏数据建模 / 170 7.4.1 算法原理 / 171 7.4.2 算法应用 / 172 7.5 模型融合 / 173 7.5.1 模型融合基础 / 173 7.5.2 模型筛选 / 174 7.5.3 业务应用方案 / 181 7.6 本章小结 / 183 第8章 知识图谱 / 184 8.1 复杂网络基础 / 184 8.2 中心度与相似性 / 187 8.3 节点分类 / 193 8.3.1 朴素节点分类 / 193 8.3.2 邻节点加权投票 / 195 8.3.3 一致性标签传播 / 197 8.4 社区发现算法 / 200 8.4.1 基础概念 / 200 8.4.2 Girvan-Newman算法 / 201 8.4.3 Louvain算法 / 202 8.4.4 社区评估 / 204 8.5 网络表示学习 / 206 8.5.1 矩阵分解 / 207 8.5.2 节点嵌入 / 210 8.6 图卷积神经网络 / 215 8.6.1 卷积神经网络 / 215 8.6.2 傅里叶变换 / 217 8.6.3 拉普拉斯算子 / 219 8.6.4 GCN中的图卷积 / 221 8.7 本章小结 / 225 参考文献 / 226 ---------------------------数据中台:让数据用起来--------------------------- 赞誉 作者简介 前言 第1章 数据中台:信息化的下一站1 1.1 数据中台产生的大背景2 1.2 数据中台的3个核心认知11 1.3 数据中台的3个发展阶段13 1.4 开启信息化的下一站16 第2章 什么是数据中台20 2.1 解码数据中台22 2.2 数据中台必备的4个核心能力24 2.3 数据中台需要厘清的2个概念29 2.4 数据中台VS现有信息架构32 2.5 数据中台的业务价值与技术价值34 第3章 数据中台建设与架构39 3.1 持续让数据用起来的价值框架40 3.2 数据中台建设方法论42 3.3 数据中台架构53 3.4 中台手记(一):我说服老板立项了57 第4章 数据中台建设的评估与选择62 4.1 企业数据应用的成熟度评估63 4.2 企业数据中台建设的应用场景75 4.3 中台手记(二):打仗前手里得有一张“粮草”清单79 第5章 数据汇聚联通:打破企业数据孤岛82 5.1 数据采集、汇聚的方法和工具83 5.2 数据交换产品90 5.3 数据存储的选择94 第6章 数据开发:数据价值提炼工厂102 6.1 数据计算能力的4种类型104 6.2 离线开发110 6.3 实时开发117 6.4 算法开发120 6.5 中台手记(三):选一个适合自己的技术平台真的很重要132 第7章 数据体系建设136 7.1 数据体系规划137 7.2 贴源数据层建设——全域数据统一存储140 7.3 统一数仓层建设——标准化的数据底座144 7.4 标签数据层建设——数据价值魅力所在157 7.5 应用数据层建设——灵活支撑业务需求179 7.6 中台手记(四):即将开启的数据淘金之旅183 第8章 数据资产管理189 8.1 数据资产的定义和3个特征190 8.2 数据资产管理现状和挑战191 8.3 数据资产管理的4个目标192 8.4 数据资产管理在数据中台架构中的位置193 8.5 数据治理194 8.6 数据资产管理与数据治理的关系201 8.7 数据资产管理职能202 8.8 数据资产管理效果评估234 8.9 数据资产管理的7个成功要素239 8.10 中台手记(五):家里的这点家底可得管好了242 第9章 数据服务体系建设245 9.1 补全数据应用的最后“一公里”246 9.2 4种常见的数据服务249 9.3 3种常见的数据应用262 9.4 数据服务背后的产品技术274 9.5 中台手记(六):解决“数据应用最后一公里”问题280 第10章 数据中台运营机制284 10.1 数据中台... |
编辑推荐 |
---------------------------智能风控:原理、算法与工程实践--------------------------- 风控、AI、算法领域的资深专家撰写,10位专家联袂推荐 ---------------------------数据中台:让数据用起来--------------------------- 从技术、架构、设计、运营、管理5个维度系统总结数据中台实现方法论 数据中台领先企业数澜科技官方出品 |