近年来,全球经济增长持续放缓,国际社会风云变幻,大国之间摩擦不断,贸易保护主义日趋抬头,“逆全球化”现象更是频繁显现。与此同时,全球领域的科技创新发展也面临着前所未有的挑战。
科学技术是生产力中最为活跃的因素,科学变革与技术进步在造福人类的同时也带来了一系列问题,甚至安全风险。比如当下人们关于人工智能的安全,可控,可靠和可解释性等议题就争议不断。一方面是由于AI对经济社会活动的影响日益深入,AI已经从生产环节优化逐渐进入分配环节的决策。另一方面人们要为经济增长变慢分配关系日益紧张的责任找到一个载体。
比如欧盟就在2018年5月25日正式实施了史上最严的个人数据保护条例GDPR(通用数据保护条例),而在2019年1月21日,谷歌公司就成为依据此法遭高额处罚的首家美国科技公司,被罚款5000万欧元。
尽管有这样的小插曲,但AI作为新一代技术革命,依然被认为是未来全球经济增长的重要驱动力。根据Gartner最新发布的预测报告,2022年人工智能驱动的商业价值将高达3.9万亿美元。而在当下,面对复杂多变的国际政治环境和充满斗争的环境,人工智能产业最需要解决的是:如何找到一条新航道,实现针对GDPR这样的法律法规合规的人工智能算法设计,和人工智能在数据层面的公平合作。
消除数据短缺,微众银行AI团队开辟新航道
实际上,一些具有远见的人工智能科学家以及人工智能团队和企业早已开始行动。
就在最近,国际人工智能领域最为权威与重要的协会之一AAAI(Association for the Advancement of Artificial Intelligence)在美国举办AAAI 2019年会。一直推崇通过联邦学习框架来解决数据安全、短缺等问题的,微众银行首席人工智能官(CAIO),国际人工智能学会理事长杨强教授作为特邀演讲嘉宾,发表了主题为“GDPR、数据短缺和人工智能”的特邀演讲(AAAI Invited Talk),全面讲述“联邦迁移学习”的安全的分布式建模原理和在数据合规上的意义。
(微众银行首席人工智能官(CAIO)杨强教授主题演讲“GDPR、数据短缺和人工智能”现场)
杨强教授在演讲中直指当前数据短缺的根本原因——“如今机器学习最薄弱的环节其实并非算法结构不够丰富、准确率不够高,而是在高质量大数据的可用性方面面临着严峻的挑战。在许多实际应用中,数据之间是相互孤立的。集成数据的工作越来越困难,其中一部分原因是对用户隐私和数据安全的严重担忧。严格的政府法规,例如GDPR的实行让许多大数据公司噤若寒蝉,不敢再互相交流数据了,这对于极度依赖数据的机器学习是一个巨大的挑战。”
对此,杨强教授透露微众银行AI正在引领业界积极寻找正向的应对方法,思考如何把 GDPR 囊括在人工智能和机器学习框架之内。其中联邦迁移学习Federated transfer learning作为重要范例,可实现在不共享各自数据的前提下,利用双方的数据实现共享模型的性能增长。
实际上,微众银行这一技术设想早已经得到业界认可。2018年12月4日,电气和电子工程师协会标准委员会(IEEE Standard Association)就批准了由微众银行发起的关于联邦学习架构和应用规范的标准P3652.1(Guide for Architectural Framework and Application of Federated Machine Learning)立项。微众银行成为工作组的召集单位,工作组主席由杨强教授担任。工作组将在联邦学习的算法框架规范,使用模式和使用规范上推动相关国际标准的制定,以帮助和指导不同类别的企业在合作过程中合法合规的共同使用数据。而作为工作组主席,杨强教授还在会上介绍了IEEE联盟标准的工作进展,引发广泛关注,反响积极热烈。
并且,在这次AAAI 2019年会上,微众银行AI团队的展台前,更是人头攒动,众多学者教授、工业专家、国内外学生都主动与微众银行现场工作人员,就微众在AI方向的成果进行探讨交流、以此加深了解,甚至寻求合作与人才引进。微众银行AI团队也被邀请在AAAI大会上做了联邦迁移学习的教程,系统讲述了联邦迁移学习的理论依据和实践案例。
不难看出,无论是杨强教授受邀在人工智能领域殿堂级的年会上进行主旨演讲,还是由电气和电子工程师协会标准委员会被批准应用规范立项,还是展台前的围观交流,都证明微众银行AI团队的技术实力和前沿研究,已经得到国际学术业界的广泛认可。
联邦学习框架的优势到底是什么?
首先需要了解何为联邦学习?实际上就是一种加密的分布式机器学习技术,参与各方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型。
(联邦学习基本框架)
而联邦学习具有四大显著优势。第一是数据隔离,数据不会泄露到外部,满足用户隐私保护和数据安全的需求;第二是能够保证模型质量无损,不会出现负迁移,保证联邦模型比割裂的独立模型效果好。第三则是参与者地位对等,能够实现公平合作;最后,则是能够保证参与各方在保持独立性的情况下,进行信息与模型参数的加密交换,并同时获得成长。
总而言之,作为一个机器学习框架,联邦学习能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和建模。
而在联邦学习的基础上,迁移学习的能力也可以被搭建出来,做到举一反三的效果。这个总的模型叫做「联邦迁移学习」(Federated Transfer Learning)。
通俗的讲,联邦迁移学习不将数据以任何形式堆放在一起,而是像各自堆放成不同的高山,在每座高山的顶上安排一个机器人下山寻路,只同步机器人之间的步调而非数据本身。在此基础上,不同机器人还可以实现迁移学习以提高对各自数据的理解能力。
举个例子,假设有三个不同的企业 A、B 和 C,每个企业都有不同数据。第一个企业A有一些用户特征 数据;第二个企业 B 有其他的一些用户特征数据,同时也包括一些标注数据;第三个企业 C 是一个银行,可能有有关金融的特征和标注数据。那么,按照 GDPR 准则,这三家企业并不能粗暴地把三方数据加以合并,因为用户并没有同意。
但是,假设三方各自建立一个模型,而这个行为已经获得各自用户的认可。然后,通过加密机制下的参数交换方式, 在不违反法规情况下,建立一个虚拟的共有模型。这个虚拟模型将三方数据聚合在一起一样,但是数据本身不移动, 也不泄露隐私,模型在各自的区域还是为本地的目标服务。这就在合法合规的情况下,实现了数据的流动。
在这样一个全新的人工智能框架体系下,各个参与者的身份和地位相同,数据互相独立,又融为一体,也就不会导致企业之间产生隔阂。对于现阶段,解决企业之间在确保不侵犯用户隐私、不违反法规和不损害企业之间合作关系的情况下,进行数据的流动和互通有无,无疑是一个极具远见的创新思路,拥有积极的科技创新意义。
联邦学习领域首个商用级开源项目诞生,谁将受益?
此外,在AAAI年会上,微众银行AI团队还正式发布了联盟AI生态系统(Federated AI Ecosystem),同时开源联盟AI解决方案FATE(Federated AI Technology Enabler)。
作为联邦学习领域第一个商用级开源项目,FATE为开发者提供所必须的多方协同建模工作流管理、加密机器学习工具库和并行计算基础设施抽象三层能力,同时提供了很多开箱即用的联邦学习算法和联邦迁移学习算法供开发者参考,极大简化了联盟AI开发的流程并降低了部署难度。
事实上,早有合作企业已经加入联盟AI生态。此前,全国连锁租车品牌一嗨租车与微众银行共同宣布达成深度战略合作关系,宣布双方将在汽车出行、会员服务、金融保险、区块链技术等方面展开多场景多维度创新合作。一嗨租车使用联邦迁移学习,AI人脸认证技术、支付技术等金融科技,以优化提升用户体验为目的深度融入租车服务流程,并将租车场景与银行大数据风险控制体系相结合,从而为年轻一族及长租客户提供新的出行生活方式。
不难预测,未来将有更多的企业可以享受这项科技创新红利,借此来打造自己的AI数据模型,推动自身AI应用落地。而据了解,联邦学习可应用于不同行业及其垂直领域,包括金融服务、物流、供应链、运营商、医疗健康等。
从制定行业标准到发布联盟AI生态系统,为何总是微众银行?
最后,一个疑问是,这样一个影响AI行业发展的重大创新举措,为何会是由微众银行AI部门这样的中国团队来引领呢?
首先,微众银行有一支豪华的AI团队。其中,首席人工智能官杨强教授是人工智能领域的一个国际专业权威学者专家和领军人物。其不仅是国际人工智能协会(AAAI)第一位华人院士,更是首位和至今为止唯一的AAAI华人执委。此外,其还是国际人工智能联合会(IJCAI,国际人工智能领域创立最早的顶级国际会议)理事会主席,同样是第一位担任IJCAI理事会主席的华人科学家。而其他团队成员也多是在机器学习、联邦学习,联邦迁移学习以及这些人工智能技术方面具有丰富的经验和深厚的积累。
更重要的是,杨强教授及其带领的AI团队拥有微众银行这样一个强大的创新平台。作为国内首家开业的互联网民营银行。不设线下网点的微众银行,所开创的事业也是国内首创,因此创立之初便成功解决如何获客以及与传统银行如何竞争共处等问题。
而微众银行的AI科技使其快速找到增长突破口。特别是基于联邦迁移学习技术进行多方大数据安全利用,使得微众银行在包括风险评估、差异定价、精准营销等多个金融场景进行成功实践,助推微众银行实现业务创新,使得其金融服务覆盖面不断提升,社会价值贡献进一步体现。
举个例子,过去小微企业由于缺乏足够的经营数据,难以进行信用风险评估,所以一直存在融资难融资贵的问题。而微众银行通过创新使用联邦迁移学习技术建立合作生态,在不侵犯企业用户数据的情况下,连接了企业的财务、订货、能源等大数据,对小微企业经营状况和信用能够进行360度模型评估,大大拓展了可贷企业的范围。
数据说明一切。根据微众银行披露的小微信贷客户群数据显示,68%的客户在获得授信时无任何企业类贷款记录;38%的授信客户在获得授信时无任何个人经营性贷款记录。足证,联邦学习框架的科技创新意义。
总体而言,随着微众银行在联邦学习架构和应用规范的标准制定推行,以及对于联盟AI生态系统的大量推广建设,越来越多的企业加入到联盟AI阵营,在合法合规和保证绝对安全的情况下,进行数据的互通有无,将大大消除当下企业与企业之间、组织与组织之间的数据隔阂,最终必将助推人工智能发展迈入新纪元。