MDA研究院

大数据时代征信业所面临的挑战

随着云计算、移动互联网发展的突飞猛进,全球数据呈现爆炸式的增长,海量的信息涌入人们的生活圈。我们无法否认,一个属于大数据的时代已经来临。毫无疑问,大数据是十分具有前景的,它的到来为人们带来了空前的便利,但与此同时,监管层也将面对不同于以往的挑战。如何确保所获取数据的准确性,如何保证资信的公平公正,信息的采集和使用是否合理等,都将是我们需要着重考虑的。

  如何确保信息的准确性

  为了迎合时代的需要,越来越多的信息涌入人们的生活,人们在享受数字化带来的便利的同时,许多人会主观臆断的认为这些信息是准确的,如何确保自己所获取的信息是准确的?这将是进入大数据时代人们所需要面临的一大挑战。在这个数据不断膨胀的时代,人们毫无疑问需要一种科学算法,一种采集数据的方式,来确保得出的数据是正确的,但是试想一下,人类是无法确保所做的事情是毫无偏差的,那算法或者数据采集方式也同样无法保证它们是完全正确的。

  在美国八十年代,普遍获取信息往往通过电话和传真的方式,直接给某人打电话做调查,询问一些问题。一个早晨一般能做25到30个电话寻访。当时的信息获取方式工作效率及其低下,但通过人与人之间的交流,确实能够保证数据的准确性。当时的人无法想象30年后的今天,如此海量的数据主动或者被动的进入人们的视线,获得这些数据的人可能根本就没有与信息主体有过任何的交流,在这种情况下,就会出现所获得的数据的质量以及完整性的问题。

  作为征信行业的监管者,在制定政策的过程中首先所需要确保的就是信息准确性问题。试想即便人类能够创造出极其优秀的计算机算法,只有当算法中的数据是准确的,这个算法才是有效的,如果数据收到了污染,或者缺失了,再优秀的算法也是毫无用处的。在这个大数据时代,信息的源头很难追溯控制,数据准确性的问题不仅仅对于整个中国市场,乃至对于全球的征信大环境来说也是需要面对的挑战。

  如何保证资信的公平公正

  获得大数据之后,首先需要重新思考的是,需要多少数据才能定位一个人。如何准确地衡量一个人是资信最重要的目标。但资信对所有人来说并不是公平的。例如有些高龄的消费者,不懂如何使用互联网,网络中自然就没有他的信息。年龄,文化程度,认知度等各个方面都限制了这类人群的信息采集,显然信贷对于他们来说是不公平的。

  然而对于另外一些使用互联网的人群而言,会有数据足迹留下,但这个过程中,信息主体自身是否具有选择权?是删除这些数据,愿意分享多少数据?每个人都应该有这样的权利,但是事实确是令人失望的,至少有一部分信息主体是无法控制的。

  所以对行业监管者来说,必须考虑使用大数据的负面影响是什么?任何行业长久发展的基石是公平公正,同样的不公平还存在于对少数民族的歧视,部分国家对性别的歧视等。对于传统的信贷打分机制现已耳熟能详,在过去的大多数国家,都会有民族和性别歧视这样的问题,法律会禁止使用一些种族和性别方面的数据。

  当数据采集者想要一些数据,可以通过云端进行挖掘,但是在这个过程中,没有人能够保证这些信息是完整的,是否有信息被过滤了,被屏蔽,被筛选了?所以很多情况下,公平这碗水是无法被端平的,信息筛选这会有所选择,有些人会选择分析他们想要分析的数据,将不希望出现的数据自动过滤出去,然后整理成一份所谓的汇总,显然这份汇总是不公平的,是不完整的。在整个大数据链和生命周期中,首先需要考虑到数据收集的偏差性,如何保证资信的公平公正,是行业监管者需要重新思考的问题。

  信息的采集和使用是否合理

  在人们当下的生活中,经常会遇到此类的情况发生,比如某项电子产品或者虚拟软件,在使用之前都会有长篇大段的协议需要人们签署,只有同意打勾后方可使用?在同意之前,是否有人看过这类协议的具体内容?绝大部分的人都不会去仔细看自己所同意的协议,根本不知道要使用这些软件所需要签订什么样的协议,不知道自己同意了什么内容。现在的情况就是,即便仔细看了条款,试问如果条款中有不明确的点,或者存在不合理的情况,那就真的不用这个软件了吗?答案显然是否定的。人们不可能因为这个原因与互联网社会脱节,但是通过这样的方式签订使用协议来采集信息显然是不合理的。

  征信行业的参与者们不断地在探讨一个问题,就是如何保护消费者的信息和利益?消费者是否同意其他机构使用他的信息?现在人们的生活越来越离不开手机,当人们通过手机使用脸谱(Facebook),或者其他的一些软件的时候,我相信绝大多数人都不知道自己残留在这些软件上的数据被谁获取了,被用来做什么。同样的问题还存在于公司的兼并与收购,数据从第三方经转的二手数据,无人得知得知最后自己的信息将会落到何处。

  信息的采集和使用是否合理,这个问题已经无数次被讨论。从传统的打分机制来看,如果有人对打分结果表示不满,说分数不够准确,评分明显低了,但至少他能知道评分的依据,能知道这个分数是如何算出来的。例如不断的去银行贷款,不断地转换工作,这些都是评分依据。而在现在的数字化的环境中,由于信息量的不断增多,评分的维度也不断曾多,面对不同人格式各样的情况,我们没办法保证基于大数据而创造出来的算法是合理的。通过不合理的方式采集来的信息,被可能不合理的算法加以计算,得出的结果是否可靠,答案显而易见。

  大数据时代是信息社会运作的必然结果,它令人类的信息社会更上一个台阶,但前提是能够处理好它带来的各种问题,这是每一个参与者都必须考虑的。从数据的采集到使用,从算法是否可靠到资信角度的公正,只有每一个环节都合理合规了,大数据为人们所带来的能量才是正面的。征信行业的政策制定者,参与机构而言,需要迅速的改变自己,只有不断地改变才能适应新时代的步伐。希望今后的监管者能够不断地权衡,勇于承担起变革的责任,制定与时代相适应的规则,同时加以创新,不被传统思想所束缚,这样大数据的未来才是光明的。

作者:彼得·什瑞(PeterSheerin)

来源:数据观

2016年9月28日

0 responses on "大数据时代征信业所面临的挑战"

留言

  • 关注我们
  • 微信公众号
MDA的全称是管理数据分析 ,即Management Data Analytics,是一套专注于企业管理应用的数据分析课程。MDA课程是国内第一套来源于价值百万的企业经营数据化管理与应用项目的实践课程,致力于提高企业管理者的数据分析与应用能力。管理数据分析隶属于北京信宜明悦咨询有限公司。北京信宜明悦咨询有限公司专注于为企业和政府提供数据治理与数据应用方面的咨询和培训服务。
© 2016-2017 京ICP备12031969号-7