新买的智能学习机器人怎么联网,联网后可以离开手机吗?里面程序离开手机会不会消失?

原标题:流氓软件耍出新境界!当你睡觉忘了关掉手机网络…

13.9亿移动电话用户,几乎人手一机;其中,4G用户总数达到9.47亿;就在9月份,手机用户月均流量已经接近2G……这些数字,来自前两天工信部发布的最新数据统计。

惊人的用户基数,可观的月均流量。在每台手机上,社交聊天、旅行购物、拍照美颜、游戏娱乐……不知有多少APP应用又在这十几亿部手机上活跃、消亡。

那么,一直被诟病的APP应用市场现状如何,安卓手机上不断出现的“安一赠一”现象,究竟是怎么回事?

“有时下载了一个APP,结果发现安装完有两个应用,可能是没有任何用处的应用,或者是玩不了的奇葩游戏。”读者杜克来信告诉懂懂笔记,现在安卓手机应用“猫腻”太多了。除了捆绑安装之外,还有应用把用户手机当成了“广告栏”,不停地弹一些乱七八糟的广告,令人不堪其扰。更有用户在网上吐槽,不知道APP里捆绑的是否是手机病毒,有些应用一直在后台跑流量,如果是木马后果将不堪设想。

尽管有关部门和许多应用商店都采取了“严查”措施,也下架了部分疑似捆绑程序的APP,但却难以“根除”这一类流氓应用。而其背后,俨然已经形成了一条灰色利益链,不少“灰产”正在依靠捆绑APP偷偷吸金。

“其实捆绑(下载安装)应用的现象,从PC时代就已经普遍存在,到了手机端,手法上还是换汤不换药。”已经从流氓APP“灰产”洗手退出的嘉浩(化名),希望用他的经历,讲述流氓应用这几年的“发展史”。

早在PC时代,下载和发布免费软件人都在“耍流氓”

在家里人眼里,嘉浩2011年从大学毕业至今,一直“不务正业”,每晚对着电脑到凌晨才睡觉,整天蓬头垢面。如果不是去见女友,他甚至可以连续好几天足不出户。

然而,一台电脑对于嘉浩来说,就是“工作”的全部。

“身边的亲戚朋友,都不明白我做的是什么,但从大四开始我的确一直过得很滋润,再没有伸手要过钱。”嘉浩坦言,他这一份“不受待见”的工作是从大学时期就开始做了,最初做的是PC软件下载站的实习管理员。

对于很多电脑用户来说,缺乏“版权意识”是常态,从操作系统、工具软件到任何一款软件游戏,都可以从互联网上“扒”。只要觉得自己的电脑缺了什么,就会到网站上“扒”一个下来装上,“耍流氓”几乎都成了习惯。

“但是软件网站的软件不会平白无故让你下载,许多弹窗广告,都是他们的收入,但是随着规模的扩大,服务器、网站维护等费用成本就越来越大,做运营的不得不想办法弄到更多收入。”嘉浩说,在他进入这一行的时候,下载站“躺着赚广告钱”的日子已经逐渐成了过去时。

因为门槛低,竞争也越来越激烈。“软件站推荐的软件,大部分用户都是视而不见。”嘉浩表示,对于软件企业来说,软件在众多软件站上的下载量是非常重要的,这关乎他们是否能够通过“下载量”、“装机量”的要求,拿到可观的投资,或者把软件卖出好的价钱,所以简单的推广并不能满足他们的要求。

所以,为了满足这一部分客户的需求,许多下载站就开始以“装机量”作为硬标准,来要求所有的技术人员。

“那个时候,师傅就带着我开始做软件拆解,然后加上客户的软件安装包,重新封装。”嘉浩表示,许多用户下载了经过重新封装的软件之后,会在安装的过程中不知不觉把一些应用安装在电脑里,这种强制安装几乎无法察觉。

虽然是强制安装的,但对于开发厂商来说,软件的装机量一下子就上去了。效果达到了,软件站自然而然就可以从厂商那边拿到相当可观的推广费用。

不过流行一时的捆绑安装并没有让嘉浩这样的实习技术员获得可观收入,同时随着相关法律法规的严格限制,下载站纷纷下架了很多热门软件,捆绑安装也变成了老鼠过街人人喊打。

对于他来说,这反而正好是个机会,大学刚毕业,他就选择离开这个软件站,自己干起了捆绑软件的“灰产”。

一开始“接活”并没有那么简单,所以嘉浩只能继续打着下载站的名义,和许多有推广需求的软件厂商洽谈。最终,他只接到一些小的流氓软件和网页游戏的推广订单。

“因为我自己没有平台,所以我接私活人家也只肯跟我按量结算,每成功捆绑安装一个(软件),对方就会给我一两毛钱,这是最开始时候的价格。”嘉浩告诉懂懂笔记,经过他拆包封装后,带有捆绑安装的软件,一般都是通过群分享或者网盘分享给用户,一开始下载的量比较有限,他一个月也只能通过捆绑安装赚个两三百元。

过了一段时间,其中一家一直没结账的软件商要结算前几个月的费用。他惊奇地发现,那几个月的“推广费”居然有五千块,捆绑软件的装机数量高达三万多。

“刚好那段时间,(下载站)因为版权问题被下架的软件越来越多,所以很多人在网上搜到我的网盘和博客,下载的量就上去了。”嘉浩表示,被下架的大多是办公软件,而他分享的恰巧也是这些办公软件,加上那个时候网盘版权抓得并不严,所以自己算是赶上了一个机遇。

通过一两款捆绑软件赚了一小笔,他开始潜心折腾起了这项“工作”,通过挑选常用却又难以下载到的软件进行“捆绑”,在毕业一年之后,他凭借着头脑的灵活,突破月收入万元大关。

缺乏版权意识造就了一批“免费”用户和做“捆绑”的技术员。在PC时代,无论用户还是“灰产”,在免费软件的这个问题上大家都是在“耍流氓”。

移动时代下与时俱进的“灰产们”,“流氓”耍出了新境界

从2013年开始,智能手机开始爆发,全球智能手机出货量把PC远远甩在身后。但这对于嘉浩来说并不是一件好事,因为他的收入因此大幅减少。

“手机和平板的功能越来越多,性能也越来越强,使用电脑的人也就越来越少。”嘉浩告诉懂懂笔记,随着许多网盘的分享功能被加以规范,他开始瞄上了移动端的APP。

“相对于PC端的软件,手机APP的捆绑门槛就高了些许。”嘉浩说,为了实现APP的安装捆绑,他花了大量的精力研究了许多资料,决定从安卓平台开始“试水”,“毕竟iOS难度太大,甚至说不可能实现。”

经过一轮尝试后,他发现,虽然APP捆绑多个应用的方式较电脑软件复杂,但原理基本上和电脑软件相似。

“通过捆绑器把主程序和捆绑的程序解包,通过修改代码改变程序安装的流程,让其执行完主程序安装过在执行捆绑的程序,最后封装成新的APP。”嘉浩表示,为了避开许多手机安全软件的查杀,他还会对(捆绑)程序本身进行加密,让封装后的APP具有一定的免杀性。

此外,他发现周围同行还有一种方法,就是在APP中捆绑写入自动下载的程序,当用户安装完软件之后,程序就会自行启动帮用户下载其他的软件。这种类型的捆绑APP,往往最让用户防不胜防。

解决了APP捆绑本身的技术问题之后,嘉浩接下来就要解决分发渠道的问题。

“捆绑后APP需要上传到尽可能多的应用商店,让用户下载。”嘉浩表示,最难的并不是上传到各类APP分发的应用商店,而是要“逃脱”应用商店的检测,“一般(手机)厂商自己开发的应用系统我是不会选择的,因为有很多都是人工检测,(检测人员一旦)拆包就能看到有猫腻。所以我会选择第三方应用商店,因为绝大部分都是系统检测,有一定的漏洞。”

为了有更多用户来下载,他选择了手机上最热门的单机游戏作为捆绑对象,借助游戏本身的受欢迎程度,嘉浩获得了不错的下载量,“寄生”在游戏APP上的捆绑软件装机数量也十分可观。

据嘉浩介绍,那时还有一部分“同行”在游戏APP的操作界面和按钮上做“手脚”,让玩家不小心点到按钮或者触碰到相应的内容,后台就会自动下载安装另一款“捆绑推广”的APP应用。

“厂商一般不会管安装上之后有多少人卸载,只要装上就可以了。”嘉浩说,捆绑安装的这些软件,基本上有两类,一种是根本没有实用功能的软件,另一种是照搬别家应用功能的“山寨货”,因此相对于APP的留存率,厂商们更看重装机量。最终,大多数软件是要卖出去“套现”或者骗投资的,所以软件本身制作得也不走心。

当问及捆绑的软件被“强制”安装到用户手机上时,能从厂商拿到多少钱时,嘉浩犹豫了一下,“一般都是两三块钱,(遇到)有些豪气的厂商会给到五六块,这比(PC端)捆绑软件高多了。”

这样一来,嘉浩每个月通过捆绑APP的收入,反而比之前多了许多,当时他平均一个月服务八到十家客户,收入将近两万元,在旁人看来十分的可观。

但这样的月收入,依旧已经无法满足这位年轻人的野心。因为单靠第三方应用商店的分发,下载的数量依旧比较有限。

“许多热门的线上游戏,沙盘游戏,买家需要完成广告任务才能获得相应的游戏金币或者积分,所以我就想到通过这种方式来推广捆绑APP的下载。”嘉浩回忆,由于身边朋友刚好有这样的资源,帮他接洽到了游戏广告的代理商,通过投放广告,让更多为了金币或者积分的游戏玩家,不得不下载安装这些带有捆绑内容的APP。

除去每次下载安装广告收取的1到2元推广费,嘉浩似乎赚的少了,但他透露,自从通过游戏推广APP之后,下载与安装的量却“非比寻常”。最多时一款捕鱼软件曾在一个月内被下载安装了三万余次,仅仅这个软件就让嘉浩收入翻了番。

“互联网与时俱进,我们也在与时俱进,不然就赚不到钱了。”嘉浩说,现在他身边许多做APP捆绑下载安装的人,大部分都是以前PC端做捆绑软件的“老行家”。换了平台换了模式,但做的还是与以前相同的事情,“毕竟大家都喜欢下载已经破解的东西。”

因此,对于“灰产”来说,他们的“蜕变”和“进步”变得十分简单,捆绑还是那样的做法,依旧是第三方平台做“帮凶”,面对的还是同样心态的用户群体。

唯一不同的是,随着大家越来越依赖手机和Pad,“灰产”们可能对用户造成的信息安全隐患,比传统PC端更加严重。

用户习惯让流氓软件有机可乘,请当心支付工具里的钱

对于很多手机用户来说,APP捆绑下载或安装,的确是一件十分闹心的事情,浪费了流量和精力不说,许多APP还会大量占用手机内存,导致手机在使用的过程中变得越来越“卡”。

嘉浩强调,这并不是APP捆绑内容带来最大的危害,“如果捆绑的只是另一个APP,装一赠一只是占内存。但还有许多捆绑会给用户带来更大损失。”

嘉浩告诉懂懂笔记,有一些圈内“大神”并不会满足捆绑几个APP,赚应用厂商那点推广费用,更多的是向用户的话费、用户信息甚至支付软件下手。

“之前(某技术群)有发布过类似的APP,就是在一个看似正常的APP内捆绑自动程序,当用户下载安装后,程序就会自动通过用户的手机向第三方电信服务商发短信订购服务。”嘉浩表示,由于APP会拦截短信回执,并且会自动发送相应的订购信息,所以用户很可能在不知不觉中就被订购了许多付费的包月内容。

而这一切,背后的“客户”便是这一些第三方电信服务商。嘉浩表示,由于电信服务的利润空间十分巨大,所以作为“客户”来说,第三方电信服务商往往开出更好的“价格”。因此有不少“大神”热衷接这一类订单,并投入大量精力去开发相应的捆绑程序。

另外,还有一些APP里的捆绑程序,会让用户的个人信息近乎“裸奔”。

“去年出了一款备忘录APP,里面捆绑了一个程序,在用户通话的过程中会自动记录下通话录音,并且连同用户的通信记录一同发送给开发者。”嘉浩说,这一款APP的开发者经常在他们的技术讨论群里“炫耀”。

但是不久之后,就有许多开发者也学习了这一招,开发出好几个表面功能是记账、壁纸、变声......但实质上却是抓取用户通话信息和通讯录的程序,“另外,还有一些伪装的不良社交APP,在灰产操作下也是野草丛生,实现的功能也和这类似。最终用户信息会被高价售卖,因为里面包含了详细信息有用户名称甚至是常用昵称。”

不过,这还不是最恐怖的。还有一种APP可以在用户联网的情况下,远程操控用户的手机。

“有些表面看起来安全无害的应用,有可能里面被捆绑了一套病毒程序,通过记录用户操作手机时的动作,并且抓取部分截屏图像上传。”嘉浩表示,有“高手”在收集到一定完整性的用户信息之后,会在用户联网过程中对手机进行远程操控,转走用户支付工具里面的钱财,“虽然这种操作有一定难度和门槛,但也有不少这样的事情发生过,并且大多都发生在用户晚上休息后。”

无论是捆绑了APP还是其他程序,这些都是用户深恶痛绝的流氓应用,它们大量存在,并且随着应用分发渠道的增多,越来越难以被监管。

随着智能手机的普及,许多上了年纪的用户也都用上了智能手机,老年群体对于流氓应用的戒备心低,而且经常因为不熟悉手机操作而导致误安装流氓应用(或者是买到预装流氓软件的翻新机),对财产安全造成损失。

因此,对于手机的安全问题,尤其是安卓手机,用户们应该重视起来。有信息安全方面专家早就提示:如果需要下载应用,尽量选择手机厂商自带的应用商店,或者正规的应用商店;另外在下载APP前要先看一下应用评价,如果看到评价很少或者很差,口碑很低的软件,就要多留一个心眼。

最后,嘉浩表示,许多用户有睡前玩手机的习惯,然后就忘了关掉手机网络(包括流量与WIFI),这就导致了一些不良开发者有机可乘。无论手机有没有安装过奇奇怪怪的程序,养成夜间关闭手机网络的习惯,也可以有效杜绝隐私信息外泄以及被不良软件操控。

对于用户而言,中招多数是因一时贪念,成为“灰产”利用的对象。道高一尺魔高一丈,APP乱象有来自用户不良习惯的因素,也有灰产对于用户隐私及财产的贪婪觊觎,清理APP市场乱象,有待于管理部门和手机厂家、信息安全厂商更为紧密的合作,打压灰产的猖獗。只有这样,才能让13.9亿移动电话用户有一个更加安心的使用环境。

观众陆续入场,活动正式开始!

主持人】:尊敬的各位来宾,TalkingData T112018暨数据智能峰会正式开始!首先,有请红杉中国专家合伙人车品觉先生,掌声有请!

车品觉】:大家早上好!我讲的是认知未来,这个题目很大。怎么使一般的人可以知道未来呢?所以我想用我自己的经验和经历跟大家说一下我所看到的这十年里大数据的发展,到底是怎么样子的。

  其实从很久之前,在没有大数据这个词之前,我们一直都在做数据驱动。我刚开始做产品经理的时候,我进了微软,很多人都知道微软有一句话,就是你需要数据,在微软里面才能生存,因为每一个会开始时老板一定会问你,你的数据显示你做的东西怎么样,也要用数据来证明为什么要这样做,以及拿到结果也要用数据来告诉别人,你拿到的结果到底是不是你老板要的。还有一个非常惊讶的事,我的同事竟然超出了老板所要的KPI。老板说,你被炒鱿鱼了,那个同事当然不服气。他说因为你没有告诉我为什么超出,所以超出了也不行。

(红杉资本中国基金专家合伙人 车品觉)

车品觉】:在那个年代,到了1999年、1998年开始对大量数据的处理,已经开始有点感觉了。我也是在那个时候给我的前老板说彭磊(音)说,喜欢玩数据要进阿里,我们有大量的数据给你玩。那个时候实际上我们是摸着石头过河,我也不知道友商百度跟腾讯怎么做的,我只知道我是怎么做的。在那个年代你走进去跟老大说“请你多用点数据”,其实他心里讲走开吧,数据有什么用?我知道我怎么做决定的。

  2010年到2013年,我们把很多智能商业,就是所谓的BI做好了,所有人都能看见数据对商业能做什么。那个时候自己觉得蛮爽的,阿里当时的曾明(音) 教授跟我说,你明天开始想想怎么解散你的兄弟,BI应该是属于每个部门的,不应该有一个中央的商业智能部,你快点想办法。我很痛苦地回去跟兄弟说,想想办法,我们怎么样做。

我认为只有这样,才会出现整个公司的人有分析的能力,否则只不过是个中央的部门,把所有数据的活包了,分析都干完以后再给整个公司其他人使用。你觉得是不是很不合理?是不是很没有逻辑?因为最懂业务的人,往往是在业务的前端,而不是在数据分析师这几百或一百人身上。我知道今天的阿里也只有120个分析师,整个集团里面几万人都使用了这120个分析。如果一个中央的分析师要处理整个集团几万人所有分析需求,我觉得这是不可能的。

车品觉】:这件事情,我也做的可以了。后来突然之间马总找我说,现在我们不满意数据只用来做决策,帮助更多的高管决策,我们要把数据放在一个引擎里面。结果是我们拿一个部门来开刀,一个部门本来是运营的,后来砍掉到只用算法、只用数据来解决问题。

  我一口气说了这段历史,其实总体来说,我们都是把整个数据赋能给整个公司里面业务人员去使用,我们把数据赋能到整个公司的业务里面,而不是局部。

  从局部到分散,从人力到半人力,再到自动化或者是自主化,整个过程中沉淀了两件事情,沉淀了什么呢?一个是数据的本身。一开始我们使用数据,我在我自己的书里面叫做学好怎么用好数据,过了一段时间之后也知道怎么把数据养好。把数据养好,在阿里里面或者普遍来讲叫做已经懂了,知道怎么运营数据了,开始数据运营。把数据养好的时候,我们就发现其实需要做一些数据的治理。这也是我离开阿里之后,基本上我到每一家公司、到了很多的政府机构,大家都问我数据委员会到底是做什么的?我们所讲的数据委员会做的事情,我们认为一家公司的业务是垂直的,但是数据是要打通的。

  但是在很多公司里面其实并没有横向架构把数据打通,把这个东西打通说起来简单,但是做的时候非常难。说一个通俗一点的话,这个事情是会打架。大家对整个数据的资源和对整个数据所有的管权,到底是归属于谁的,到现在为止这些还是有蛮多争论的。在文化、在人才上的培养,我们到底怎么样让公司更知道怎么样可以把数据用好?我们到了数据智能时代的时候,在这张图里面2015年到2016年之间,你会发现在美国其实有大量的公司,责任是帮我们去作为一个中台。有人会讲这是一个数据中台,有说我们准备做业务中台,也有人说要结合数据+业务做中台。简单来说,中台的意思是我们如何把数据跟数据的技术,跟整个人才架构或公司里面的架构改变以后,让这个东西去孵化更多的创新出来,我们叫小前端、创新的前端。

车品觉】:用一个好的中台孵化更多小前端的创新,是我们中台的好处。为什么呢?如果你们公司是稍微有规模的公司,像当年我自己在阿里做数据的痛苦是什么?每一个部门都会跟我说,我们可以做一个轮子,意思是说他们觉得我自己也可以做一个中台的。讽刺一点来说,当年阿里也有四个中台,后来统一变成一个中台。你跟一些数据人聊天,几乎每一个人都可以画一个数据大图,数据大图都是他心里面的中台,到现在为止我相信大家听到数据中台这个字都不小了,但是很多人都没有领会到整个数据中台里面的核心。

  我自己的经验跟浅薄的见解,其实数据委员会最关键的东西不在于制订公司里面的数据规则,而是制订公司里面的数据文化跟人才的培养。数据中台的核心是在于大数据,在多元异构的数据之下,在数据中台里面到底你是怎么处理数据共享的,数据的共享与分享其实是整个大数据的精神所在。你发现其实数据委员会是软的,数据中台是硬的,所以软硬结合是无外乎人到底相不相信数据的分享可以释放更大的能量,让我们在这个地球上的人更好地服务我们所需要的,包括医疗、金融,在很多领域里面怎么超出今天的瓶颈,怎么让我们可以在未来创作更好的“药”,治好我们癌症的药,使在金融里面做的更好。种种的东西,中间依赖的东西还是到底我们在这里的每一位对数据分享的态度是怎么样的。

车品觉】:讲到这个地方,我们必然要谈到数据安全了。在座都是在大数据战壕里面的战友了,很多都是做大数据的,基本上都知道整个大数据的后面每天最担心的东西还是数据安全。我突然想到一句比较有意思的话,这句话比较奇怪,我慢慢来讲。到底是数据能力跟着数据走,还是数据跟着数据能力走?你们更相信是哪一点?在2014年、2015年,基本上行业里面的每一个人都相信数据必然要汇聚在同一个地方,数据的力量、数据的产能才能发挥出来,所以数据的中台实际上是帮我们生产数据的,或者是像石油一样地去练数据出来的。

我们应该听过一个词是算法下沉,算法下沉的意思是说,我们数据不会流动,不会把数据从A点到B点。但是我们用算法下沉的方法,变成一种联合建模的方法,让数据不流动,但是我们还是可以培养出数据的产能出来。等一下后面的讲者会继续讲关于数据联网,数据能联网吗?我们能不能像互联网一样,每家公司有一些数据有一个IP,可以把每一个数据包放在这个地方以后让别人可以去脱敏在联网以后使用吗?这个是非常值得去探讨的。但是这一点,到底是数据能力跟着数据走,还是数据跟着数据能力走?

在这一点上,我觉得从逻辑上还不难去解答的。为什么呢?今天我们在用云计算的时候,大部分的人都知道,肯定都会选择用混合云,因为我有一些东西是要安全的,但是有一些东西更希望使用数据是跟别人数据混合在一起以后产生更大的创新、更大的产能出来。

(红杉中国专家合伙人 车品觉

车品觉】:我想跟大家说的,到了智能时代的时候,我们其实从2015年到2016年往数据生态这个方向去出发了。我们需要的是有更多种种数据的中台公司、数据的中台到怎么样可以让数据安全变得很简单,这样的数据要在生态里面出现。更多小的公司,但是是有创意的公司也能利用数据的产能,帮助我们去创作一个新的文明出来或者新的企业出来。

我后面就是三张PPT,基本上把我今天讲到的内容总结了。其实数据虽然是不断增长,但是多元异构的数据,实际上让我们出现了非常多的挑战。如果你们都用数据就会发现一个非常讽刺的东西,数据科学家会跟你说我们分析的数据不够,但是数据的管理者会说公司的数据太乱了,很多东西要做处理。一方面我们的数据不断地碎片化的原因,因为其实是创新本身就是推向把数据变得更多的人拥有数据,而数据变得很碎片化。还有设备的增加、IoT的增加,本身也会让整个多元异构的数据更零散,这对于使用数据的公司来讲是非常大的考验。

车品觉】:我们整个公司每一个人,必须要从业务的数据化,到了业务的资源化,把资源成为帮公司作为决策,或者在智能场景里面能产出价值出来。同时数据也可以资产化,当数据资产化的时候,这个数据本身就是你的财富,这个财富可以给予别人使用,以及你也会得到更好的收益。

过去我们在设计一个数据中台的时候,往往有两套理念。一套理念是在我们右手边根据数据的生命周期去设计出来自己的数据中台。另外一方面,今天几乎没有一个做数据的公司使用AI或机器学习,如果我们把AI或机器学习放在中间里面很小块的话,你就会发现数据采集、特征提取、数据校验种种的东西,都是比机器学习更大的。我们为了要做好机器学习,为了要把数据可能产生,可以让机器学习和人工智能产生价值出来,我有无数的板块是需要保证数据的稳定,以及分享,这是我对未来中台的看法。

不仅仅只是在数据的生产整个过程中注意,还要注意今天的数据已经是网状的数据结构,并不是以前这么有层次的东西。当数据之间的联动是网状的时候,我们再用一个简单的数据生命周期去数据质量跟数据中台的话,我觉得是落后的一个中台。

(红杉中国专家合伙人 车品觉

崔晓波】:每一次听车老师演讲都干货满满,受益匪浅,每次车老师都说:我很紧张。但是上台就做他自己了,讲的特别好。车老师被大家众所周知的身份是阿里数据委员会成员,他打造了阿里的数据团队和阿里的数据文化,现在在红杉资本做合伙人。

  在座的诸位估计都看过他的两部对数据行业影响比较大的书,第一本是《决战大数据》,第二本是《数据的本质》,车老师也有新书在门口发售,确实引领了大数据的实践,也在着往前走。今天我宣布一下车老师另外一个隐藏身份,车老师也是TalkingData最神秘的组织——智囊团、董事会顾问团的成员。

 在TalkingData工作的小朋友,其实是比较幸运的,为什么呢?因为他们每个月都会看到像车老师这样横跨产业资本界的大咖来到公司里面,跟我们的团队一起工作,帮我们做战略的规划,落实产品的细节,以及梯队的打造。我们的顾问团对我们的帮助特别大,不是顾上就问问,不顾就不问,他们每个月甚至每周都要花很大精力给我们。

崔晓波】:顾问团其他几位顾问也来到了先,让我为大家介绍一下。

RosenblumGoogle负责好几条重要产品线的管理。后来他加盟了在大数据领域最知名的独角兽企业Palantir,他帮助了我们很多。还有如何做成效合作,如何创造新的模式,其实我们跟Palantir学习很多,也交流很多。每个企业都有短板和困难,所以也在不断地问为什么Palantir没有做数据中台,Eric Rosenblum也给我们很多观点。Eric Rosenblum本身也在硅谷做投资,在中美两地穿梭,希望帮助到创业企业、客户和合作伙伴。

  杨德斌先生,一看就是一位绅士,他是香港的太平绅士,这是非常荣誉的称号,他要做很多社区和公益活动,才有可能受到这样的称号。但是他的另外一个身份,实际上是香港特别行政区前科技咨询总监,相当于香港政府的CIO。他在7月份刚刚去职,在他的领导下他给香港做了整个五到十年的智慧城市的规划。他本人也是在国际智慧城市领域里面为数不多的既有产业经验,又有实操经验的一位专家,这个级别的专家,我也数了一下,其实是不超过10个人。听说有三位在这个团队里面,我就不剧透了,下午还会有更多的分享。

  Gordon Orr,比较可惜,他确实是时间安排不了不能莅临现场,也托我带来他的问候,他也非常关心TalkingData的客户和合作伙伴。Gordon Orr的背景也非常有意思,因为他是前麦肯锡亚太区总裁,也是联想公司的独立董事,据说在LinkedIn200万粉丝,也是美国的网红。他在整个战略规划和公司治理体系里面给我们的帮助也非常大。

  我也希望在接下来的时间里面,我相信在座的众多的客户以及合作伙伴会越来越多地看到顾问天团的身影,因为不只关心TalkingData,也关心我们的客户,关心我们的合作伙伴。让我们再次感谢他们!

崔晓波】:今天我们提到的主题是“突破”,这个图还挺酷的,昨天我第一次看到这个PPT也吓一跳,我觉得确实很有气质。突破了什么?TalkingData就是用数据说话,肯定先要分享一些数据的。T11大会今年是第四届,如果参加过前几届大会的人会发现,每年我们放的数据维度是差不多的。

  第一是会放整个中国智能手机活跃的数量,这是一个月活,基本上是13亿部。有人记得去年是多少吗?12亿部,基本上不怎么涨了。因为我老说,在过去十年里面大数据领域整个的发展,其实就是由于智能手机这个小小的设备带来的,因为这是人类历史上第一次出现了一个设备能够忠实的记录你线下所有的足迹,也能记录线上所有的行为,而且可以完美地把这种线上和线下的数据联通和打穿,历史上没有过。由于智能手机、移动互联网的高速发展,让我们第一次有了机会记录数据、利用数据,毫无疑问过去十年大数据的发展就是由于智能手机、移动互联网带来的。是不是数据不涨,整个领域就不发展了?其实不是。我们注意到虽然从智能手机载体不涨了,但是数据的维度还在不断地去拓展。

  前几年关注的是结构化数据像日志、行为等等,这两年由于传感器、智能手机的高速发展,你会发现大量的生物特征数据、人脸、DNA以及跟人体相关的数据,传感器的数据和机器产生的数据也大量产生,我们看到数据的维度越来越多,碰到的新的挑战像如何管理非结构化数据,如何跟结构化混在一起用,依然是我们面临的挑战。

崔晓波】:我们再往后面看十年,第二是在中国物联网设备已经达87亿部,去年是多少?大概是40多亿部,每年都在翻倍。我们看到物联网设备整个的发展趋势,其实跟智能手机在七八年前的趋势是差不多的,基本上是指数级。什么是指数级?就是每年至少要翻倍,这就是指数级,它是指数级发展的趋势。由于机器产生的数据越来越多,由于智能手机的数据维度也在不断丰富,其实未来的数据体量会形成乘积关系。由于手机和物体能互相感知到,会形成各种各样的场景还原和场景预测的需求。

  最后一组数据是行业规模已经超过了一万亿,因为我在做大会的时候,我让我研究部的同事去梳理这个数据时,看到这个数据我都不敢相信。我觉得大数据还是很早期的一个领域,但实际上拿到很多的第三方数据,我们校验了一下,特别是最近大家也看到了亚马逊的市值也突破了万亿美金,大概有30%的收入其实是跟大数据相关的。我们也注意到,不只是中国整个产业发展非常快,其实全球都是一样的。超过一万亿这样的产业,这个规模已经相当大了。

  这些所有的数据都在揭示的一点,现在数据体量不是问题。由于云计算的高速发展,存储、算力这些基础设施成本也不是问题,产业规模也到了。但其实在座的客户关心的是什么呢?还是回到这个原点,七年前我们创立TalkingData的时候,我们就说过其实我们做大数据,三个V、四个V都不在意,我关心的是能不能创造商业价值。到今天为止,我们还是在到这一点上,大家关心的是什么?你们那么多的大数据从业公司,我们这么多的人在试用、在试点很多大数据相关的项目,但是到底大数据给企业是不是创造了真实的商业价值和商业回报,这是我们这个大会要去阐释的一点。

崔晓波】:还有一个问题,这么多的创业公司,很多客户发现了商业价值,但是这么多的创业公司的商业模式成立吗?今年看起来在大数据很多创业公司活的还挺艰难的,最终的商业模式是什么?大家能不能赚钱?能不能很好地活下去,碰到的问题是什么,未来三到五年的趋势是什么,这是今天的会要去探讨的问题。

  其实TalkingData今年是第七个年头,也是七岁的生日。我更愿意把过去这七年所做的这种探索跟大家去分享一下,其实我们的探索一直是两个维度,我不知道在座的客户有没有感觉,其实我们一直尝试在两个方向去解答问题。第一个问题,客户到底需要什么样的产品和服务?其实第二个维度是什么?客户跟我们的合作模式是什么?这是TalkingData一直在探究的两个终极问题。

  我们在2011年创立公司的时候,那时候主要面向的是互联网客户、大量的APP开发者。我们注意到因为整个领域刚起步,更需要的是很多工具。需要工具就够了吗?其实我们在创立这家公司的时候,提供工具的公司很多,但什么原因让我们跟他不同?让客户喜欢我们?因为我们不只提供了工具,同时提供了分析的方法,我们发明了AI模型、漏斗模型等,教客户怎么去分析数据、怎么看报表,以及很多经典理论都是我们留下来的。

崔晓波】:同时注意到行业需要标准化,所以针对很多行业出了标准,帮助行业统一了数据的口径、度量衡的标准,所以这是我们在那个时代给互联网行业做出的一些贡献。到了2014年第二波浪潮来了,那时候大量的实体产业开始做移动化和数据化转型,我们最早的两个客户,当时我跟他们交流的场景历历在目,包括在招行信用卡,加龙(音)总当时拿着手机跟我说,未来三年招行不会再扩营业厅,这就是我们的主渠道。但是当时包括我自己是没有人信的,当时我就反问,我是招行信用卡客户,APP一个月就用两次,查一下余额,还一次款,你做它干什么?他说不是,我注意到很多互联网公司会运营,可以把一个非常低频的APP变成高频的,我必须要做APP叫掌上生活。

  在平安交付第一个系统的时候,那是马明哲马总自己来验收,我自己很惊讶。我说在我从业生涯里没有见过这么大的一个领导重视数据,他也告诉我,以后整个保险行业的转型,肯定是往这个方向走。

  我们看到了一些非常领先的企业,他们很有勇气在数据化、移动化方向敢于探索,但是时间证明他们是对的,虽然那个时候没有人信他们能做成、做的非常扎实。但是几年之后,事实证明他们有卓越的、领先的远见,所以他们在这个领域里得到了回报。

崔晓波】:在这个过程中,我们也注意到数据产业和互联网公司很不一样,很多基础的设施都没有。他们管理的更多是结构化客户资料、交易行为、资产数据等等,但是在互联网公司更多关注交互类数据都没有平台做管理,所以我们是第一个提供类似方案的人。

  同时注意到缺乏运营能力,跟互联网公司不一样,互联网公司产品即运营,所有的核心是要有运营团队,然后去负责所有的产品运营。但是你会发现传统企业里面对不上,我们也给银行、给券商给其他的企业提了很多建议,包括对组织结构的改造,所以打造了我们的咨询团队、数据运营团队,以及数字高端转型的咨询,所以形成了整体的解决方案。这是我们在2014年到2016连过程中服务了很多头部企业,给予了一整套方案,不只是工具、数据、服务,而是一整套的方案。

  在那个过程中探索跟客户的合作关系是什么?我们是咨询厂商?像麦肯锡、埃森哲、德勤等等,是一个解决方案提供商?其实我们发现这个商业模式也不对,为什么?我们发现虽然我们叫解决方案,但是并没有按照解决问题的方向去设计自己的商业模式。

  2017年发布了成效合作ROIP(音),T11会后很多客户来问我们,问我们是不是可以做成效合作?是不是一年之后TalkingData这个说法就没动静了?真不是,今天是客户的主场,在今天一天会有很多客户来分享我们在金融领域、零售领域、政府和制造以及其他领域里面通过成效合作到底给客户带来了什么回报,这一点已经毫无疑问看的非常清楚。在头部里面,坚持在这个方向去投入做成效合作的,确实效果已经非常明显了。通过数据的力量、智能的能力。我估计后面会有很多自己的客户来分享,我也不做更多的剧透。现在客户已经进入了智能时代,更多用能的利用做预测以及优化业务流程和转型升级、行业赋能。

崔晓波】:刚才车老师也多次提到数据中台,这也是今年我听到最多的词,基本上我见每一个客户都跟我谈,我在做数据中台。然后我会问,你的数据中台是干什么?他跟我介绍了。后来我就发现,这个情况有点像2012年服务互联网行业,所有都说我们在做这件事情,但是所有干的事情不一样,你说的和他说的中台完全不是一回事。那今天能不能把中台说清楚?TalkingData的数据中台是怎么打造的?你们也是数据公司,也有各种各样的数据问题要得到解决,所以这个是我们接下来要去探索的,以及要去诠释的问题。

  因为现在从成效合作的角度来看,我们看头部的企业都已经获得了收益。但是在腰部和小微企业,其实对这件事情无感,因为他还不知道头部企业已经取得了那么大的收益。比如帮快餐连锁企业的几千家门店提前一天准确预测出第二天分小时的进店客流,以及原材料的消耗数。一年可以帮他们省好几个亿。对中小企业想建一个同样的数据模型非常困难,因为要聚合14个数据源,不只我们的数据,包括运营商数据、腾讯的数据等等,那怎么去做?对中小企业是非常难的,这都是缺乏基础设施。

  在未来几年从2018年开始面临的难题是什么?头部企业探索出来的能力和方法如何更好地去赋能整个产业链里的中小企业,基本上就是这样的过程。因为价值已经毫无疑问是成立的,但是如何让这样传递的过程非常顺畅,更多的是需要靠数据中台来解决的。

  我们在这些年服务在座客户的过程中,其实我们提供了很多数据应用、解决方案等等。这些估计大家都是耳熟能详的,不管是智能营销云、广告监测平台、移动统计分析、移动运营平台、营销云、统计魔方、数据智能市场等等,在座的很多都是这些产品的客户。

崔晓波】:在这个过程中,从我们的角度来看大部分都属于比较偏业务的数据应用和数据解决方案,这是冰山上的产品。其实从TalkingData来说,我们投入资源更多的是在做冰山下的东西,因为TalkingData现在公司正式员工540人,加上合同人员包括实习生大概整个公司是700多人。但是投入在技术中间体系的就超过300多名员工,一半多的人实际上是在做这些东西。

  而且TalkingData一直认为我们需要做一些跟典型的中国技术公司不一样的事,第一件事是开放和开源,大家会看到我们所有的产品基本上绝大部分都是开源的,包括现在很多技术公司都在使用的像数据目录等,实际上是如何去管理数据资产。我们的数据科学平台、AI模型部署平台、数据安全沙箱、应用封装平台、地理应用平台以及大量的算法库、组件库,像情景感知框架、iview前端组件库等等。

iview是有17000颗星,大家大部分不是做技术的无感,在公司里面所用的最核心的并行的计算框架都是spark(音),iview在阿里、百度、头条、美团都在用,TalkingData是一直希望把能力通过社区、开源的形式开放给更多的技术人员、技术社区和合作伙伴。但是在这个过程中,其实我们的客户也提了很多要求,你光给技术人员开放没有用,我们需要一个平台,需要相关的服务,你怎么支持我来做这样的一些事情?

崔晓波】:在2017年的T11大会,其实我们发布了这个产品,我们叫数据智能平台1.0。我们第一次是对数据智能平台做了定义,什么叫数据智能平台?核心是基于数据智能的应用去探索商业价值的平台,不是个技术平台,不只是个技术平台。因为以前我们过于强调这都是技术组件,我是做工程、做科学、做算法的,其实我觉得他什么都不是。一个平台有没有价值,核心只有一个检验标准,就是能不能创造商业价值。特别是数据这件事情跟软件不一样,数据跟业务接合不好、不能创造商业价值就是没有价值,这是我们去年发布的产品。

  在发布产品之后,其实有一些头部客户、关键客户已经在使用,主要提供的是什么能力?去年我们对他的核心能力也做了定义,核心是提供数据管理、数据工程以及数据科学的能力,为什么?在前几年不断有客户、包括互联网客户找我们,说TalkingData在数据治理、数据管理,包括你们怎么做数据工程、数据准备、特征工程、自动化特征工程、清洗、管理模型、部署,他说这些我们是最需要的,因为现在还没有解决这些问题。那么多的开源组件,对模型的管理也没有那么好,生命周期、版本都不支持,你能不能开放这些组件给客户?我们基于这样的背景打造了平台,去年用了一年,其实结果还可以,所以今年我们把平台升级到2.0

崔晓波】:简单解释一下,第一是整个中台的定位,TalkingData就是一个中立的第三方数据平台,我们会继续去坚持中立第三方的身份,而且会非常开放。这跟很多数据平台的策略是不一样的,因为我们愿意把工程能力、治理能力、数据能力开放,我们愿意跟各种数据源、数据应用、数据技术合作伙伴去合作,一起去打造数据中台,这是我们在整个产业链里面的价值定位。我们不是服务所谓自己的小生态,我们也没有小生态,甚至没有自己的应用场景,所以我们只能是开放,跟大家一起去各种各样的应用场景。

  如果说T11大会整体说了什么?其实只要记住下面这三句话就够了。

  第一句话,连接,而不是拥有。像车老师所阐述的,以前大家做数据交换、数据共享最大的误区是什么?我想有你的数据,或者你想有我的数据,那怎么办呢?这就是僵局,未来谁也不会拥有谁的数据。不管是成本还是安全的角度,都不可能。那有没有一种体系,他强调的是我们能够把数据做一些连接,能够把所有的身份做匹配、影射,这个是我们在去年跟相关的部委以及监管部委讨论最多的话题。但是我们比较幸运了,其实我们得到了相关部门以及监管部门和相关领导的支持,所以去年我们也承建了一个秘密的工程,因为到TalkingData就会注意到我们有一个小团队在封闭的区域里面,别的团队都不知道他们在做什么,实际上就是在做这个工程。我们叫做国家1142数联网整体示范工程,现在一期已经完成,它就是未来整个大数据行业大家做数据交换的基础,为什么?因为这个是需要国家的授权和国家的参与,否则这件事情是没有办法去做。

  在下午的政务分会场里面,相应的部门以及相应的公司都会来做一些探讨,也跟大家做一些讨论,也就是数联网是什么想法。核心思想是连接,而不是拥有。我们把数据连上,而不是互相去拥有数据,先打通。

崔晓波】:第二句话,安全。其实我跟车老师探讨也蛮多的,什么叫数据安全?只要这个数据离开了你这儿,基本上就不安全了,这一点我们探讨是非常多的。怎么才能解决终极的数据安全问题?其实数据安全是两个问题,第一个问题是不是合法和合规的?第二个问题是你能不能保证我的数据是安全的,核心是这两个问题。但是这个问题大家以前老是以为是一种制度上的问题,包括很多政府部门也希望我只要做一个所谓的大数据的平台,只要把所有的数据都集中到一起就行了,其实最后发现完全不现实。因为每一个部门也会出来抱怨,我把数据给出去之后,那数据安全就会问题,因为数据本身有场景的。这个场景没有安全问题,但是不能保证另外一个场景没有安全问题,所以这都解决不了数据安全问题。

  核心思想就是第二句话,要解决安全问题,只能数据不动,通过算法流动来解决,这是一个终极目标。刚才我们提到了,我们数联网的基础框架,这整个体系是怎么做的呢?在利用TalkingData积累的70亿个TDID,这是一个完全做了脱敏和隐私保护的ID。通过它把它做成ID MAPPING的服务和算法,放到个各个数据源帮助做数据的匹配和打通,来解决隐私数据的问题。利用TalkingData强大已有的数据能力才能做这件事情,但是核心思想一样,就是让数据不动,所有的隐私数据都不用离开你那儿。我们通过这样的数联网 ID MAPPING让数据关联来解决这个问题。

  我们数据做了连接、关联之后,在上面做应用的时候如何保证在建模的时候数据不会发生泄漏。做模型有两个过程,第一是探索,探索的时候提供了类似于安全沙箱的环境,大家可以把数据在里面做混合,探索过程中不会出去。发布之后有一套算法,其实我们在很多媒体文章里也介绍过,麻省理工学院有一套算法是开放算法库,通过这种算法让模型在各个分布的地方去跑,而不用放到物理环境里面来解决联合问题。你的原始数据、标签和敏感数据也不用出去了,你就给出一个评分、模型,在上面有一个全局数据模型调权重,也能解决问题。所以这些问题都要通过数据不动、算法流动的算法来解决,这是一个原则,当然每个公司都会有自己的产品。

崔晓波】:第三句话,因为我跟很多人聊,你在做你的数据中台时我都会问一个问题,你怎么评价数据中台的效果?有的说技术组件多强、数据多丰富,我听了好久觉得是不得要领。数据中台理念的由来就是共享,为什么要做中台?就是因为大家要用同样的服务,要用同样的基础设施,碰到同样的问题,大家觉得没有必要重复去造轮子。所以要打造一个中台,把需要共享所有的能力放到中间让大家重复去利用,这个时候才叫中台。

  我觉得中国的技术公司和技术人员特别容易陷入两个误区,这是我从业几十年的感觉。第一是特别喜欢造轮子,没有任何一个国家的技术人员像中国的技术人员那么热衷于造轮子。第二个问题是文人相轻,永远说别人不好,我的比别人的好。但是未来在数据时代有这种思想一定会失败的,为什么?因为数据大家都明白,跟做软件不一样,你要把数据混起来、聚合起来才能发挥业务价值,所以这两种思想是绝对不一样的。

  检验中台是否成功的唯一标准就是共享能力,在TalkingData的环境里面,其实我对数据产品经理的要求就两个KPI,第一是中台这些应用的稳定性,第二是中台这些服务被别人调用的次数,我只关心这两个KPI。如果你没有能力做共享,这个事一定会失败。但是我们也是有很多实践,我们通过数联网,通过建立共享的中台体系,我们现在数据匹配度在行业上从69%可以提升到90%,标签维度以前是700个,但是现在在数据中台上是5000个,而且在不断扩充,为什么?因为大家的数据连上了。而且这种数据,可以分享出来,可以被共同去运用。我们跟很多数据提供方有联合的建模环境、四方建模环境。

崔晓波】:我们现在也是探索了很多业务场景,所以现在在建模上,实际上已经有50个预制的数据模型和数据服务。不多,但是这些数据比较实在,我们也希望跟大家去单索和打造更多的数据场景和数据服务。

  我们前面提到了数据中台,包括数据智能平台2.0,强调的核心就是连接、安全以及共享。但是以前的三大能力要继续演进,管理、工程和科学。在这一年我们服务各种客户,特别是数据科学团队的过程中越来越多比较注重时效,解决在生产以及在实际业务过程中碰到的实际问题。举个例子,像数据目录系统,现在已经演进了好几个版本。我们现在最新的版本叫协同式数据资产管理工具,我们发现所有的数据科学家、分析师碰到的共性问题,第一是找不到数据集,在一个企业里要问很多人这个数据集是谁用过,在哪儿,有没有问题?所以他需要这样的一套搜索、浏览、评论、共享,实际上是一套知识管理工具。当然我们也欣慰地发现,上周Google也发布了一个数据集搜索的组件,跟我们一年前的想法非常接近,但是我们已经在企业里运行了。

崔晓波】:第二是我们的数据科学平台,去年发布已经开始提供了交互、探索、建模,以及各种各样的算法能力。但是在今年,我们在实践过程中其实想法有非常的改变。因为我们进到很多企业里面,跟数据科学团队工作在一起的时候发现众口难调,没有办法让一个数据分析团队或数据科学团队只用一个探索工具,他们有自己的习惯。有人说喜欢用H2O,有人喜欢用SaaS,有人喜欢写脚本,我就直接在TensorFlow上写,有的公司数据科学家可以为了性能丢弃一切,就一行一行写代码,这些没有办法统一的。我们的思路就在改变,我们开始把数据科学平台变成非常开放式的,开始插入其他各种各类数据探索工具。

  最近像H2O估计在银行业是用的最多的数据科学,最近宣布跟我们战略合作,专门给我们制作了针对数据科学平台的插件以及demo体系,估计下午在门口也能看到。数据科学平台在探索时会更多集成探索平台和算法包。

  第三是模型部署平台,因为我们发现真正跑到一个企业里面去做数据模型应用的时候,他们最痛的点不是模型探索。最天痛的点是如何管理模型,如果按照我们的首席数据科学家如何工业化应用,因为一建就是动辄几千个模型,那生命周期怎么管,版本怎么管,如何去自动发布、上架和下架是非常困难的,这是实际中碰到的问题。我们升级了平台叫自助式AI管理平台,我们在最多的客户里面帮助管理10万以上的模型。

  我们的数据智能市场也在不断增强,在以前开放服务、开放数据集、开放数据模型、开放数据服务的基础上,其实我们主要增强了安全相关的能力。第一是我们对数据探索沙箱进行了非常多的安全增强,因为以前我们发现市面上有很多数据沙箱有数据泄漏的问题,所以我们做了很多改进和。TalkingData在工程以及科学上比较注重实效,解决客户在实际过程中碰到的生产环节的问题。

崔晓波】:回到这里,大家就关心除了六大核心能力之外,你们的数据中台到底是什么样子?从TalkingData本身来看数据中台长的就是这个样子,最底下是一个非常开放的数据平台,我们连接了很多数据,不只是我们自己的,包括运营商合作伙伴、电商合作伙伴,包括社交数据和中小数据源。我们通过数联网的方案,安全合规地进行接入。通过联合建模的方法,在做非常合规的应用。在这之上,其实我们有一个数据治理团队,其实我们不太喜欢用治理这个词,因为治理太大。每次在开会时,都会把所谓数据治理降格为数据管理,会提供像资产地图、质量控制、运营的能力。

  再往上是大量的工程工具,数据科学平台以及数据智能市场,已经预制了大量的模型图。像我们在零售包括政府场景里面,探索出来了像植入人口模型、选址评分模型等等,都会做成预制服务放在中台里面分享给大家。

  数据中台的核心,我们退回来去看一看,核心其实在治理过程中是分层。根据我们的经验,其实底下是需要一个治理团队,上面数据科学团队是比较面向业务的,所以需要大量的懂业务的人在上面这一层去做很多数据的应用和数据科学的模型,这是完全两种不同的人。中间要通过自服务和自动化方法来减少沟通和提高效率,这样才能去高效地运转。

崔晓波】:接下来我们介绍基于数据中台能力打造的一些产品和应用,其实这个应用大家在门口斜对大屏上看到了,这是一个真正的系统。它用了哪些中台能力了?用了我们的地图组件。请放视频。

  我们对于整个北京市的全区进行了3D建模,而且我们用自己的人口模型等等,针对实时城市模拟仿真系统做了人群投射。我们选了四个场景,天通苑是典型的睡城,东直门是交通枢纽,你会发现人口的分布、人群的分布。里面的小人是不一样的,这是基于去年人本数据实验室跟北京市做了项目,做了很多人群分类的重新探索。我们对大学生,包括对宅男等等做了重新的人群划分,实际上这是实时反应各种人口属性以及吃住娱信息的城市系统。它是基于我们数据中台打造的,既基于底下的图形引擎、算法模块和上面的高层服务。

  我们今天也隆重地发布,我们跟腾讯云的合作,因为腾讯云是全行业领先的云计算平台,同时提供大数据、人工智能的服务。其实我们很多应用也部署在腾讯云坚实的基础设施之上,它是我们紧密的合作伙伴之一。智选是基于数据中台,凭借双方的数据能力,通过互联网方法做了数据关联,然后联合打造了针对垂直场景的产品。我们是用来解决整个线下实体门店的选址、商圈诊断运营的问题,定位为智慧零售以及多元化的线下产业助力的产品。

  现在的效果非常好,我们在7月份发布产品之后,根据线上一百多家连锁企业的试用情况,大部分以前要花几周比较重体力的选址工作,现在几分钟可以通过可视化、数据化的方法辅助决策,能够做出快速关键的决定。大家会在们看到这样的展台,如果大家有兴趣进一步了解的话,可以到门口继续了解。

崔晓波】:第二个重量的发布,京东也是我们重要的战略合作伙伴。双方早就在底层数据级别已经完成了整个IT互联互通,在这个基础上,第一我们在智慧城市领域以中台能力打造了很多成熟的落地应用,为各地的智慧城市已经开始做很多应用的建设跟部署。在数据服务的层面,实际上我们结合京东特有的数据源,也在打造真正安全的数联网项目。今年我们更加重量级推出了这样的产品,我们叫智赢系列,我们基于京东海量用户的购物习惯,以及TalkingData大量的地理信息提供全站场景营销能力。

  我们跟中移动,物联网是未来大数据爆发的一个动力,所以中移物联是全球最大的公共物联网,拥有全球最大的物联网数据平台,我们双方成立了情景感知联合实验室。我们利用数据中台的能力,一直在探索整个物联网产业生态的发展。今天随后有一个比较重要的成果发布,中移物联李晋刚会来介绍一下。

  中国电信是我们最早合作的运营商合作伙伴,我们跟中国电信构筑了小蜗牛整合营销云平台,这个名字好像不起眼,但是这个平台非常重要。因为它是第一个真正安全合规的运营商数据的赋能模式,我们做了大量数据的安全、脱敏以及在密号、号码保护方面的工作,我们发布了联合营销云产品,现在已经在地产、零售客户里面得到了应用。目前看效果非常好,我们叫构筑安全合规的运营商数据赋能的模式。

崔晓波】:除了我们跟战略级合作伙伴在不断地利用数据中台能力打造真正的数据智能应用之外,还再继续投资布局。因为我们TalkingData是典型的阶级进行的模式,基于数据中台在赋能、加速投资的企业,让他们在垂直领域里面去探索各种各样新的商业模式,加速产业的突破。目前我们聚焦在AI、金融、零售、医疗领域,所以有很多领先的公司,让我们一起利用中台能力开发各种各样新的能力出来。

  这家公司是要重点推荐一下,这也是由我们产业基金刚刚投资的一家企业,叫BasicFinder,他们在整个AI领域做基础服务。你可以理解所有的AI公司全部是他们的客户,底层的数据标注、数据集管理,都是这家平台来的。我第一次去这个公司的时候呆住了,有一千个数据模型、一千个AI模型,有人脸、自动驾驶、货架。我问哪家AI公司能力最强,他可以如数家珍告诉你谁的算法好、谁的算法不行,所以是AI时代入门级的厂商。

崔晓波】:这是今天最重要的一件事了,因为我们形成了这样中台的能力,今天隆重宣布这个计划,我们叫百灵计划,实际上是TalkingData合作伙伴的共创计划。因为我们在接下来的一百天里面会开放数据能力以及算力,现在已经形成了各种各样的计算资源,然后给合作伙伴。我们想找到一百家合作伙伴,我们总投入一个亿去探索一百个场景模型,所有过程中都是免费的,希望迅速能够丰富中台的数据模型,而且能够帮助众多的合作伙伴找到真正的商业模式。谢谢大家!

  最后苦什么也不能苦教育,最重要的是人才,所以TalkingData大学继续赋能客户以及合作伙伴,请放视频!连续三届是针对北美顶尖的高校,我们注意到的一个趋势是学子回流,在中美的大环境底下非常多的学生愿意回国来工作,我们这个项目辐射了将近1万人,线上申请有1000多人是北美顶级学校的学生。通过线上选拔,有100多个学生进入TalkingData,我们给他很多实战类型的培训,再把这些孩子送到业务部门以及合作伙伴和客户的业务部门里面去实战,最终让他双向选择未来职业的选择。我们也希望今年继续除了数据中台,能够把人才工作做的更加扎实、赋能更多的企业。

  我相信大家迫不及待了,卖了这么多关子,大家还是关心客户做的怎么样,到底有没有真正的商业价值?所以有请我的合伙人林逸飞上台!

林逸飞】:大家好,我是TalkingData林逸飞!特别感谢所有的客户在过去一段时间里面跟TD在数据旅程上共同的探讨,下面我也会去讲述一下我们在数据旅程上做了哪些新的探索,取得了哪些新的成果。

  刚才崔晓波谈到苦什么不能苦教育,今天有一个题目叫“突破”,昨天是教师节,昨天最主要的突破是教育不再苦了,因为我们有一个超级教师叫马云,一个人拉高了所有教师所拥有财富的平均数,所以教育一定不会苦了,尤其是明年当他真的离开了这个岗位之后,我相信整个教育的事业会有一个巨大的突破。

  今天我跟大家谈的话题,当我们通过强大的数据中台开始去探索如何用数据智能帮助客户真正去实现在业务上寻求一些破,这样的路我们走了七年。有不少老朋友连续参加了TD的很多会,前年的时候我们谈到去看待这个世界上的数据有三重门,我们需要去穿透这重不同的门去考虑可以去运用的数据。

林逸飞】:两年以后在今天可以看到的是什么?随着技术的变化,水平网络的廉价,水平边缘计算的强悍,突然发现数据变成了一种四维度的考虑,进入了一种时空人物,在四个角度一起去探索整个的数据。我用了四个现在比较流行的词汇,考虑人叫KYC,所谓了解你的客户。考虑的产品、考虑物用KYP,了解你的产品,了解你所经营的物品是什么。空间,我们经营的场所。时不是时间,是时机。时和空在过去需要消耗巨大的成本才有可能刻画一个场所,更难的事情是很难推断一个心目中的动机到底是什么,为什么那么多人喜欢看《延禧攻略》。

  今天为什么这样的一些事情可以在数据中台来进行探索?你会发现技术变了,获取数据的手段变了,我们又有机会极大程度上采用很大的覆盖率去采用更多的数据,这个时候时空人物四个角度的数据成为了我们穿越三重门以后又可以去考虑的基础的平台。

  当我去跨过了三重门去开始做四方的数据,做时空人物数据的时候发现这个问题超级复杂,比以前复杂很多。我找不到一种特别合适的方式把这样的一些数据很好地图形化出来,我采用了层叠的形式。这些数据真的不是一个互相依赖的关系,这些数据会互相交叉产生催化,互相交叉产生增强。我们可以对时空人物四个角度智能化,所有数据可以被应用在时机、场景和客户上,这个时候当你想去处理这样复杂的一些数据,而且他们的门派又是如此的不同,你需要有一个非常不一样的数据中台。

林逸飞】:接下来的问题是什么?不可能这个市场上所有的数据在中台里面都会被存储,最主要的是连接,而不是拥有。你需和连接各种各样外场的数据,能够去整合这样的想法。前年我们去谈数据有自己的认知,去年推出数据中台。在过去一年甚至一年半的时间里面,我们跟很多的核心客户、跟众多的关键性的客户,在这几个角度上做了很多探索。

  中间的图是时空人物的图,在这一侧看到的事情,之前我们会花很多精力去考虑什么?人被数据化、智能化探索,今天发现可以把任何一个区块,100米、50米见方的区块上基本地理新制、路网信息、业态信息、人流信息包括所有人穿流留下了信息等等。突然发现地理区块的事情也可以变得鲜活,也可以变得智能。在这样一个过程里面,从去年到今年花了大概几个月的时间跟腾讯共同去探索推出了传统的产品,里面汇聚的数据量是惊人的。在这里面利用的空间插旗、深度学习算法,当一个区块被智能化以后,可以辅助企业去选择自己的网点,去以线下网点为锚地经营客户。这个时候发现人和场变成了智能化对等的元素。

  在这面我举了一个券商的例子,其实大部分客户这样看待自己的客户,所有客户在自己的企业里面都会经过这样一个客户的旅程,我谈的是客户跃迁。当他在那一端是游客,百无聊赖在你的窗口面前溜弯的人,还没有你的客户。当开始进入你的交易门的时候,进行一些交易是浅尝辄止还是变成你的深度客户。到重复购买的时候,是不是想其营销更多的产品,到最后进入了平台期甚至衰退期。整个理论非常简单,也没有出奇的地方,但我想说的是两件事情。

林逸飞】:我们花了两年的时间发现,数据中台再好,你有更多的数据,一定要跟具体的业务过程相结合。A券商跟B券商去应用这个数据,同样去管理一个客户的跃迁,不一样。券商跟银行不一样,银行跟零售不一样,零售跟汽车不一样,虽然都是一个客户旅程,但是一个业务的突破和真正数据之间的耦合,需要在行业里面通过大量的运营实践,去测试外面时空人物所有数据的反馈,形成这样的最佳时间。这是为什么后面谈到的成效合作伙伴,希望有两年甚至三年的合作过程,不是一蹴而就的,而是通过众多的最佳实践能够实践出来数据应用到您的业务领域里面,什么样的形式是最好,更容易见效。

  在这样的实践基础,TD在过去两年一直秉承这样的模式,我们叫从数据到数据(D2D)。后面的环是以始为终的过程,所有的起点是终点,所有的终点同样是起点,在两个维度同样能够呈现这样的关系。你做任何一次活动的运营,你做任何一次的数据运营可以没有最终的效益目标,但是一定要有一个最终的结果目标,这个目标是你用来做闭环的,是你用来做训练自己的数据的,是你用来检验自己的算法是不是合适的。在我们的运营活动中有很多最终的效益目标,它是真正的KPIROI导向的,这两个环在很多企业领导者脑子里面往往不会放在等量齐观的份,更关注ROI。一个数据被探索出智能在业务里体现作用的时候,它需要迭代。而这个迭代不是没有收获,收割的是你的数据资产。像我这一侧列出的是波浪形的前进,像前面谈到的招行,招行今年的财报第一条就是移动化,他们已经做了五年了,这是在不停迭代你的数据资产、迭代运营经验过程中所实现的。

林逸飞】:今天这几位嘉宾在我们的主会场、分会场都会出现,比如这是一家国有大型银行的信用卡中心,他的过程是先花了6个月解决DAU,什么是DAU?每月活跃客户数,先解决所有能来。我们帮他们去做运营,把整个的数据,把时空人物的数据应用到过程中,把DAU提高了9倍。当有了这样的数据之后开始做信用卡的分期业务,在接下来三个月左右的运营里面逐渐收到了成效,你会发现信用卡分期业务提高了30%多。

  中间一侧是干什么样的事情?这是某个大型券商的客户,券商的客户会发现握有一千万、两千万左右下载APP的客户,他们已经在我的门里面出现了。有些人会留下一些痕迹,有些人下载了就再也不来了,但是他们都是最接近我们客户的,但是他们有一个共性是不在这里做交易,那怎么让他入库?我们采用了客户旅程去做客户跃迁运营的手段,去刻划你有行为数据,我用你的行为数据来推断。你没有行为数据,用TD数据中台能够提供的外部数据资源一起去刻划这样的客户长成什么样,以此做不断的循环迭代形成相应的场景跟话术。最后做了这样的运营,在6个月以后的时间里面,我们会把既有客户外呼入库率提高了将近超过20倍。

林逸飞】:这边是一家很典型的大型服装企业,在去年双十一的时候男装、女装TOP10品牌里面,这家的四个品牌都在里面。他们的逻辑是真正?今天线上的流量见顶,移动手机也就这样了。原来线上的巨头都会非常感兴趣线下零售这么大的场,我如何去做整合?站在另一面,所有零售的运营商在想什么?我场内的流量如何做线上、线下的数字化,拿到数字化以后,可不可以帮助我来做经营。无论是叫阿里或京东、腾讯也好,希望我们是合作的关系,不是上下级的关系,根源在这里。经过了差不多一年半左右的运营,搭建了全国将近8000家店线上线下所有的平台,最后的结果印象特别深。当平台就绪之后,在今年的折扣季里面去推进服装的运营活动,ROI收效比例达到了94倍,怎么做到的呢?后面嘉宾会做分享。

  当我们经过了一年或一年半遵循了一定的流程,使用了很多外部数据,逐渐迭代出来的效果。这里有一个特别大的前提,我举到的客户画了一个像大脑图,在企业主或领导人心目里面要有数据资产的策略,不能只认为房子是我们的资产,资金是我们的资产,负债是我们的资产等等,数据同样是我们的资产。如果没有这样一个想法的话,很多的数据的迭代、收集跟收获很难被坚持下来。在这里拆借成几个,第一是数据资产要有管控的想法,可能具体到人财物。第二是数据拿进来要有增强的策略,没有一个数据拿回来是适合于所有的行业,拿到你家以后怎么对这样的数据结合你的场景、行业属性去增强。

林逸飞】:后面有两个概念,一个是数据再生产的概念,谁也不会连下天下所有的数据,谁也不会买下天下所有的数据。你拿到的数据,你的数据团队有没有把数据重新生产、重新提纯的能力。我们跟几个大型金控和零售集团,他们都在做这样的事情,拿到了很多数据,希望在数据里面生产出更多的数据。当我有数据生产能力的时候,你就会发现去年出小程序、小游戏,谁知道明天会出什么,当这个流量来的时候是什么模型,这个数据来的时候锻炼的是什么?不是连接能力,是在连接拿进来之后在企业有没有再生产的能力。这样的概念是在几个大型的客户里面取得共识的。

  当你有了这样基本的思路之后去展开右侧的部分,你看到的数据穿过原来的三重门,要更好地去看现在在空间、物本以及在时机出现的新数据源,他们也可以低成本、大覆盖量被获取,那你是不是已经把它做成你的武器了。有的企业在去年年底、今年年初已经在做这样的准备,并且取得了一些相应的收获。我举两个例子,这边是全世界最大的零售餐饮的公司肯德基、必胜客,他们做了很多事情,历时一年半把自己1.2亿的客户数字化,他们自己用的名字就叫数据银行,所有的数据被他们像银行资产一样去看待。经营了这些事情之后,线上、线下、卡券,无论是万达、阿里、天猫、腾讯的都是我的客户,他们留下了足迹我需要拿回来,我在全国将近1万家店,要去整合线下的数据。做完这些数据之后去整理,一级标签在行业属性有6000多个,今天被做了200多个场景。

【林逸飞】:随着这样的数据被集中资产化,并且有场景化之后,我们会帮他利用AI技术去预测客流、预测生产,我们会帮他做智能选址,看一个网点的实际化运营怎么样。整个的历时时间差不多一年半左右,现在在长期适用这样的数据资产取得收益的有四个部门,关键词还是刚才这句话,第一是数据当作资产,第二这不是一蹴而就的事情,要产生作用前年的一年、一连半的山是一定要爬的。

  这一侧的企业名字大家不一定都知道,但是有几个产品一定知道,比如说士力架、德芙巧克力,我听说全世界2/3的宠物都吃他们家做的宠物口粮,这是一个全球性的公司。他们干了一个很有趣的事情,去年一年旗下有9个品牌,自己统计了一下通过品牌曝光、效果类曝光和各种各样的投放,包括腾讯系、阿里系,有350亿次左右的曝光数据。涉及到的设备不去重超过10亿,这些数据代表了通路数据。这些通路上的数据代表了什么?你跟你的客户在交错时机上的对话,这些对话我们希望拿回来。在这个平台上干的就是这样一件事情,除了把自己的数据、经销商的数据、商业MALL的数据拿回来之后,这些数据拿回来精准地去做TA,我去计划客户损益表,很关键的是自有流量,什么意思?我怎么去建设自己的平台、自己能够通过对自有流量的建设,既跟头部流量合作,也跟腰部流量合作,也希望去找到热点流量,这个事情已经做了六个月。

  这两个都是我们说的,当它把数据当成所有业务的发动机给了相应的时间,给了相应的重视,把相应的数据资产做进去,这个时候数据中台或数据智能才能既价值。

林逸飞】:这一侧有三点,可能对很多客户来讲特别核心,很复杂的事情,在工程上有很多问题需要解决,而且很多问题是五年前、十年前的技术所不能回答的。现在又出现了数据科学,听是不明觉厉的名词。TD的平台有一个很重要的事情,我们自己在内部用的词叫“数据科学平民化”,什么意思?我们希望业务人员、原来的数据分析人员可以简单地应用一些数据模型,直接在现有的系统里面产生直接的迭代。不要让它总在实验室里面精雕细琢,然后拿出来以后没有能力。平台通过平民化的能迅速把数据科学、特征工程和模型在现实生产里面做相应的迭代。

  最后会去说一下去年我们有谈到有一个ROIP,基于ROI的合作模式。过了一年这样的情况怎么样?可以跟大家汇报的是,包括我们上午主会场跟下午很多自己的核心客户,我们就在探索不同形式下的ROIP的合作形式。我们简单分成了这样几种角度去看,是不是任何一个觉得我们都可以一起去探讨ROIP的形式?诚实地讲真的不是,我是一家做数据的公司,所以要看我能不能帮到你。前提是我会去看你的业务是不是数据化了,在你整个的集团内部资产化数据这个事情是不是很重要的事。

林逸飞】:TD所有的数据、资源和能力,跟您的公司之间的匹配度是什么样的。我们之间最核心的最后一点,ROI的标志或者这样一个衡量的尺度是不是双方都会感到比较舒服的?我也想定一个目标,不管那个目标能不能达到,你最好把钱全分给我。不可能。客户也希望你给我一个最难的题,我最后做到了。诚实地讲,我们需要在ROI目标上形成相应的共识,即使有一些先决条件,我们仍然找到了很多的核心客户,有可能不是头部,有可能在数据资产上先知先觉,有可能在数据探索的路上实施的更遭,有可能是大集团就是在推动这样的数据资产业务,我们确实去营造了,或者形成了几个基于ROI合作形式的合作伙伴,或者说核心客户。

  在过去的一年、一年半的时间里面也取得了不错的业绩。去年我们做了ROIP的想法,今年我们有相应的成效,以后我们仍然会坚持这样一种形式。很简单,我们信仰数据,我们相信当所有的时空人物被数据化以后,一定可以帮到每一个人的业务,这是我们所有的出发点。

  下面我非常荣幸地请到第一个核心合作客户,民生信用卡总裁陈大鹏总。有请崔晓波也再次上台!我们跟民生信用卡的合作也是在今年年初开始展开,陈总也是当时跟崔晓波两个人握手决定了这样的合作。时隔将近一年左右的时间,也想听听两位对现在合作的一些简单的回顾或者评价。

陈大鹏】:非常荣幸今天能够受邀参加盛典,今天早晨推门一进来,我就觉得我走对地方了。烟雾缭绕,就像西方圣地一样,正好符合我今天来学习取经的心态。今天不仅包括我在内,可能所有参加会议的各位,今天可能都从会议中学到很多东西。

  我们和TD合作,应该讲到现在为止有一年多了。信用卡传统上是一个劳动密集型的行业。我做信用卡行业也做了十几年了,原来长期无论是从营销到贷中、贷后的管理,基本上都是靠人力来解决。到现在为止卡中心还有一万多人。但是到近三到五年,越来越发现信用卡行业越来越离不开数据的支撑,刚才崔晓波也谈到了早期TD和招行的合作。民生信用卡中心,相对来讲处于相对觉醒比较晚的,但是还好我们搭上了末班车。我们从最近一年多和TD的合作来讲,确实也是尝到了甜头,从APP的合作开始也看到了TD在数据方面的强大分析能力,帮助民生信用卡中心对于客户的分析,从建模到贷中到贷后的管理方面都发挥了强大的支撑作用,也确实在数据上看到了非常显著的增长。我们也很希望借这个机会,能够跟TD展开更加深入的合作。

崔晓波】:不知不觉合作都一年了,我还记得第一次见陈大鹏总的印象,感觉就像当年见到平安、招行的感觉是一样的。为什么?我们发现整个金融转型就是三波,第一波就是移动化,第二波是数据化,现在第三波在做智能的时候,我问陈大鹏总你信不信这件事?陈大鹏总说我信,这个印象我特别深。第二我说我们的合作模式比较苛刻,现在如果让TD投入重资源,我们是成效合作?陈大鹏总说可以尝试。这两点感觉就对了。

  民生银行信用卡作为我们现在最重要的成效合作伙伴,我们现在在数据科学里面建了联合实验室,在探索智能包括机器人的能力,包括算法怎么去跟金融具体场景结合,能够创造出真正的商业价值,包括卡中心的APP、移动运营,包括在相应的风险管理、信贷系统,我们也做了很多合作的尝试。接下来我相信民生银行的各位领导和同事,应该会给大家带来很精彩的分享,继续谢谢陈大鹏对我们的支持!

林逸飞】:下面会请民生银行真正运作这个项目的曹总,跟大家讲讲TD在过去一段时间里面跟民生银行在整个的合作上面都经历了哪些、取得了哪些效果,有请民生银行曹玲!

曹玲】:各位来宾,上午好!我来自民生信用卡大数据部,我叫曹玲。今天我给大家分享的内容,主要是基于民生信用卡的大数据平台驱动战略,有一句名言被广泛地流传,这是一个最好的时代,也是一个最坏的时代。很多的名人讲过这句话,陈大鹏总也在内部经营会议上多次提到这句的话。

  为什么会提到这句话呢?因为大数据、人工智能、云计算科学界的变革,已经把所有的企业推到的变革的风暴中心。另外还有一句话,未来所有的公司本质上都是数据公司。基于这种对大势的判断和认知,民生信用卡提出了大平台驱动战略。下面我给大家的交流和分享主要分为三个部分:

  第一部分,分享一下我们对数据价值的理解和信用卡行业对数据应用的普遍现状。

  第二部分,介绍一下民生信用卡系统的建设和主要的数据产品。

  第三部分,介绍一下此次跟TD合作的一些主要内容,以及对未来的愿景。

曹玲】:第一部分,信用与大数据。

  我们民生信用卡从2007年开始进行数据的集中统一管理和分析,也是从那个时候开始了我们的数据分析系统的建设。经过十一年的发展,我们对数据的应用和理解有了一定的认知,在这里也跟大家分享一下。我们觉得数据的价值主要分成两个方向,第一个是在记录数据、记录信息,这是面向过去和现在,它应用在了我们广泛的经营活动中间,包括考核、业绩披露,应用非常广泛。要求数据做到精准化,保证传递的时效。这主要依赖于数据治理和数据系统建设的情况,这是非常基础的功能,它在过去和现在以及未来还将继续发挥着作用。按

  它同时也是我们第二个数据价值的基本点也就是预测未来,像这几年非常把的机器学习、机器学习的算法和迭代升级都是根据这个价值点实现,也就是预测未来。预测未来是根据我们过去所记录的信息,对过去信息的理解和规律特征的提炼作为基础来预测未来。理论上所有的决策点都可以用到预测未来的价值点。那它有一个最重要的要求是预测精准,我们认为要想做到预测精准,主要是做好两方面的工作。一方面是数据源的丰富性,这在我们内部也有过一些实践经验。当我们用更好的机器学习算法产生了效果,在有一些时候不如增加一个更有效的数据源对预测的精准会更有帮助,这是我们的一个实践经验。

曹玲】:第二个是算法的算法适用性和升级,在这里也抛出一个话题供大家去讨论,是否是所有的模型都要用机器学习的算法去做?因为机器学习的算法可能用到成百上千的变量去预测一个目标变量,对于我们以前传统的很多模型是用逻辑回归做的,可能只有十几个变量或者五六个变量。它的预测性能,理论上讲是不如机器学习的,在大部分的场合里面。那是不是机器学习要全面取代传统的逻辑回归的算法呢?我觉得这里是可以值得探讨的问题。我个人觉得人对于能够理解的事物会更加信任和相信,当这个变量成百上千有的是上万个变量的时候,这时候预测的结果你会信吗?所以在美国很多的包括医药的监管,对机器学习的算法还是持有保留的态度。我们相信,作为从从业人员来讲,希望大家更多地用到更好的工具,能够达到精准度预测的目标。

  讲到这里,相信在座的各位通过介绍了解到有很多来自于各行各业的TD客户,下面我想分享一下信用卡行业对数据的使用,以便于大家对我的介绍有所理解。

  总结出一句话,数据如同血液一般贯穿在信用卡的每一个经营环节中间。信用卡的经营环节,我整体了一下大概是分为六个部分,申请是我们的客户来申请信用卡,来获得一笔信用贷款。这个时候要填很多信息,数据的价值就体现在记录信息的作用上。然后到审核,审核时需要挑选出目标客户,这个时候要核实客户的信息是否真实。同时要预测,预测客户未来的信息,申请信用评分、收入评分、欺诈评分,这些评分支撑一个决策要不要核准客户以及多少额度。

曹玲】:进入激活环节也是非常重要的环节,如果客户不激活,那前面投入的所有成本都是沉默成本,所以希望客户有更多的激活。如果客户不激活的话,我回有一个激活相应评分,激活响应评分支撑我们对高响应客户采用更多自助渠道,比如发短信或APP通知的方式进行激活。对于中低响应的采用不同的方式促使激活。最重要的环节就是用卡,用卡环节是我们进大家做APP的运营理念特别关注的指标日活非常相关,信用卡也注重日活,就是每天用信用卡交易的客户。这是我们经营最重要的环节,也是我们特别关注的环节。在这个环节里面有一个典型例子是分期,分期的场景下是希望我们的客户做1224的分期会带来手续费,我们希望低风险客户更多去做分期交易。这个时候我们用到了分期响应评分、客户信用评分、客户渠道偏好,以及最优定价,给他一个最后优的定价。这四个工具帮助我们针对不同的客群形成不同的策略,后面还有退出和赢回。

  整个过程中间,大家会体会到数据如同血液一般贯穿在信用卡经营过程中间,所以信用卡公司本质上就是一家数据公司。

曹玲】:第二个部分,民生银行对信用卡数据的介绍。

  2007年开始进行数据大集中,整个从数据采集到数据准备、加工和发布形成了完整的流程。现在主要基于数据仓库,这是一个汇总所有的数据源进行指标汇总,进行指标标准化的一个平台。智能化的分析平台是面向我们的分析用户,主要是报表用户、业务用户。第三是大数据平台,这个平台主要是进行数据科学挖掘、机器学习算法研发的平台。在这个平台上,我们诞生了非常多的数据产品,这里有一个典型的产品叫叮咚标签,叮咚标签是我们场景化、即时分期营销的标签。信用卡在2017年产生了7.5亿笔交易,7.5亿笔交易里面通过这个标签疼痛精准筛选出有更高分期相应的标签,即时推送给营销部门,这样能够提升营销的响应度和营销的覆盖率。

  刚才讲了一个点,下面讲一个面,这个面是整个民生信用卡数据产品的矩阵,第一是全生命周期的模型,这里分为风险类和营销类做了很多支撑。另外是算法,这两年也在不停地尝试用机器学习的算法替代现有模型或新建模型。有用到神经网络、随机森林等等的算法。

曹玲】:第二是客户全景标签,刚才介绍了叮咚 标签是其中之一,还有一个是客户评级,客户评级的标签是内部骨干级的标签,我们从2009年开始开发,到现在为止迭代了第五期。这个项目获得了2013年全球亚洲银行家最佳分析奖,已经成为支撑我们非常多经营环节中的一个骨干级标签,比如说调额、催收、息费减免,也是应用最广泛、最深入的客户标签。

  第三个方面是重大课题研究,在这里我也特别地要提到一点,这个我们一直秉承着用数据说话的理念,为高层决策做数据支撑。之前跟崔总交流的时候,创建TalkingData也是用数据说话的理念是神吻合。在这里还有一个特别的,我们做过一个城市发展潜力研究的课题,把我们所辖一百一家机构信用卡未来潜力做了模型化、量化的分析和分类。从分类的其中,我们就用到了TD发布的一个成果,就是年轻客群在各个城市的流入和流出的情况,做出一个城市吸附力的排名,我们把这个作为城市发展趋势研究里面的重要考量指标,最后的研究成果应用到了内部分支机构的考核目标制订上。

  最后是定制化解决方案,我们会把模型、标签和一些数据理解和数据能力输出跟业务部门打造综合的技术解决方案。现在我们大数据也与各种科技深度融合,包括云计算、人工智能和移动互联,云计算和人工智能在后面会详细提到。在这里我就提一下人工智能,我们做了很多的智能语音机器人,还有服务客服机器人、催收机器人、外呼分期机器人。这些智能机器人的应用,能够提高我们对客户服务的覆盖面,降低了人工成本,提升了整个经营的质效,起到了非常重要的作用。

曹玲】:在这里大家看到高颜值的产品,就是近两年民生信用卡发布的颜值非常在线的产品。大家可以看到在右上角的萌黄系列,这两个产品“朕就是这样的汉子”、“奉旨刷卡”,获得了信用卡设计奖类似于全球最高奖项的一览奖(音),如果对这两个产品感兴趣可以到全民APP申请。

  大数据与云计算相结合有一个落地应用是智能审批决策平台,2017年民生银行信用卡发卡量达到了1000万张,这是超越了历史时期最高年度的发卡量,其中70%的发卡量是来自于网申,网络的申请就是通过智能审批决策平台实现,最快3秒钟能够实现审批。最后有一个数据介绍一下,自动审批成功率达到90%,什么概念呢?在2017所有的网络申请有1800万件,这1800万件的90%都是通过智能决策平台自动完成的,相当于节省了人工审批人员300人,做到这个结果依赖于三个方面。

  第一是由于云平台、云计算能力达到秒级响应。

  第二是采纳了更多更有效的第三方数据源。

  第三是建立了一套支持网络申请的模型。比如申请信用评分、收入评分和欺诈评分等等。

曹玲】:2018年,我们和TalkingData有了一次全面的战略合作。在我们看来,在跟TalkingData的深入逐步交流和合作,我们认为TD有两个方面的能力是能力的长项,也是实现我们移动的关键点。

   第一,在移动领域我们认为TD有非常丰富的移动运营的成功项目管理经验。

  第二,在数据方面我们认为TD有非常成熟的数据理念和数据应用推广的实施能力。

  这两点是实现我们移动战略不可或缺的力量,所以我们计划在未来从四个方面跟TD展开合作。

  首先是移动战略,移动战

我要回帖

更多关于 智能学习机器人怎么联网 的文章

 

随机推荐