天猫一天能产生多少数据?
截至2013年底,天猫已经汇集了8万商家,10多万品牌,服务近5亿消费者。2013年“双11”的那些数字仍就令人激动:6分钟07秒,成交10亿;38分钟05秒,成交50亿;下午1点钟,我们的成交已经超过了2012年的190亿;整个“双11”成交了350亿。
面对这么大的交易量,天猫日常的数据有多大的量呢?天猫每天产生的数据有80多个T,这80多个T的数据正是数据分析和挖掘的基础。在阿里巴巴集团内部,数据是打通的,很多数据要关联的分析。目前,天猫每天导购数据分析任务1万多个。面对这么海量的数据,如何能够做到精准、稳定又快速地响应业务多变的需求,一直是数据团队不断研究和解决的问题。
天猫大数据挖掘的对象有哪些?天猫大数据挖掘的对象主要有三类:
人。人是我们的消费者,只有了解了消费者的需求是什么,才能去精准满足消费者的需求。我们从大数据背后去挖掘用户可能不知道的一些需求,如用户行为偏好、行为轨迹等。如“宝宝计划”,通过对消费者购买行为的分析,判断他有没有小孩?小孩现在多大?处在哪个阶段?然后给出相应的推荐消费模型,点击率相比与之前提升了4倍。
(牛蛙网《电商黑马营-全网营销战略系统总裁峰会》,为期2天,由业内唯一拥有16年电商项目操盘经验专家团亲自授讲,近期开课时间:北京7月12-13日,深圳7月26-27日,上海7月26-27日,在线回复“姓名+手机”直接报名)
店。店是商家。一是招商。基于消费者的需求来指引商家的类型、商家提供的货品。二是助商。商家进来之后,怎么样帮助他们成长?尤其是一些传统品牌的商家,互联网化营销经验不足,我们需要通过数据化的产品教他们怎样去做。
货。要实现人和货的精准匹配,一方面了解什么样的货能够满足消费者的需求,另一方面清楚我们缺什么样的货。实现的路径主要有搜索、个性化推荐、营销活动等。
天猫数据挖掘的技术架构长啥样?
![天猫大数据挖掘解密 数据解密](http://img.413yy.cn/images/31101031/31074555t0179277a3409c40a4d.jpg)
首先是数据源。就阿里内部而言,数据源非常多,如天猫、淘宝、无线、1688、支付宝、小微等等。外部数据,则主要来自合作伙伴,如气象数据等。其次是通过hadoop集群和Spark集群等,建立各种主题的数据提示。建立数据提示的基础是,有很好的数据。很多数据是非结构的数据、有噪声的数据,需要把这些数据处理好,这样才能进行快速分析,建立商品、会员等各种数据提示。
天猫数据挖掘今后努力方向在哪里?
移动电商。阿里正在全面推进Allin无线战略。去年“双11”,前1小时无线端的交易额已超过10亿,这是很有说明性的数据。显而易见,无线端的消费模式和PC端完全不同,无线用户在使用无线终端时,时间碎片化特性明显。等红灯时、睡觉前都可以手机看下淘宝。如何利用这些碎片化的流量给整合在一起呢?从技术角度上看,我们要去做的就是,在移动电商时代,怎样把所有移动终端的数据都采集到一起。只有这样,前期积累的数据才会有用,才能会帮助我们后续对项目的理解和推动。
继续学习。尝试使用“DeepLearning”和新的算法在我们的业务上。面对海量数据,如何准备的进行数据采集、数据优化,如何快速实时地响应业务需求,如何保障信息安全这都是数据处理工作的挑战,都将是天猫数据挖掘团队今后努力的方向。