2014年10月25日,由eBay、CSDN共同举办的“大数据峰会”将在上海豫园万丽酒店举办。腾讯T4技术专家、数据平台部精准推荐中心总监李勇,以“腾讯大数据平台与推荐应用架构”作为峰会的结尾。内容简介:腾讯的月活跃用户8.3亿微信月活跃用户4.4亿QQ空间月活跃用户6.5亿游戏月活跃用户过亿如今腾讯的数据分析已经能做到始终“不落地”,即全部的实时处理。腾讯大数据平台有如下核心模块:TDW、TRC、TDBank、TPR和Gaia。简单来说,TDW用来做批量的离线计算,TRC负责做流式的实时计算,TPR负责精准推荐,TDBank则作为统一的数据采集入口,而底层的Gaia则负责整个集群的资源调度和管理。李勇还特别强调了数据平台体系化是应用基础,数据应用商业化是价值导向。数据平台体系化是应用基础,数据应用商业化是价值导向。腾讯深度学习平台的挑战深度神经网络模型复杂,训练数据多,计算量大模型复杂:人脑有100多亿个神经细胞,因此DNN的神经元和权重多训练数据多:大量训练数据才能训练出复杂模型微信语音识别:数万个神经元,超过50,000,000参数,超过4,000,000,000样本,单机训练耗时以年计,流行的GPU卡需数周深度神经网络需要支持大模型更深更宽的网络能获得更好的结果以图像识别为例,增加卷积层的filter数量,加大模型深度等,可获得更好的模型质量深度神经网络训练中超参数多,需要
...
继续阅读
(29)