**作者:**罗应琏(北京维艾思气象信息科技有限公司),朱珊(中山大学华南统计科学研究中心) ,何顺(中山大学华南统计科学研究中心),周翔(中山大学华南统计科学研究中心),李昶(北京维艾思气象信息科技有限公司) ,王学钦(中山大学华南统计科学研究中心)
摘要:自建国以来我国的气象系统已经十分完备,2015年中国气象局发布27号令后使得气象数据迈向开放数据(Open Data)新阶段,行业与公众可以使用海量气象数据助力企业,目前行业数据和海量气象数据还没有得到完全应用。本文主要研究气象数据对销售的影响,进而利用气象数据特性完成天气驱动行业销售的预测。我们以两个零售行业的销售数据为例,结合气象局提供的天气数据进行分析。同时,我们在分析中加入了经济因素,如上证指数和CPI数据来提供外部环境支持。与传统的预测不同,在气象数据中,我们不仅知道目前时间点的数据,也有目前公众唾手可得的未来七天精确天气预报。我们采用目前流行的机器学习算法随机森林来建模,得到了很好的泛化结果。我们的预测模型可以解决销售行业传统通过从业人员的主观判断进行销售预测的局限,利用大数据分析实现更加精确可靠的指导。
关键词:气象数据、销售预测、随机森林、大数据分析