量化投资平台完全可以将机器学习算法融入进来,让用户开发出更好的中低频量化交易策略。
文│本刊记者 李 雪
2月26日,投资社交网站雪球上线“蛋卷斗牛二八轮动指数”。与交易所发布的指数不同,这一指数基于投资策略而形成,用可获得的数据、透明的投资方案,将一个多投资品种的投资策略的历史表现呈现在普通投资者面前。
此后一个多月中,集思录、果仁、优矿等多家量化投资策略社区对于这一策略的相关探讨不断增加。这类网站或提供数据,或提供可编程平台,吸引了很多对量化交易有兴趣的普通投资者。
3月中旬李世石与Alpha go的人机对战,更是引发了很多量化投资领域的报道。投资有没有可能用上人工智能,如何借助并获取超额收益等诸多问题,成为量化投资与智能投顾领域的最热话题。
量化投资究竟是什么?近一两年出现的线上量化投资社区类网站,对普通投资者而言,是怎样一种“高智商投资工具”?
完全基于数据去做投资决策
量化投资并不神秘。它是借助统计学、数学方法,从历史数据中寻找投资策略,并严格按照策略构建的数量化模型来指导投资,简而言之,是一种数量化的投资工具。基本面分析和技术分析可以看作传统的证券分析理论,而量化投资结合了现代数学理论和金融数据,依靠数据和模型来寻找投资标的及投资策略。
按交易频率划分,量化投资可分为高频、中低频交易两类。对于普通的股票交易,国内主流策略仍然是中低频交易。由于操作频率并不频繁,手动操作即可实现大部分交易过程。目前出现的多家量化投资社区类网站、APP,也大多服务于这一类市场。
对于普通投资者而言,独立开发策略、投研、风控、运营及后台IT系统成本巨大,设计投资策略、构建组合并回溯策略历史表现的过程也十分繁琐复杂,借助这类社区类网站提供的数据分析工具,上述过程更加容易实现。
集思录是出现较早、提供数据的低风险理财社区,早期深度涉猎的投资品种是债券、可转债、分级基金,并逐渐扩展到高息股、套利等。2014年末至2015年,分级基金成交极为活跃,围绕这一产品相继出现了申购赎回套利、分级B爆发、分级AB下折等事件。围绕分级基金的公开数据与预估算法,集思录论坛涌现出大批投资策略与探讨,其深入程度甚至吸引了很多投资机构人士。集思录副总裁郑志勇介绍,集思录创始团队的初衷是“为投资者自己服务”,希望做一个中立的信息平台,搜集、核对、发布投资数据,对其进行可视化呈现,供投资者去发现其中的投资机遇。在这一过程中,集思录渐渐聚集了很多专注投资低风险品种的高净值用户。
2015年下半年上线的果仁网更倾向于投资策略的效果呈现。借助果仁网的平台,对量化理念有所了解的投资者可以在其简洁界面上实现基本面选股、量化择时、设计投资组合,自行设定交易周期,并对投资组合的历史表现进行在线评估,获取历史净值走势和组合的风险评价。如果投资者不懂编程,这样一套完整的对量化策略的回测与评估,通常在传统的交易软件上很难实现。创始人冯迅介绍,果仁网是面向非编程人员的量化平台,“一般人认为量化等于编程,其实这是误区,编程不是数据分析的唯一途径。”
嘉实旗下的金贝塔是基于“聪明的贝塔”策略打造的证券组合投资平台APP,采用“证券分析师大V+普通投资者互动”模式。聪明的贝塔(smart beta)是基于确定规则的主动投资。在这一卖方分析师和专业投资者的展示、交流平台上,用户可以构建投资组合、获得模拟投资组合的评估,也可以观摩、跟踪明星分析师的投资组合。该平台基于量化研究团队和分析师模式,通过量化手段,创建并提供契合不同市场风格的证券组合。
此外,基于编程的量化投资平台也日渐增多,如优矿、聚宽,米筐等等。这类可编程平台的用户通常具有IT从业背景,懂编程,依托网站提供的在线编程工具与数据库,可以实现数据计算和维护、开发模型、回测框架,构建策略,模拟交易,改进策略。“优矿目前可以提供大量因子数据,高效、真实的回测框架,进行股票多空,宏观对冲,统计套利以及事件驱动等主流的量化投资分析,更重要的是极大简化了量化投资步骤,降低了门槛。”优矿团队人士介绍。
雪球发布的“蛋卷斗牛二八轮动”指数,实际上是基于量化 投资方式的自制策略指数。
投资行为的PDCA循环
如果仅仅是数据分析、可视化呈现,文华、金字塔等老牌软件也完全可以实现,每一轮牛市都会吸引一部分投资者,希望借助数据分析工具解决投资问题。这一轮牛市兴起的量化投资热,与分析软件有什么区别?
“工具是次要的,关键是思想。”鼎级论坛版主、雪球大V“持有封基”说,自己用得最顺手的工具是EXCEL,“对于工作可以建立严格的量化管理体系,2006年我做投资的时候借鉴了这个思路。量化投资坚持一个重要的思想:实践是检验真理的唯一标准,只不过我们用回测去替代了代价昂贵的实验。”
从投资策略的构造、参数选择,到调用过往数据观察策略历史表现,用绩效评价标准化指标去评估策略的历史表现,再对方法或参数做出改进,观察调整后的表现……实际上,“计划(Plan)—执行(Do)—检查(Check)—行动(Action)”的过程正是管理学中常见的通用模型“PDCA循环(戴明环)”。量化投资将这一过程交由历史数据不断“实践”,来帮助投资者做出有数据支持、更为合理的决策。前述量化投资社区则为这一过程提供了更便利的历史数据与数据分析工具。
超越基金(筹)金融工程部主管杨博理接受采访时表示,对于个人投资者而言,量化平台把一些较为琐碎的事情都处理好了,用户只需要有一个好的思想就可以方便地完成回测,然后将策略跑起来,对于没有资金完善基础设施、缺乏时间持续运营策略的个人投资者来说,这是很有吸引力的。
普通投资者经常遇到的困惑是,在投资过程中很难抑制人性中的贪婪与恐惧。果仁网创始人冯迅表示,量化可以很好地克服这些问题,让投资者形成良好的纪律,“量化投资不仅研究收益,更重视风险的计算,经过量化思维训练的投资者也将是更成熟的投资者。”
策略同质化与“踩踏”
每一种投资策略都有适合其应用的市场环境,当市场与参与的投资者发生变化,同质化策略使用者过多,往往会带来“踩踏”事件。
2014年11月末,券商与军工股开启了一轮牛市,分级基金B类接连涨停,对应的母基金大幅溢价,集思录的用户群体大批参与分级基金申购套利,一轮套利下来,收益甚至达到30%以上。随之而来的是,参与申购套利的投资者越来越多,分级B类大幅跌停,最终母基金整体由溢价变为折价,一二级市场差价消失,最后参与的投资者多半以亏损收场。
另一个案例是基于20日均线的进出场策略。以成交活跃的创业板ETF(159915)为例,2016年3月17日,创业板指数上穿20日均线,该ETF的收盘价与其参考净值相比,溢价近0.6%,4月20日下穿20日均线,其收盘价折价接近0.8%。跟随这一简单策略的资金量显然已经十分可观,对场内交易形成了明显的冲击,这部分折溢价带来的交易成本增加,也将对策略的预期收益产生明显影响。
投资策略的效果往往会随着市场环境、资金容量的变化而变化,执行策略的资金量接近市场容量极限,边际效应会越发明显,甚至导致大幅亏损。对于伴随资金容量而来的“踩踏”风险,集思录副总裁郑志勇表示,“集思录本身是免费中立的数据展示平台+讨论社区的模式,数据与策略是分开的,基于相同数据产生的策略也会有区别。”多策略本身是对投资风险的分散。
与此同时,郑志勇直截了当地表示,信息公开透明对大部分投资者而言“是好事”。数据可以量化考察风险,而中立的数据服务、更加公开透明的探讨与交流可以帮助投资者认清风险,进而采取相应对策。例如在分级基金申赎套利中,集思录会提供分级母基金折溢价、份额增量、净值估算等大量数据,投资者可以回避很可能会出现流动性陷阱的标的。此外,目前集思录论坛每天发布的日刊“会及时发现风险,告诉大家”。
对于这类量化策略参数过于一致的现象,中国量化投资学会理事长、《量化投资-策略与技术》作者丁鹏提醒普通投资者,还是要多策略、多周期组合,不能将资金放到少数策略上去,而是需要合理的分散。金贝塔相关人士也对记者表示,目前平台官方量化研究团队也是通过创建多种契合不同市场风格的投资组合来避免这类风险,并借助专业投资“大V”解读来提高用户风险意识。“截至2015年年底,官方量化团队创建模拟组合61个,包括40个主题投资、14个量化驱动、6个事件驱动、1个技术分析和3个固定收益类。”
冯迅也表示,成千上万人追随一两个策略,轻则造成策略快速失效,重则造成市场震荡,并不是量化投资合适的“打开方式”,只是普及量化知识的过渡期。健康的量化社区应该有大量策略,去利用股市中各种大大小小的无效性现象,平台也应该帮助投资者真正理解这些策略,合理配置资金,从而稳定地获得收益。
某种意义上来说,策略失效意味着超额收益的消失,市场充分反映了这部分交易信息。冯迅举了个例子:“当前有效的量化策略大多是基于情绪面的策略。当这些策略获利时,就在收割情绪相关因子的收益,并使这些因子的回报率逐渐降低。市场情绪有正常波动和人为推动两层因素,有些庄家主要靠人为推动情绪赚钱。如果推动情绪波动的回报率降低,庄家这么做的动力就会减少,这也意味着策略平均收益率会更接近成熟市场,对股市的健康发展和大众投资者而言也是有益的。”
“段位不同”,会不会“吃亏”?
3月中旬,李世石与阿尔法围棋(Alpha Go)人机对战,最终以1比4惨败落幕,令无数投资者印象深刻。围棋与投资同样是基于博弈策略,人类在围棋上败北,人工智能介入投资领域,会不会“所向披靡”?普通投资者参与最多的中低频量化交易,会不会沦为复杂算法与高频交易策略的“韭菜”?
丁鹏并不认为中低频量化策略会随之失效,“国外本来就是以中低频量化为主,国内也是,这是主流方向,不会改变。只要市场上还存在不确定性,就有量化投资的机会,比如多因子模型这种基础性的策略,永远不会消亡,只会不断升级和优化。这与投资策略的高阶低阶没有关系,和策略的复杂不复杂也没有关系。”
“金融市场中的投资交易和围棋是完全不同的两个领域,围棋是固定规则下的完全信息博弈游戏,而金融市场则是信息不对称的市场,输入端相关信息体量极大,不易建模,输出端的价格又充满噪音。”杨博理表示,人工智能在金融投资领域上的应用必将有进一步的发展,但简单套用人工智能算法是不切实际的,蒙特卡洛等模拟方法也难以合理的增加样本量,这都是制约人工智能技术应用的现实因素。这方面的探索有两个方向,一是找到合理应用人工智能算法的途径,二是以人工智能技术为辅助,挖掘出更多有价值的信息。对于前者,也许偏爱语音识别专家的文艺复兴科技已经(或曾经)找到了正确的路径,对于后者,大数据基金正在求索当中。“我是看好未来有人工智能技术傍身的量化策略攫取一大桶金的,但是一个量化策略一统天下肯定不可能,谁去做对手盘呢?”
冯迅同样认为“算法不可能自己把所有赚钱方法都找出来”,“Alpha go对李世石之战,本质上是‘数据+计算’和‘定式’的对决。人类有大局观,但计算速度比不上计算机,而 Alpha go 依赖大量对局的复盘计算,从数据中寻找规律。如果要在投资界做类比的话,这正是量化方法和依赖专家、媒体、经验来投资的两种方法的对决。量化平台完全可以将这些机器学习算法融入进来,让用户开发出更好的中低频量化策略。”
“草根”量化圈的另一种资管生态
2015年以来,国内底层云服务设施已经实现规模普及,在这一基础上,借助社交平台、提供量化投资工具的平台型社区不断上线,进而带动了另一种草根生态:掌握多种跨界知识的普通投资者在社区交流、学习,发掘策略,实现策略开发者、数据提供者、投资者/资金方等对接。
在多家量化平台上,量化策略的“原始积累”已经开始。冯迅介绍,目前果仁的策略集市已经积累了几千个投资策略,“我们有自己的评估体系,一些评分高的策略,确实跑下来结果也相当好。下一步是让好策略服务于其他投资者。一个可能的方式是在平台上供投资者缴费使用,另一个是将策略提供给私募基金,开发者和平台分享部分管理费。”
量化平台对众多投资策略的“跑分”式公开筛选,也适合注重投资业绩考察的FOF进行投资。丁鹏对记者表示:“量化投资真正难的是模型的建立和升级,这个又与宽客自身的素质和研究能力有关,未来的量化在散户和机构两大阵营会做出分类。关注这一领域的FOF一定是直接找最顶尖的私募宽客来做交易。从这个角度说,量化社区平台比券商自营和公募基金更加有优势。”
另一方面,在雪球、B站等年轻投资者汇集的社交网站上,多家量化平台不断推出“用户手册”和”“培训教程”,以此吸引更多用户,让更多的普通投资者接触并使用量化投资工具。策略创建与使用的直接受益群体是普通投资者,而这些用户成长后,也将为平台带来更多的策略,实现良性循环。
在散户居多的A股市场上,掌握量化工具的普通投资者也会收获更多的投资机遇。冯迅对此很有信心:“在量化领域,大型机构投研能力强,但是许多投资机会的市场容量有限,资金体量巨大的机构无法利用这些机会。量化基金收益往往随着基金规模增大而下降,一些世界最顶尖的量化基金在后期纷纷退还投资者的钱,只管理自己的资金。这些充分说明大不是优势。散户所用的武器威力虽然不如大机构,但可以选择自己的战场,获得超额收益的机会长期存在。”