上一周快速把全书股票部分浏览了一遍,因为跟着代码跑虽然扎实,但容易管中窥豹。快速阅读却可以立即理解量化领域的很多知识和困难。总结如下。
本书梗概
本书的方法以长线方法为主,包括各种均线相关策略、因子策略等等。本书中策略大都不复杂,可以粗略分为以下几步:首先选定一个交易标的池,比如一组股票、一组 ETF 等等,交易池的选取在本书中通常是固定的。然后,按照一定的规则,比如某个因子、某种均选策略扫描交易标的池,在满足条件时用一部分基金进行买入。卖出策略通常是满足一定的止损条件之后卖出等等。
这个过程中最重要的似乎是买入策略,但其实其他方面每一个点都可以大做文章,包括卖出策略、交易标的选取、资金分配等等,以及检测市场行情,在行情不好时主动终止等等。
本书中的策略,与传统的股票交易策略有很大的共同之处,可以认为是人肉交易升级版,将一般交易者的策略形式化、量化,成为代码。
本书给出了大量的因子,类似于机器学习模型的特征。各种量化库也有充足的因子可供使用。我现在的感觉是,作为一名业余投资者,能不能挖掘到有用的因子,很不好说。把策略的各种细节做好,寻求一个比较可靠的平均收益,可能更现实一点。
过拟合与机器学习方法讨论
由于本人知识背景,曾经考虑机器学习方法在量化投资领域应该会有很大的帮助。但尝试过一些策略之后,会深刻的感受到没有这么简单。量化投资领域的数据太少,长线投资数据更少。这并不是有多少数据点的问题,而是市场尽管已经存在了很多年,但市场一直在变化。某个现象,可能是近几年才出现的,没有人能够知道这个现象还会不会反复发生。机器学习最基本的假设是训练集与测试集同分布,但在投资市场上,这个假设很有问题。历史尽管会重复自己,但它每次重复都会有所不同。
即便是人工投资,也很难把握市场风格变化,很多投资者只能适应某种市场环境。机器学习方法适应能力只会比人工投资更差。因此,我的思考是,策略最好能够同时给出策略失效检测方法,在其自身假设不成立时,能够终止自身运行。
另一个思路是,通过 NLP 等技术引入市场之外的信息,是否能够得到超额收益?读过本书才了解到,一直以来,技术分析的基础假设就是,「市场包容一切信息」,因此尝试引入新信息是没有价值的。我不认为这个观点是绝对正确的,但它让我感觉,这个问题肯定没有那么简单。
动量效应与回归效应
动量效应是指,当标的价格上升时,会有继续上升的趋势。各类突破模型就是在动量效应基础上设计的。其背后的解释是,信息的传播需要时间。当某个信息进入市场之后,信息在市场的传播过程就表现为标的价格逐渐上升或者逐渐下降。
回归效应则完全相反,当标的价格上升时,会有下降的趋势。这背后的道理就是所谓的价值回归。标的价格剧烈波动带有情绪成分,因此会回调、超跌反弹。
所以问题就在于,到底是动量效应占据主导呢?还是回归效应占据主导呢?明显的,这在不同标的、不同参数设置、不同时期都是不同的。
本书给出的一个结论是,A 股市场已经是回归效应显著,因此各类动量模型会有不适应。另外,很容易理解,大牛市中动量模型会有优势,创造巨大的收益,但却仅限于牛市。而期货市场则是动量效应占据主导,因此,本书建议量化投资者一定不要错过期货市场。
投资者一个长久的话题就是投资与投机。我的理解是,投资是希望资金创造的价值,投资者获取收入。而投机则是人与人之间的博弈。尽管有再多的美化,不得不承认资本市场更多的是投机市场。因此,所有的策略都得考虑博弈属性,如何与他人竞争。至少,也要承认市场的投机成分,策略需要考虑投机带来的风险。
计划
接下来的重点计划,
- 尝试本书中的股票策略,作为练习
- 学习一些经典的稳健投资策略,比如「ETF拯救世界」使用的 ETF 低买高卖策略,并尝试将其量化