COHEN, L., MALLOY, C. and NGUYEN, Q. (2020), Lazy Prices. The Journal of Finance. Accepted Author Manuscript. doi:10.1111/jofi.12885
哈佛商学院Lauren Cohen的这篇Lazy Prices,2018年放在NBER上,现在已经被Journal of Finance接收了。这篇文章的题目就挺吸引人的,故事也是蛮精彩。
文章的核心故事是说,公司会对会计文本信息进行更改,包括高管对企业经营状况描述的措辞方式会发生转变,而这些变化与公司股价和未来经营情况都是显著相关的。甚至于,如果在Fama-French五因子的基础上,卖出信息变化的股票并买入信息不变的股票,构建的这一投资组合可产生年化22%的alpha收益!
从三个方面简单总结一下这篇文章的主要工作:
度量披露信息的变化
作者从SEC的EDGAR系统中提取了1995年到2014年所有的常规季度披露信息(10-K,10-Q等)的电子文件。将其中数字字符数量占比大于15%的段落去除,留下文本内容。作者使用了四种自然语言处理(NLP)领域的常见方法来度量季度披露信息之间的相似度:
(1)余弦相似度(cosine similarity),即文本的单词向量之间的夹角,夹角越小表示文本相似度越高。
(2)Jaccard similarity,即文本单词向量的交集的长度除以文本向量集合的并集的长度,如果两段文本全无相同单词,其交集长度为0,相似度即也为0。
(3)MED(minimum edit distance)度量,即将一段文本编辑为另外一段所需要的最少编辑次数,次数越少则相似度越高。
(4)简易相似度(simple similarity),即将第一段文本改写为第二段文本所需要的单词增加、单词删减以及单词改写的次数相加,除以两段文本的长度的和,再将以上度量标准化。
相似度越高,则披露信息的变化越少,代表公司是“懒”的。
此外文章中还用到了文本情绪(sentiment)的分类,代理变量的构建是通过Loughran and McDonald’s (2011) Master Dictionary(https://sraf.nd.edu/textual-analysis/resources/)统计出具有“负面”、“正面”、“不确定”、“有争议”、“强烈情绪”、“弱项情绪”以及“拘束”等情绪的单词的数目。
信息披露行为变化导致的价格变化
按照相邻时间季报的相似程度,作者将股票池分为了5份,其中Q1是相似度最低的,Q5是相似度最高的,检验Q5资产收益与Q1的差值,显著为正。且作者控制了Fama-French的三因子与五因子,投资组合仍保有超额收益。
尤其当采用Fama-French三因子作为控制变量,用Jaccard similarity作为相似度的度量,得到的超额收益高达年化22%。
作者在该部分也按照学术惯例做了特征分析以及Fama-MacBeth。
信息披露的影响机制
进一步探究信息披露行为的变化是如何影响到股价的。
通过固定效应模型(固定了公司和时间),作者研究文本相似度与文本情绪之间的关系,发现信息披露的变化与如下情绪指标相关:负面情绪,高不确定性,更多争议,更常提及CEO或CFO变化。
由于美国SEC的披露公告是分为几个section的,作者进一步研究了每个section信息披露变化的股价预测能力。
本文还有个大招,就是向SEC申请获得了下载报表的所有行为的时间戳以及部分IP地址,以此构建了一个“对企业公告的关注程度”的代理变量。通过这个代理变量构建交叉项,作者指出获得更多关注的年报,其披露行为的变化带来的股价预测能力将被削弱。这和本文的故事是一致的。
此外的细节就不赘述了。
一点启示
本文所研究的是一种模糊的信息,其对资产价格的影响也就有很长的滞后性,对市场的影响却是潜移默化且显著的。可见零碎信息中蕴含的潜力。