同样的道理，在弱平稳的假设下，可以根据历史数据方便的对时间序列的诸多统计量进行推断。

首页发布

不懂基金，股票，那又如何理财，聊聊不需要技术性的逻辑思维。
全国复产复工在即，但是外围缺是疫情迭起，如果说经过一段时间的停工停业，再加上外围的环境影响，关于我们生活的，我们最先要解决的是什么？
我想可能是吃饭问题。米（相关板块去找），有米饭了，是不是得吃点肉（相关板块去找），生活如何阶段性恢复了（温饱了），是不是找点乐子-出门周边游需要用到啥？
不过还是先把温饱解决了吧，不用担心资源不足去囤货，因为我们有强大的国家在调节。
思路是这么个思路，做股票，基金，并不是说不懂指标，k线，量能就没法赚钱，因为参与的都是人，做的都是未来的预期，大部分人往一个思路想并发力的话，那也是能赚钱的。[挤眼]

#周二刷新# 我们要聊聊Donald Glover的新专辑、Kanye West和Taylor Swift那档子事儿、Rihanna等名人捐款帮助受疫情影响的人群、美国政客提前抛售股票、#留学生该不该回国#……还有AR与法老合作未发行单曲独家首播！上周给我们留言的藏族朋友回复了，还有很多语音留言来自你们。本期调查话题是：你会因为交往对象不注意疫情期间的防护措施而对对方改观甚至分手吗？
收听节目：https://t.cn/A6zshN9j

Playlist：
Donald Glover - Algorhythm
Onyx - Bandits ft DJ Access
IJAPA - 没完没了
AR & 法老 - 一丢丢
肥宝 & 笑面罗刹 - 牛鬼蛇神
Kanye West - Famous ft Rihanna
Rihanna - Spliff
艾热AIR - 你要离开吗
龙胆紫PurpleSoul - 忙碌的人
Gang Starr - You Know My Steez
Jurassic 5 - Jayou

金融时间序列分析（下）#金融#
4
时间序列的平稳性

平稳性（stationarity）是时间序列分析的基础。

为了通俗的理解平稳性，来看下面这个类比（这是我能想到的最好的例子）。假如某股票的日收益率由转轮盘赌决定：转到不同数字就对应不同的收益率。在每个时刻 t，我们都转同一个轮盘赌并确定收益率 r_t。只要这个轮盘不变，那么对于所有的 t，r_t 的概率分布都是一样的、不随时间变化。这样的时间序列 {r_t} 就是（严格）平稳的。如果从某个时刻 t’ 开始，轮盘发生了变化（比如轮盘上面的数字变多了），那么显然从 t ≥ t’ 开始，r_t 的分布就便随之发生变化，因此时间序列 {r_t} 就不是平稳的。

在数学上，时间序列的严平稳（strictly stationary）有着更精确的定义：它要求时间序列中任意给定长度的两段子序列都满足相同的联合分布。这是一个很强的条件，在实际中几乎不可能被满足。因此我们还有弱平稳（weakly stationary）的定义，它要求时间序列满足均值平稳性（stationary in mean）和二阶平稳性（secondary order stationary）。

如果一个时间序列 {r_t} 满足以下两个条件，则它是弱平稳的：

1. 对于所有的时刻 t，有 E[r_t] = μ，其中 μ 是一个常数。

2. 对于所有的时刻 t 和任意的间隔 k，r_t 和 r_(t-k) 的协方差 σ(r_t, r_(t-k)) = γ_k，其中 γ_k 与时间 t 无关，它仅仅依赖于间隔 k。特别的，当 k = 0 时，这个特性意味着 σ(r_t, r_t) —— r_t 的方差——不随时间变化，等于一个与时间 t 无关的常数 γ_0，这称为方差平稳性（stationary in variance）。

弱平稳假设对于分析投资品收益率至关重要。

为了解释这一点，来看一个例子。假设我们想知道 2017 年 5 月 16 日这天上证指数收益率的均值是多少，而我们的猜想是它来自一个未知的分布。也许你会马上说“查一下Wind不就知道了？上证指数那天的收益率是 0.74%”。注意，0.74% 这个数值仅仅是那天上证指数未知收益率分布的一个实现（realization）！它不是均值，因此从时间序列分析的角度来说仅仅知道 0.74% 远远不够。

对于一般的未知概率分布，只要通过进行大量重复性实验，就可以有足够多的独立观测点来进行统计推断（计算均值和方差这些统计量）。按照这个思路，我们必须把 2017 年 5 月 16 日这一天经历许多遍，得到许多个那天的收益率观测值，然后用这些观测值计算出收益率的均值。不幸的是，历史只发生一次，时间也一去不复返，我们只能实实在在的经历一遍 2017 年 5 月 16 日，只能得到一个收益率的观测点，即 0.74%。因此这个方法对于金融数据是行不通的。

然而，如果我们假设上证指数的收益率序列满足弱平稳，就柳暗花明了。根据弱平稳假设，上证指数的日收益率序列 {r_t} 的均值是一个与时间无关的常数，即 E[r_t] = μ。这样便可以利用一段时间的历史数据来计算出日收益率的均值。比如我们可以对上证指数在 2017 年交易日的日收益率序列取平均，把它作为对总体均值 μ 的一个估计。根据弱平稳性，该平均值也正是 2017 年 5 月 16 日的收益率均值。

同样的道理，在弱平稳的假设下，可以根据历史数据方便的对时间序列的诸多统计量进行推断。在金融文献中，也通常假定投资品收益率序列是弱平稳的。只要有足够多的历史数据，这个假定可以用实证方法验证。比如，我们可以把数据分成若干个子集，并分别计算每个子集的统计量，然后通过统计的手段检验这些来自不同子集的统计量的一致性。

需要说明的是，即便是弱平稳性，有时金融数据也无法满足。回想第二节中那个上证指数日收益率标准差的图，它清晰的说明，在 2001 到 2017 年之间，标准差是随时间变化的。这意味着在这段时间内，收益率序列不满足二阶平稳性。对于此，我们可以通过更复杂的非线性模型对波动率建模（比如 GARCH），又或者可以把时间段细分为更短的区间，使得在每个小区间内的收益率序列尽量满足弱平稳性。

有了上一节和本节的内容做铺垫，下面我们就可以聊聊时间序列的自相关性了。

5
自相关性和自相关函数

假设我们有弱平稳的投资品收益率序列 {r_t}。自相关性考察的是 t 时刻的收益率 r_t 和距当前任意间隔 k 时刻的收益率 r_(t-k) 之间的线性相依关系（k 的取值是所有 ≥ 0 的整数）。由于 r_t 和 r_(t-k) 来自同一个时间序列，因此我们将第三节中的相关系数的概念应用到 r_t 和 r_(t-k) 上，便推广出自相关系数（autocorrelation）。

定义：r_t 和 r_(t-k) 的相关系数称为 r_t 的间隔为 k 的自相关系数。

在弱平稳假设下，这个间隔为 k 的自相关系数与时间 t 无关，而仅仅与间隔 k 有关，由 ρ_k 表示。由第三节中介绍的相关系数的定义可知：

上面的推导中用到了弱平稳的性质，即协方差和方差平稳性（换句话说，二阶平稳性）。从这个定义不难看出，当 k = 0 时有：

这表示 r_t 的间隔为 0 的自相关系数恒定为 1。此外，ρ_k 还有如下的性质：

和第三节一样，上面定义的 ρ_k 是总体的统计特性。实际中，我们仍然只能通过有限的样本数据来计算样本的统计特性。令 ζ_k 为与 ρ_k 对应的样本统计量，则有：

上式中，c_k 是 r_t 的间隔为 k 的样本自协方差（sample autocovariance of lag k）；ζ_k 为 r_t 的间隔为 k 的样本自相关系数（sample autocorrelation of lag k）。

如果把 ζ_k 看作是 k 的方程，则它通常被称为样本自相关方程（sample autocorrelation function；同样的，ρ_k 为总体自相关方程），它刻画了时间序列的重要特性。利用相关图（correlogram）可以清晰地看到 ζ_k 是如何随间隔 k 变化的。

下图为两个假想时间序列的相关图。它们呈现出完全不同结构的自相关性。事实上，第一个相关图的时间序列存在明显的趋势；而第二个相关图的时间序列存在明显的周期性。这两个例子说明相关图可以告诉我们很多时间序列的内在特性。

金融时间序列的相关图虽然远没有这两个假象序列的相关图这么有结构，但相关图在我们对时间序列建模时至关重要。之前已经说过，金融时间序列，特别是收益率序列，最重要的特性是一些不容易被发现的自相关性。（通常股票的收益率序列没有季节性或者明显的趋势性；即便是弱趋势也可以由自相关性反应。）因此，拿来一个收益率序列，只要画出相关图，就可以检测该序列在任何间隔 k 有无统计上显著的自相关性。

对金融时间序列建模，最重要的就是挖掘出该序列中的不同间隔 k 的自相关性。相关图可以帮助我们判断模型是否合适。这是因为金融时间序列的特征中往往包括相关性和随机噪声。如果模型很好的捕捉了自相关性，那么原始时间序列与模型拟合的时间序列之间的残差应该近似的等于随机噪声。残差序列自然也是一个时间序列，因此可以对它画出相关图。一个标准随机噪声的自相关满足 ρ_0 = 1 以及 ρ_k = 0, k = 1, 2, 3, …，即对于任意不为 0 的间隔，随机噪声的自相关均为 0。下图为一个随机噪声的相关图（我们是用标准正态分布构造了有 500 个点的随机噪声序列）：

关于这个图：

1. 显然，间隔为 0 的自相关系数为 1；

2. 对于任意的 k ≥ 1，蓝色的阴影区域为 95% 的置信区间。因此，自相关系数只要没有超过蓝色阴影区域，我们就无法在 5% 的显著性水平下拒绝原假设（原假设为间隔为 k 的自相关系数为 0）。上图的结果说明当 k 不为 0 时，随机噪声的自相关系数为 0。

因此，在评价对金融时间序列的建模是否合适时，我们首先找到原始时间序列和它的拟合序列之间的残差序列；然后只要画出这个残差序列的相关图就可以看到它是否含有任何模型未考虑的额外自相关性：

如果残差的相关图和上面这个图相似，则可以认为残差是一个随机噪声，而模型已经很好的捕捉了原始时间序列中的自相关性；

如果残差的相关图体现了额外的自相关性，它们将为我们改进已有的模型提供依据，因为这些额外的自相关说明已有模型没有考虑原始时间序列在某些特定间隔上的自相关。