1. 引言
ETF (Exchange-Traded Fund,交易型开放式指数基金,以下简称ETF)产生于上世纪八十年代后期,同普通基金产品一样,由基金管理公司开发和管理,是一种跟踪“标的指数”变化、且在证券交易所上市交易的基金。ETF产品按照标的指数所包含的成分股种类与数量比例配置资产,目的是追踪特定指数并获取与该指数相同的收益率,属于被动管理型基金。它综合了可自由交易的封闭式基金和可自由申赎的开放式基金的特点,不仅能在一级市场进行实物申购和赎回,还能在二级市场进行基金份额交易。ETF的这些特征决定了它具有投资风险分散化、管理费率较低、追求长期收益以及投资组合透明度高等优势,ETF的交易机制决定了投资者可以通过二级市场交易价格与基金的单位资产净值(NAV)之间的价差进行实时套利,增强了ETF的流动性且能够避免封闭式基金常见的折价现象。2004年12月30日,华夏基金发布上证50 ETF成立公告,我国首只ETF产品正式推出,募集资金54.35亿元,远远超过同期一般开放式基金大约10亿元左右的募集水平。截至2018年一季度末,中国内地上市的各类ETF产品已有171只,资产规模大约在4300.2878亿元。
传统的基金绩效评价指标有衡量相对市场的超额收益的詹森指数、衡量风险调整后收益率的特雷纳指数和夏普指数、评价基金经理选股能力以及择时能力的Treynor-Mazuy (T-M)模型和Henriksson-Merton (H-M)模型等。对于ETF而言,当选定所跟踪的标的指数后,基金经理的目标就是精确复制所跟踪的指数,投资者的目标就是能够随时买卖ETF产品并获得与相应指数相同的收益率,在这种情况下,用ETF的收益率与风险进行绩效评价显然是不合适的,又由于ETF基金的复制性,因此也无需对基金管理者的择股与择时能力进行评价。购买ETF产品的投资者大致有两种,第一种是中长期投资者,投资ETF是为了获取指数收益,该类投资者关心ETF的跟踪效果,第二种是短期投资者,投资ETF是为了进行ETF套利,该类投资者关心ETF的二级市场表现。因此,对ETF的绩效评价应该从这两个角度入手。目前对ETF绩效评价的大多数研究都是比较ETF与同类指数型基金或其他金融产品的绩效,Gerasimos Georgiou Rompotis (2005)将2001~2002年ETF的数据和相对应的指数基金的数据分别对标的指数进行回归分析,发现ETF的绩效与跟踪同一指数的指数型基金的绩效十分接近 [1]。单纯对ETF绩效度量体系的研究文献极少,Ben Johnson、Hortense Bioy、Alastair Kellett、Lee Davidson (2013)分析了追踪8种股指的65只ETF的跟踪误差后,为晨星公司设计了一个包含所有交易成本、红利等因素在内的估计持有成本(EHC)指标,以评价ETF绩效,并发现综合复制型ETF产生的跟踪误差低于完全复制型ETF [2]。
本文拟运用概率论与数理统计的思想,基于风险度量模型构造一个包含多个变量的一维绩效指标来度量完全复制型ETF的绩效,并利用该体系以沪深300 ETF为例对中国市场的ETF绩效进行实证分析。实证分析结果表明新指标能够很好地度量ETF的绩效,因此本文的研究具有一定的理论意义和较好的实践价值。
2. ETF绩效评价体系
本部分首先介绍绩效指标涵盖的三个评价标准——跟踪偏离度、跟踪误差和流动性,并定义它们的量化表达式,再利用风险度量模型的思想构造绩效指标,同时对该绩效指标进行经济含义解释。
2.1. 评价指标的度量
令x为以指数b为标的指数的ETF,b (或x)为指数(或追踪组合)的资产权重向量,记标的指数共包含n项资产,Ri为资产i的收益率。我们定义跟踪偏离度e为ETF单位净值的收益率R(x)与指数收益率R(b)之差:
(1)
跟踪偏离度的期望值为:
(2)
跟踪偏离度的波动性衡量了ETF与标的指数之间的相对风险,我们定义该相对风险为跟踪误差,通常用跟踪偏离度的标准差来表示:
(3)
ETF的流动性与标的指数的流动性密切相关,例如以S & P 500为标的指数的ETF的流动性必然比以摩根斯坦利国际资本公司(MSCI)编制的某一风格指数为标的指数的ETF好。ETF的流动性主要体现在申购或赎回时,在单位时间内,同样的买卖额度对市场的冲击力越小,则说明ETF流动性越好。由于在申购或赎回时,买卖价差会作为一项成本影响申赎效率,且交易越活跃的品种其买卖价差越小,因此我们将买卖价差作为流动性的度量指标。
2.2. 建立综合绩效指标
现在我们假设一个具有两个阶段的模型,投资者在t = 0时刻申购ETF x,并在t = 1时刻赎回,该段时间内相应的跟踪偏离度为e,则投资者相对于指数b的盈亏为:
(4)
其中
为ETF的买卖价差。我们定义投资者的损失
为:
(5)
基金的绩效评价指标可以看作是投资者的损失函数
的风险测度,因此我们可以利用VaR (Value-at-Risk)风险度量思想,通过损失函数的概率密度分布函数推算出该风险测度。在这个基础上,我们将绩效指标
定义为:
(6)
VaR是指给定概率下,在给定的时间范围内,使所受损失不超过一定数值的阈值。因此(6)式的经济含义为投资者有
的可能性会蒙受大于
的损失(为了使绩效指标与基金表现呈正相关,我们将绩效指标取了潜在损失的相反数)。令F为投资者损失函数
的概率密度分布函数,我们可以得到:
(7)
为了推导出绩效指标
的解析式,现假设基础资产的收益率服从正态分布,则跟踪偏离度也服从正态分布,并且有:
当我们有下式成立时:
(8)
联立(4)、(8)式,有:
(9)
将(9)式两端同时取标准正态分布函数的反函数,可整理得到:
此时我们已经求出在
的概率下投资者的损失的临界值,按照(6)式的定义,我们可以直接得出绩效指标
的解析式:
(10)
下面通过图1来举例说明(10)式的经济含义。假定跟踪偏离度
(1 bps = 0.01%),跟踪误差
,买卖价差
,图1中的曲线描述了投资者相对于指数收益的盈亏密度方程,由于买卖价差的存在,该曲线并不是以
为中心轴。从图1可以看出,投资者的平均盈亏为30 bps,根据正态分布的特征,投资者的收益率大于30 bps的可能性为50%,同时也有50%的概率使投资者的收益率小于30 bps。投资者蒙受损失的概率为22.66%,也就是纵轴左侧部分的面积。当置信水平
设定在95%时,将上述变量带入(10)式,可得绩效指标
,即在这个例子中,投资者有95%的可能性损失不超过35.79 bps,或投资者损失超过35.79的可能性为5%。
为了说明不同因素对绩效指标的影响,我们用图2中的三个小图来分别刻画跟踪偏离度、买卖价差和跟踪误差对绩效指标的影响,其中实线为初始形态,虚线为变量改变后的形态。
在图2(1)中,当跟踪偏离度由50 bps增加到70 bps时,意味着ETF在跟踪误差和买卖价差不变的条件下相对于标的指数有着更高的超额收益表现,投资者的盈亏密度函数图像右移,由图2中可以看出,在相同的概率下,变动后的ETF潜在损失更小,即绩效表现更好。图2(2)为扩大买卖价差的情况,其绩效度量结果会恶化。图2(3)提高了跟踪偏离度的波动性,投资者的盈亏密度函数图变得更分散并且产生

Figure 1. Profit and loss density function diagram
图1. 投资者相对于指数的盈亏密度函数图

Figure 2. The influence of variable on performance index
图2. 不同变量对绩效指标的影响
厚尾,因此跟踪误差越大,ETF绩效更差。
根据上述讨论,可以得出以下推论:令x与y均为追踪同一指数b的ETF,当且仅当x的绩效指标大于y的绩效指标时

x的表现比y更好。
3. ETF绩效度量的实证研究
这部分我们将利用前面给出的度量体系对我国ETF绩效进行实证研究,首先对数据样本进行说明,并对数据进行适当处理,然后利用统计方法对绩效指标中的变量进行点估计,最后计算ETF绩效指标并评价ETF表现。
3.1. 数据样本
自2004年12月30日我国第一只ETF推出以来,截止到2018年3月末,中国内地市场上市的各类ETF产品已有171只,资产规模大约在4300.2878亿人民币左右,其中被动指数型基金125只,资产净值占比49.18%,货币市场型基金28只,资产净值占比43.67%,此外,被动指数型债券基金7只,国际QDII股票型基金7只,商品型基金数量为4只,其资产净值占比分别为0.90%,3.96%和2.28%。在被动型指数基金ETF中,以上证50、上证180、中证500以及沪深300为标的指数基金居多。现以国内上市的沪深300 ETF为研究对象,在不考虑加强型ETF和分级ETF等特殊品种的基础上,选取了嘉实沪深300 ETF、南方开元沪深300 ETF、华泰柏瑞沪深300 ETF、易方达沪深300 ETF和华夏沪深300 ETF五只基金,样本区间为2017年4月1日至2018年3月31日总计243个交易日的日度数据,数据的基本货币单位为人民币元,本部分所有数据均来自Wind资讯金融终端。
3.2. 数据处理
本部分所有数据均以交易日当天收市后的数据为准,即指数价格以交易日当天的收盘价为准,ETF价格以收市后的单位资产净值为准。根据Wind资讯金融终端给出的定义,ETF的申购价为申购者接受的最高价格,赎回价为赎回者接受的最低价格,买卖价差为最高申购价减去最低赎回价,由于本文中的买卖价差以bps为单位,因此我们将买卖差价化为(最高价 − 最低价)/前一交易日收盘价的比率形式。
在样本期内,沪深300指数于2017年的6月9日、6月12日、12月08日、12月11日进行了成分股调整,由于成分股调整引起的指数变动不应计入指数损益,因此本文将剔除调整日的收益率数据。又由于当沪深300成分股发生分红派息时,指数不予修正,因此本文也不做修正。2018年1月23日为华泰柏瑞沪深300 ETF每10份派0.46元的除息日,其他四只ETF均无分红派息。由于扣除红利而引起基金资产净值的减少不属于基金本身配置问题导致的跟踪效率低下,为了得到一致且可比的结果,本文把红利加回除息日的基金资产净值。另外,ETF交易量极小或者为零的日度买卖价差数据也被剔除。
3.3. 统计方法
令研究区间为
,研究区间内交易日天数为n,当置信水平
设定为95%时,标准正态分布函数的反函数值
。此时,绩效指标的表达式为如下形式:
(11)
其中
、
和
分别为观测日内跟踪偏离度、买卖价差以及跟踪误差的估计值。
由年化平均收益率之差计算(一年按252个交易日计),
为观测日内所有日度买卖价差的算术平均值,
为调整了统计偏误的年化跟踪偏离度标准差,具体表达式如下:
(12)
(13)
(14)
上述式子中的
和
分别为t时刻ETF的资产净值和指数价格,
与
为对应的日度收益率,
为t时刻的当日买卖差价,
为观测区间内每日跟踪偏离度的算术平均值,表达式分别为:
(15)
(16)
(17)
3.4. 实证分析
表1为样本各变量的描述性统计结果以及绩效指标的最终结果,第一列数据描述了跟踪偏离度的情况,从表1中可以看出,五只ETF的跟踪偏离度除华泰柏瑞沪深300 ETF小幅偏负外,其余四只ETF均为正值。也就是说除华泰柏瑞沪深300 ETF收益率表现略微落后于指数外,其余四只ETF的收益率表现均超过了指数,五只ETF的平均跟踪偏离度为162.2891 bps。从成交额上来看,华泰柏瑞沪深300 ETF的平均成交额是成交额排名第二的嘉实沪深300 ETF的五倍,成交额过大可能是其跟踪偏离度为负的主要原因。从最后一列的数据我们可以看出,虽然华泰柏瑞沪深300 ETF收益率表现较差,但是由于其规模较大,因此跟踪误差较小,其投资者有95%的可能性蒙受相对于直接投资于指数的损失不超过448.567 bps,而规模较小的南方开元沪深300 ETF的跟踪偏离度虽然最大,但由于跟踪误差较大,导致南方开元沪深300ETF的投资者在观测期内有5%的可能性蒙受相对于直接投资于指数的损失大于674.614 bps。

Table 1. Performance measurement results of Hushen300 ETF (unit: bps)
表1. 沪深300 ETF绩效度量结果(单位:基点)

Figure 3. Line chart of five funds tracking deviation
图3. 六只基金的跟踪偏离度折线图
图3显示了样本区间内五只ETF基金的跟踪偏离度逐日走势情况,由图3可知,沪深300 ETF在大多数时间段内的跟踪偏离度波动区间都能控制在上下500 bps左右。
从图3还可以看出,五只产品的跟踪偏离度和跟踪误差在2018年2月至3月明显增大,这是由于在2018年2月上旬中国A股市场大跌300多点,导致交易者大量的赎回,ETF成交额剧增。以华泰柏瑞沪深300为例,在2018年2月至3月的37个交易日中,超过样本区间交易额平均值5.06亿元的天数为24天,仅13的交易额小于样本区间平均交易额。其中2018年2月1日,2018年2月6日至2018年2月9日,2018年3月12日,2018年3月23日七天的交易额更是超过了10亿元,交易额最大的2018年2月1日其交易额为18.61亿元,为平均值的3.7倍。短期内如此大的交易额较为罕见,资金大手笔申购与赎回沪深300 ETF很大程度上是为了在期现套利机会显著的时刻谋求套利收益,然而,当ETF的申购与赎回额度非常大时,基金的交易成本和市场冲击成本将提高,这将会扩大基金与标的指数间的跟踪误差。
在需求日益增加的ETF市场下,市场对价格变动将更为敏感,华泰柏瑞沪深300 ETF与2018年1月23日进行的分红派现直接影响了ETF的价格发现功能,导致跟踪误差增大。
根据上述计算结果,我们可以发现跟踪偏离度和跟踪误差对ETF绩效度量的影响最大,而买卖价差对ETF绩效度量的影响有限。ETF的申赎量和二级市场交易量对ETF的跟踪误差有着正向的影响,基金经理在管理资产配置时应注意保证ETF有适当的承受市场冲击的能力。ETF成分股的分红派现和ETF分红派现均引起跟踪偏离度的波动,基金经理应及时修正相应偏差。
4. ETF绩效评价体系的改进
本部分基于第二部分的ETF绩效评价体系框架,通过增强数学假设和改进计量方法,提供一系列优化的绩效度量指标。
4.1. 跟踪误差
除了第三部分中(14)式直接利用标准差度量跟踪误差,统计学上还提供了很多其他方法来计量跟踪误差,例如,基于收益率的相关性,我们可以利用指数收益率的方差、ETF收益率的方差以及二者的协方差来计算跟踪误差:
(18)
其中,协方差又可以分解为两个收益率的标准差与两个收益率相关系数的乘积,从而可以表示为:
(19)
这种计算方法的好处是引入了指数收益率与ETF收益率之间的相关系数,相关系数趋近于1,则说明ETF与标的指数的线性关系越明显,跟踪效果越好。
从相关性和拟合效果的角度出发,若我们将ETF的收益率对标的指数的收益率进行线性回归,得到观测值与估计值之差,则残差的标准差也可以作为ETF的跟踪误差:
(20)
(21)
4.2. 买卖价差
在第四部分给出的统计方法中,我们是利用交易日收盘后的数据而不是盘中价格来计算买卖价差,也没有考虑ETF产品的交易量和申赎量,虽然这样做得到的买卖价差波动性较小,适合交易量较小的散户投资者,但对于大型机构投资者来说,尤其是在ETF流动性较弱的情况下,大单交易会引起买卖价差的巨大波动。另一方面,买卖价差是作为衡量ETF的流动性而引入绩效评价指标的,当相同的交易量引起的价格变动越小时,意味着ETF的流动性越好。因此收盘后的第一档买卖价差并不能真实地反映当日交易情况。
针对这种缺陷,可以假定一个名义的交易量N,计算出盘中每个ETF价格的最小变动单位上完成这个交易量所需的时间,将每个买卖差价对在这个差价上执行给定交易量所需的时间进行加权:
(22)
其中,
是完成名义交易量N所需时间
上的买卖差价,
为两个连贯的最小变动单位上所流逝的时间,令调整后的买卖价差的分布函数为
,则调整后的绩效度量指标将变为:
(23)
在这种买卖价差的计量方法下,我们需要使用每个最小变动单位下的高频数据,根据这种计量方法计算出的绩效指标适合于进行大额高频交易的机构投资者,可以预测的是,利用该种绩效指标进行ETF评估时,对于资产规模越大的基金,其抵御流动性风险的能力越强,排名将越靠前。
5. 结论与未来研究方向展望
本文针对ETF的特性和投资者的ETF绩效评价需求设计了一套以VaR风险度量模型为基本思想的ETF绩效度量指标,该指标包括ETF与标的指数之间的收益率之差、收益率之差的波动性和流动性三个变量,分别为跟踪偏离度、跟踪误差和买卖差价度量,该绩效度量指标的优势在于形式简单且综合性强,投资者或评级机构在进行ETF基金选择时可以通过该指标直观评价ETF的历史绩效。
我们对五只中国上市的完全复制型沪深300 ETF基金在2017年4月至2018年3月之间的总体表现进行了实证研究,并且发现指数成分股分红和ETF分红均对ETF的跟踪效果有负面影响,在市场行情上升时,ETF的申购赎回量和二级市场的交易量均会对跟踪效果产生冲击。在基础绩效评价指标中,我们发现跟踪偏离度和跟踪误差在评价结果中最为重要,但由于未考虑交易量和交易频率对流动性的影响,该基础绩效指标只适合执行买入并持有ETF、更加关注ETF的跟踪效果以获取指数收益的散户投资者。为了增加绩效指标的适用性,我们利用ETF在二级市场交易的日内变量来改进衡量流动性的买卖价差指标,基于这种度量方法的绩效评价指标将更适用于进行高频、大单交易的机构投资者。
ETF的多样化不仅体现在基金公司和基准风格指数上,现在ETF结构更是变化多样,诞生了杠杆型、增强型和分级ETF等新品种。随着不断增加的ETF产品复杂性,其绩效度量体系的适用性需要针对不同种类的ETF和标的指数更新调整。因此在后续的研究中,当单纯的跟踪偏离度和跟踪误差指标无法满足绩效评价的需求时,我们可以引入新的风险测度和高级计量方法设计出细致合理的绩效度量体系,提高绩效度量效果。
NOTES
*通讯作者。