1. 引言
随着经济社会的发展,流行时尚深入现代人生活的方方面面。流行趋势既表现出人类对时尚的追求,也体现了它对人们生活的影响。流行时尚作为一种社会心理现象,能够创造出巨大的商机,人们对于时尚的追求在服装方面体现得非常明显,因此现在服装行业发展较为迅速。20世纪之后,消费者逐渐对设计元素有自己的想法,对服装产品的流行趋势起着不可忽略的作用。
服装行业面对日益激烈的竞争形势,为了在市场中取得胜利,必须分析获取下一阶段的流行趋势,使设计出的服装在满足消费者需求的同时,为企业创造更多的价值,这意味着预测流行趋势成为了一项重要的任务。
与一般的产品不同,服装产品具有生命周期短、更新换代快、需求不固定等特征,这些特征都给服装流行趋势的预测带来了很大困难。传统预测方式的数据来源一般是政府或者权威机构发布的统计报告,这些报告中数据的收集与统计往往存在着一定的滞后性,而且数据量也有限 [1]。如今在大数据时代的背景下,搜索引擎为用户提供了大量且全面的数据,用户对网络搜索产生了强烈的需求。网络搜索引擎的数据库会将这些搜索记录和行为存储下来,这些数据为社会经济等领域的预测开辟了新的途径,互联网数据的即时性可以较好地弥补传统预测方法的滞后性。且调查结果显示,77%消费者在购买商品之前会通过互联网使用搜索引擎对所购买的商品进行相关信息调研,可见利用好搜索信息可以提前预知消费者的需求。而服装产品每年都会更新换代,在风格层面上看起来会有较大的差异,流行的服装风格能为服装产品的畅销奠定基础。
由于一件服装产品是由不同的设计元素组合而成的,服装风格的变换是通过设计元素的组合来实现的,单个设计元素的变化并不大,变的是设计元素的组合。并且通过研究设计元素组合来预测风格具有复杂性,且每一步的处理都不是相同的,无法通过单一方法来进行预测。因此本文将服装产品转化为设计元素的组合,通过混合算法首先挖掘出畅销产品中频繁出现的设计元素组合,再与网络搜索数据结合从而扩充该组合,最后通过过滤得到流行的服装风格,并对该方法的预测性能进行评估与分析。
2. 相关研究
目前学者们对于服装流行趋势预测的相关研究主要包括定性分析和定量分析两种。最原始的服装流行趋势预测通常是通过定性分析来完成的,包括直观预测法、专家会议预测法和特尔斐预测法等。之后预测开始渐渐关注市场的反映,通过统计、分析把握未来的规律。主要代表有日本市场统计预测法和美国情报预测法。随着时代的发展变迁,学者们的研究更多的是在定性分析的基础上引入定量分析来解决预测问题。
如陈林龙 [2] 于1991年提出FPV (Fashion Preference Value)法,FPV由人们的文化修养、经济状况、生活方式等决定,规定在0~1之间取值,当多数预测者对于某种色彩的FPV在“1”附近,可认为该种色彩成为下一阶段的流行色。周琴等 [3] 2005年提出了回归分析方法,收集已经公开的10年流行色的原始数据,通过赋权重来表达流行程度,根据流行色发展趋势建立具体的函数关系来预测流行色。吴微微等 [4] 收集了1995~2000年精纺男西装面料45个样本,并对这些样本的规格参数(如经纬纱支、经纬密度、紧度等)和有关男西装造型风格性能指标(如厚度、重量、悬垂系数、抗弯刚度等)进行测试,运用灰色系统理论对精纺男西装面料风格进行预测,得出的结论与专业机构及市场流行基本吻合,说明灰色系统理论数学分析在面料风格流行预测研究中具有一定的可行性。国际流行色协会发布的春夏流行色信息由多种不同的色卡组成,李熠等 [5] 利用色度学相关知识和物理测试手段,将色卡上的某种颜色的含量定义为色量,以此来量化色彩,将灰色数列预测引入流行色预测中进行定量分析,对定量分析做出新的探索。Lin等 [6] 用灰色方法研究了时尚色彩趋势的预测,并对各种模型进行了比较。唐虹等 [7] 以半紧身裙为研究对象,设定裙宽、裙厚、裙摆波褶数、裙摆平均半径、裙摆平均半径标准差和裙摆面积等造型特征参数。在分析面料性能的基础上分别建立半紧身裙造型特征参数预测的线性回归预测模型和BP神经网络模型。通过比较实测值与预测值的相关系数,发现BP神经网络预测模型的预测精度要优于线性回归预测模型。狄宏静等 [8] 在2011年上使用BP神经网络预测流行色,结果表明2011年各项预测结果与实际流行趋势发布基本吻合。
另有一些组合方法,如Ni等 [9] 研究了时尚产品零售领域的销售预测问题,提出了一个两阶段模型:回归模型和ANN模型,用以进行长期和短期的预测。Xia等 [10] 提出基于ELM模型和输入适应性指标的混合模型来提高时尚零售产品销量的预测精度。Yu等 [11] 在2012年针对时尚产品流行色,比较了人工神经网络(ANN)模型、灰色预测(GM)模型、组合的GM + ANN模型在少量历史数据情况下对时尚产品流行色的预测性能。金超等 [12] 针对流行色的时变性,提出了灰色模型和SVM结合的模型,收集2000~2011年的女装流行色历史数据,分别采用灰色模型和支持向量机对女装流行色进行预测,再确定这两种方法的权重,根据权重对灰色模型和支持向量机的预测结果进行组合,得到了女装流行色的最终预测结果,验证了该模型更能反映女装流行色动态变化规律。黄俊敏等 [13] 提取服装造型风格影响要素,用语意差异法对所选服装风格形容词进行因子分析,以数量化理论和问卷调查进行综合分析,得出风格量化与意象语意间的关系,建立数学关系来预测男士衬衫风格。赵黎等 [14] 提出了基于层次协同演化机制的多蜂群协同优化算法,对2017年女装流行色的色相进行预测,提升流行色定量预测的精度。
可见,目前学者们对于服装产品流行趋势的研究通常局限于某件服装产品的流行趋势预测,粒度不够细,无法给设计师等人员提供有价值的参考信息。而以细粒度为着眼点,对服装设计元素的研究从本质上来说大多还是源于专家经验,且研究仅限于某一类的设计元素,对于设计元素构成的风格研究甚少。
所以为了弥补上述不足,本文以服装设计元素为粒度,研究服装设计元素的组合。另外,用户搜索信息是为了满足一定的目标需求 [15],而用户的需求会受到外界环境的影响 [16]。据此,用户搜索行为和外界环境必然存在一定的关系 [1]。而公司销售数据可以反映某销售时期用户的偏好,结合搜索记录和公司销售数据是可靠的。因此,本文将网络搜索数据和公司销售数据相结合,在前人研究的基础上,引入混合算法,通过逐步扩充并优化服装设计元素组合来呈现流行的服装风格,将用户需求中出现而在售产品中未出现的元素加入服装风格中,可以更好地预测服装风格的流行趋势,为服装设计提供参考。
3. 方法提出
本文提出了一种结合网络搜索数据和公司销售数据识别并扩充流行的设计元素组合的方法,能够有效地识别出流行的设计元素组合,并对组合进行扩充,得到流行的服装风格。本文以礼服为例,首先将服装产品转化为设计元素的组合,即各个服装产品都包含了哪些设计元素。由于通过研究设计元素组合来预测服装风格需要考虑设计元素本身以及它们组合在一起的流行情况,情况比较复杂,无法通过单一的方法来进行每一步的处理从而完成预测过程,因此先利用Apriori算法对公司往年的销售数据进行挖掘,找出畅销产品中频繁出现的设计元素组合,为找到流行的设计元素组合奠定基础,然后结合灰色模型预测出的新一年流行的单一设计元素,得到可能会流行的设计元素组合,在百度搜索引擎中搜索,利用PMI算法得出PMI指数较高的组合,即为在关联规则基础上扩充得到的流行的服装风格。最后用序列比对算法将得到的服装风格与新一年的销售记录进行比对,验证得到的服装风格在新一年的销售中有良好的表现。
3.1. 建立服装产品向设计元素组合的转化规则
通过对服装设计元素知识的学习和研究,本文总结出多个礼服常用的设计元素,并将这些设计元素归为十一个不同的类别,每个设计元素仅属于一种类别,且每个类别包含至少三个设计元素,表达式如下:
(1)
其中,
表示设计元素所属的类别,
表示第i类下的第n个设计元素。例如Type1表示面料,value11表示氨纶,value12表示薄纱,Type2表示领型,value21表示V领,value22表示大圆领等等。
服装产品转化为设计元素组合所遵守的规则如下:
(2)
即服装产品包含的元素不大于十一个,且包含的所有元素不能有存在于同一个类别下的情况。例如,某服装产品不能同时有小圆领和方领,但可同时有小圆领和无袖。
3.2. 基于Apriori算法挖掘频繁项和关联规则
服装公司售出的服装产品本身可以看做是设计元素的组合,服装产品的销售记录本身会蕴含一些潜在的规律,比如顾客通常会喜欢购买同时包括哪几种设计元素的服装产品。其实这可以看做是一个购物篮问题,一件售出的服装产品可以看成是一组售出的设计元素。而Apriori算法是解决购物篮问题的经典算法,可挖掘出高频同时售出的组合,即频繁项集,还可挖掘出潜在的顾客购买倾向规律,即关联规则。因此本文首先利用Apriori算法对公司往年的销售数据进行挖掘,找出畅销产品中频繁出现的设计元素组合,作为服装风格的基础。同时找出其中的关联规则,根据关联规则得出下一阶段用户购买服装产品的风格倾向,为后面的验证对比做准备。
3.3. 利用灰色模型预测新一年流行的设计元素
本文收集了2014~2016年单一设计元素在百度搜索引擎上的搜索量,根据这三个时间序列的历史数据来预测2017年的数据,以获取新一年流行的设计元素,由于这种预测问题属于小数据量的预测问题,因此采用灰色模型来进行预测。
本文采用GM (1,1)模型作为灰色预测模型,具体描述如下:
设有原始数据列
,n为数据个数,在本文的预测中n即为3。规定数据处理的方式为累加方式,通过累加来弱化随机序列的波动性和随机性,得到新的数据序列:
其中
中各数据表示对应前几项数据的累加。
然后对
建立
的一阶线性微分方程:
其中
为待定系数,a称为发展系数u称为灰色作用量。只要求出参数
就能求出
,进而求出
的未来预测值。
然后对累加生成数据做均值生成B与常数项向量
,即
接下来用最小二乘法求解灰参数
,则
将求出的灰参数
代入
,并对
进行求解,得
由于
是通过最小二乘法求出的近似值,所以
是一个近似表达式,为了与原序列
区分开来,在此处记为
。
接下来对函数表达式
及
进行离散,并将二者做差以便还原
原序列,得到近似数据序列
如下:
以上就是整个灰色模型的建立过程,通过建立灰色模型,每次计算时将相应的历史数据作为输入参数,即可对模型进行求解,求解之后可以得到下一阶段会流行的设计元素。
3.4. 利用灰色模型预测新一年流行的设计元素
某些设计元素组合在一起形成的服装风格会流行,但另一些可能是不会流行的,原因是某些设计元素之间的适配性可能较低。因此本文将3.2中得到的频繁项集与3.3中得到的单一的流行元素进行组合,扩充设计元素组合,然后通过搜素引擎进行搜索,根据返回的页面数来进一步计算,过滤掉因适配性不高而不会流行的风格。通常来说,共现的次数越多的两个词之间的关联度越高,在这里可理解为被同时搜索次数越多的两个设计元素,人们对它们组合在一起的接受度越高,即它们之间的适配性越高。因此我们可以在本文中引入点互信息PMI方法,基于网络搜索引擎来过滤流行的设计元素组合。PMI值这个指标用来衡量两个事件之间的相关性,计算公式如下:
(3)
其中,
是以x为关键词查询时搜索引擎中所返回的页面数,
是同时以x和y作为关键词所返回的页面数。衡量多个事件之间的相关性的计算公式可以此类推,如下所示。
(4)
将得到的初始服装风格集合利用此方法进行计算,得到PMI值,并且按照PMI值得大小进行排序,设定相应的阀值,来过滤初始服装风格集合,得到最终的服装风格集合。
4. 实验分析
4.1. 数据集
本文获得了某服装公司2014~2017年的销售数据185,898条,并且从百度搜索引擎上获取了2014~2016年年度不同服装设计元素的搜索量。
首先根据销售数据及产品属性图片将不同的服装产品分解至设计元素的粒度,将服装产品转化为{Type1, Type2, …, Type11}的集合,服装产品的元素构成表如表1所示:

Table 1. Element composition of clothing products
表1. 服装产品的元素构成表
然后通过Apriori算法挖掘出顾客频繁购买的组合,挖掘结果如表2所示:

Table 2. Apriori algorithm mining result
表2. Apriori算法挖掘结果表
并结合通过灰色模型预测出的下一阶段会流行的设计元素,包括氨纶、薄纱、雪纺、蕾丝、贴身裙等,得到初始的服装风格集合。再通过PMI算法得出PMI指数较高的组合,即过滤初始的服装风格集合,得到最终的流行的服装风格包含的设计元素集合,如表3所示。

Table 3. Ultimate popular clothing style
表3. 最终流行的服装风格表
4.2. 性能评估
本文的目标是得到下一阶段较为准确的会流行的服装风格,以便给设计师和服装公司进行参考,所以本文所选取的性能评估指标为准确率。由于本文预测的是以某服装公司为基础的17年流行的服装风格,并且17年的销售数据是已经得到的,因此通过17年的销售数据来验证预测的准确性最为直接。本文通过将预测出的服装风格与17年销售数据显示出的流行的服装风格进行序列比对,以序列的相似度来体现准确率。对于两段长度不同的序列,通过对序列中的字符进行匹配、替换或者插入间隔和删除字符操作,使得不同长度的序列在长度上达到对齐一致的效果,再进行序列的后续匹配比对。准确率(相似度)的计算如下:
(5)
其中,A是预测出的服装风格包含的设计元素集合,B是销售数据显示出的流行的服装风格包含的设计元素集合。
4.3. 实验结果
以4.1的数据为研究对象,由于之前很少有学者研究服装风格的流行趋势,没有一个标准的预测方法,因此采用根据关联规则得出的下一阶段用户购买服装产品的风格倾向以及灰色预测结合Apriori算法得到的结果为对比对象,比较本文所提出来的方法、根据关联规则得出的下一阶段用户购买服装产品的风格倾向和灰色预测结合Apriori算法得到的结果的准确率的差异。根据3.2性能评估的指标,计算得到三种方法性能指标如表4所示。
从表中可以看出,本文所提出的方法在准确率指标上有了提高。
5. 结论与展望
服装领域的流行趋势预测问题一直是研究的热点,本文以服装的设计元素为粒度,提出了一种结合搜索引擎搜索数据和服装公司历史销售数据的服装风格流行趋势预测方法,基于真实的搜索数据和销售数据证明了该方法的有效性,能够在一定程度上提高预测的准确性,为新产品设计提供参考。本文下一步的工作的重点是对获取搜索引擎上搜索数据的过程和结果进行优化,使得最后预测出的服装风格能够更加准确。