时间序列是按时间顺序列出的一系列观测值。它是最常见的数据类型,涉及人类生活的几乎每个方面,例如,气象时间序列,由股票价格观察组成的股票价格时间序列(简称股票时间序列),以及个人健康的时间序列,包括观察血压,体温,白细胞等。

研究表明,时间序列具有两个导入特征。(a)历史信息将影响未来趋势也就是说,观测的历史价值将对时间序列中的未来价值产生影响。影响可以通过时间序列的周期,不稳定,波动性等来描述。(b)历史重演也就是说,某些特殊的时间子序列将在整个时间序列中重复。由于这两个特征,各种时间序列预测已成为当前研究的热点,其中之一就是股票时间序列的预测,简称股票预测。作为典型的时间序列,股票时间序列不仅具有时间序列的特征,而且股价的走势也直接关系到人们的切身利益。因此,股票预测引起了众多研究者的兴趣。

关于库存预测的技术分析方法很多,其中最著名的是烛台技术分析,在亚洲也被称为K线技术分析。在股票市场中,为了以更直观的方式学习和研究股票价格的波动,人们发明了烛台图(也称为K线)以图形方式表示股票时间序列。以一条每日K线为例,一条K线代表一天中的股价波动,它不仅显示当天的收盘价,开盘价,高价和低价,还反映了价格差异和任意两个价格之间的大小(除非另有说明,否则本文中给出的所有K线均指每日K线)。如果股票的K线按时间顺序列出,则可以形成一个用来反映一段时间内股票价格波动的序列,可以称为K线系列。由于每条K线包含四个价格,因此K线系列的实质是具有四个观察值的股票系列。

在K线序列中,如果K线子序列包含一些用于预测库存的知识,则该子序列称为K线模式序列,简称K线模式。例如,当出现一个子系列时,股价通常会上升或下降。然后,此子系列是典型的图案系列。基于K线模式的库存预测是K线技术分析的本质。如何挖掘K线模式以及如何利用这些模式进行预测是K线技术分析的主要研究内容。

通过观察K线股票市场(或日本大米市场)系列的人工方法,人们(主要人物是K线的创始人,18世纪的日本大米交易员本久纯寿)许多K线形态。文献介绍现有模式和它们的详细的功能,如三内部向上(TIU)的三个内侧向下(TID),和十字线。一些文献从实验中得出结论,现有的K线图形有预测股票走势良好的预测能力。其他一些论文基于这些模式研究了库存预测,并取得了一些研究结果。然而,也有一些论文挑战这些图案预测能力。他们认为,K线技术分析违反了有效的市场假设,因此基于K线模式的股票投资是不可行的。他们还进行了一些实验,表明现有的K线形态没有预测能力。

基于以上分析,很明显在学术界对K线模式是否具有预测能力存在争议。但是,很少有论文分析关于模式的预测能力存在两个不同立场的原因。论文也关注辩论,虽然它没有分析K线模式本身,而是试图获得以下问题的答案:趋势反转是否更多地伴随着某些类型的烛台出现?最后,纸发现存在一些类型的烛台,它们往往趋向于靠近趋势反转区域,而其他类型的烛台在这种区域中找不到。尽管该论文的研究表明存在K线模式,但并未给出答案,为什么对K线模式的预测能力存在争议。

通过回顾相关文献,本文认为主要原因是现有的K线模式缺乏严格的数学定义。例如,在K线图形的定义中没有明确定义阴影长度和主体大小,这意味着K线图形具有许多不同的形状。因为对于不同的形状,图案的预测能力可能会发生很大的变化。如果我们忽略形状差异并通过将所有具有各种形状的图案作为一个整体来研究图案的预测能力,而不是根据其形状特征进一步对图案进行分类,那么对K线图案的预测能力的研究结果可能会产生偏差。例如,TIU模式具有三种形状:形状A,形状B和形状C。,其中形状A是TIU模式的一般形式,而形状B和C则很少出现。假设形状A具有预测能力,而形状B和C没有预测能力。在研究TIU模式的预测能力时,如果我们忽略这三种模式之间的形状差异,并将它们作为一个整体进行研究,则会得出错误的结论,即TIU模式没有预测能力。但是,如果根据形状特征对三种模式进行进一步分类并分别研究,则可以得出正确的结论,即TIU模式仅对形状A具有预测能力。

另外,另一个原因是,由于现有的K线图形是通过人工方式开采的,因此它们中可能存在一些虚假图形。

为了解决辩论并验证这两个推论,本文使用数据挖掘相关方法,如模式识别,模式聚类,模式知识挖掘和统计分析,对K线模式的预测能力进行了研究。