摘要:本文對BitMEX交易所的XBTUSD永續(xù)合約的賣4000至買4000的市場深度數(shù)據(jù)進行統(tǒng)計分析,通過核密度估計得出了大額掛單在不同價格位置出現(xiàn)
摘要:本文對BitMEX交易所的XBTUSD永續(xù)合約的賣4000至買4000的市場深度數(shù)據(jù)進行統(tǒng)計分析,通過核密度估計得出了大額掛單在不同價格位置出現(xiàn)的概率密度。
大額掛單分為買單和賣單,前者可視為支撐位,后者可視為阻力位,它們對行情走向具有一定的影響。大額掛單的價格可能在限價指令薄的固定位置,也可能在一定的價格范圍內(nèi)移動,可假設(shè)其在較大概率上會出現(xiàn)在某些特定的價格位置,從而反映出各個掛單者對行情的判斷。
本文對BitMEX交易所的XBTUSD永續(xù)合約的賣4000至買4000的市場深度數(shù)據(jù)進行統(tǒng)計分析,通過核密度估計得出了大額掛單在不同價格位置出現(xiàn)的概率密度。
從獲取市場深度數(shù)據(jù)的時效性來講,由于獲取具有一定的延遲,所有的數(shù)據(jù)其實都是過去的數(shù)據(jù),不一定能代表當(dāng)前的大額掛單的價格位置,但根據(jù)它們在不同價格位置出現(xiàn)的概率密度,我們可以對下一時刻它們可能出現(xiàn)的價格位置做出推斷,從而進行相應(yīng)的策略決策。
不同的編程語言一般都有特定的不同的函數(shù)來專門運行核密度估計的計算,比較方便,但在實際情況中,為了使程序能夠準(zhǔn)確反映我們的意圖,有必要去深入理解核密度估計的概念。
一、核密度估計
(一)概率密度函數(shù)估計的簡要介紹
概率密度函數(shù),常簡稱為密度函數(shù)以至密度,是概率論的最重要概念之一。雖然在統(tǒng)計學(xué)上我們常提“總體分布”這個名詞,但使用密度的概念去規(guī)定或刻畫一個統(tǒng)計模型不僅常見,而且比使用分布概念更合適和方便。在各種實際問題中,變量取值的分布呈現(xiàn)“兩頭小、中間大,左右對稱”這種“正態(tài)類似型”者為數(shù)頗多。這些特點在密度函數(shù)的圖像上一目了然,而在分布函數(shù)的圖像上則有不同。
密度估計問題,就是要通過從總體中抽得的樣本去估計其概率密度函數(shù)f。在實際操作中,總可以把問題說成:固定一已知的x軸,要估計f在x點之值f(x)。
如果概率密度函數(shù)形狀被假定或已知,那么就用參數(shù)估計法。如果概率密度函數(shù)的形狀未知,則用非參數(shù)估計法。實際上一般不要求密度函數(shù)有某種特定的數(shù)學(xué)形式,如密度為正態(tài)分布之類,也就是說未知密度函數(shù)的所屬類型并不知道。理由很明顯:若密度函數(shù)的數(shù)學(xué)形式已知,而只含少量未知參數(shù),則不如徑直考慮這些參數(shù)的估計問題,而不提密度估計問題。因此,密度估計問題在本質(zhì)上說是非參數(shù)性的。如今最流行的非參數(shù)密度估計法是核密度估計法,也稱為Parzen密度估計法。
核密度估計作為一種非參數(shù)統(tǒng)計方法,在近四十余年吸引了不少學(xué)術(shù)界的注意,通過研究發(fā)現(xiàn)核密度估計的方法并非建立在某種艱深的概念或數(shù)學(xué)工具的基礎(chǔ)上,而不過是古老的直方圖方法的自然發(fā)展,這在統(tǒng)計發(fā)展史上有一定的代表性。應(yīng)當(dāng)指出的是,密度估計的重要性并不在于它的單獨使用,而是作為統(tǒng)計推斷的中間環(huán)節(jié)發(fā)揮作用。著名統(tǒng)計學(xué)專家Silverman曾指出,概率密度函數(shù)估計在數(shù)據(jù)統(tǒng)計處理的所有階段都是有用的。
圖1
在關(guān)于直方圖的理論討論中,我們常假定區(qū)間分隔(即上文a、h的選擇)是在考察樣本之前就定下來的,因此無隨機性,這就使理論簡化了。但在實際操作時不一定能恪守這個規(guī)定。例如,一批樣本可能較集中在O點附近,而在較遠(yuǎn)的地方的個數(shù)較少。
這時,有條件把密度f在O點附近之值估計得細(xì)一些,而在遠(yuǎn)處則只能滿足于較粗的估計。也就是說,我們可能取一些不等長的區(qū)間,區(qū)間長度在O附近很短而在遠(yuǎn)離O點處則較長。然后在每一區(qū)間內(nèi)按(1)式作出f的估計。這時,區(qū)間的位置、長短都是在參考了樣本以后決定的,故有隨機性。這樣的直方圖估計稱為“Data-based”的直方圖估計,其理論較a和h都比通常的直方圖估計復(fù)雜得多,這里就不再討論了。
直方圖估計的優(yōu)點在于簡單易行,且在n較大而容許h較小的情況下,所得圖像尚能顯示密度的基本特征,但也有明顯的缺點——它不是連續(xù)函數(shù)(這可以通過適當(dāng)?shù)匦迍騺斫鉀Q),且從統(tǒng)計角度看效率較低。例如,在這一方法下,每一區(qū)間中心部分密度估計較準(zhǔn),而邊緣部分則較差。綜合種種因素,我們?nèi)钥梢哉f:直方圖估計不失為一個有用而基本的密度估計方法。
3、Parzen的核估計
不難看出:Rosenblatt估計仍為一個階梯函數(shù),只不過與直方圖估計比起來,各階梯之長不一定相同而已,仍非連續(xù)曲線。另外,從Rosenblatt估計的定義中看出,為估計f在x點之值f(x),對與x在一定距離(確切地說,是h/2)內(nèi)的樣本,起的作用一樣,而在此以外則毫不起作用。直觀上可以設(shè)想:為估計f(x),與x靠近的樣本,所起的作用似應(yīng)比遠(yuǎn)離x的樣本要大些。這些在Parzen于1962年提出的核估計方法中都得到了體現(xiàn)。
為介紹Parzen的思想,我們先將(2)式變換一個形式,引進一個函數(shù)
(三)核函數(shù)的舉例
以一維情況為例,常用的核函數(shù)見下表:
表1
根據(jù)上表所示,畫出幾類核函數(shù)的圖像如下:
圖2
二、比特幣期貨合約大額掛單的價格位置
不斷獲取BitMEX交易所的XBTUSD永續(xù)合約的賣4000至買4000的市場深度數(shù)據(jù),將UTC時間2019-08-01 03:49:22時的數(shù)據(jù)繪圖如下所示:
圖3
將數(shù)據(jù)分為賣200至買200、賣800至買800、賣1600至買1600、賣3000至買3000、賣4000至買4000各段,分別求得各段的最大賣價和買價。只不斷地保存最近一段時間(這里取3分鐘)各段的最大賣價和買價,這可能就是潛在的支撐位和阻力位所在的價格位置。
根據(jù)保存的數(shù)據(jù),利用核密度估計(采用高斯核函數(shù))來計算出各段的支撐位和阻力位所在價格位置的概率密度,概率密度最大處附近即為支撐位或阻力位的所在位置。而各支撐位和阻力位所對應(yīng)的限價單數(shù)量則分別來自于所保存的數(shù)據(jù)中對應(yīng)的各限價單數(shù)量的中位數(shù)。
我們可以分別畫出各段的概率密度圖,為了方便觀察,我們將各圖繪制在一起,將阻力位用偏紅色的線條表示,將支撐位用偏綠色的線條表示,可得下圖:
圖4
上圖各峰值附近即為大額掛單所形成的支撐位和阻力位,進一步將相關(guān)數(shù)據(jù)列表如下:
表2
從上表可知,各概率密度的峰值雖然不大,但在其鄰域進行積分所得到的概率的值較大,因此各概率密度的峰值對應(yīng)的價格位置附近就是各支撐位和阻力位的價格位置。
此外,各深度的支撐位和阻力位有部分重合。支撐位有兩個:價格9750附近,數(shù)量(中位數(shù))約為629.8萬張;價格9943附近,數(shù)量(中位數(shù))約為215.4萬張;阻力位有兩個:價格10080附近,數(shù)量(中位數(shù))約為135.6萬張;價格10200附近,數(shù)量(中位數(shù))約為385.5萬張。
我們可根據(jù)策略需求來選用這些支撐位和阻力位,例如,只將數(shù)量600萬張以上的視為有效支撐位和阻力位,那么在這段行情就只在價格9750附近存在一個有效支撐位。又如,只將數(shù)量1000萬張以上的視為有效支撐位和阻力位,那么在這段行情就暫時不存在有效支撐位和阻力位。
三、結(jié)論與討論
本文對BitMEX交易所的XBTUSD永續(xù)合約的賣4000至買4000的市場深度數(shù)據(jù)進行統(tǒng)計分析,通過核密度估計得出了大額掛單在不同價格位置出現(xiàn)的概率密度,從而確定了各支撐位和阻力位的位置。在實際操作中,我們可以根據(jù)具體策略選用它們,只將限價單數(shù)量達到一定量的價格位置視為有效的支撐位和阻力位。
需要注意的是,比特幣期貨的波動性很大,支撐位或者阻力位或許只適用于震蕩行情中的策略判斷,當(dāng)出現(xiàn)瀑布行情時,巨大的交易量使得它們比較容易被突破。因此,我們往往將其與其他指標(biāo)一起使用來降低風(fēng)險。(作者: 金融黑客家)
關(guān)鍵詞: BitMEX XBTUSD 參數(shù)估計法