㈠ 01 隱馬爾可夫模型 - 馬爾可夫鏈、HMM參數和性質
先直白得講性質: 當前的狀態只和上一時刻有關,在上一時刻之前的任何狀態都和我無關。我們稱其 符合 馬爾可夫性質。
下面是理論化的闡述:
設{X(t), t ∈ T}是一個 隨機過程 ,E為其狀態空間,若對於任意的t1<t2< ...<tn<t,任意的x1,x2,...,xn,x∈E,隨機變數X(t)在已知變數X(t1)=x1,...,X(tn)=xn之下的條件分布函數只與X(tn)=xn有關,而與X(t1)=x1,...,X(tn-1)=xn-1無關,即條件分布函數 滿足 下列等式,此性質稱為 馬爾可夫性 ;如果隨機過程 滿足 馬爾可夫性,則該過程稱為馬爾可夫過程。
馬爾可夫鏈 是指具有馬爾可夫性質的隨機過程。在過程中,在給定當前信息的情況下,過去的信息狀態對於預測將來 狀態 是無關的。
例子: 在今天這個時間點而言,過去的股價走勢對我預測未來的股價是毫無幫助的。
PS:上面馬爾可夫鏈中提到的 狀態 ,在本例指的是 股價 。
在馬爾可夫鏈的每一步,系統根據 概率分布 ,可以從一個狀態變成另外一個狀態,也可以保持當前狀態不變。狀態的改變叫做 轉移 ,狀態改變的相關概率叫做 轉移概率 。
例子: 當前時間狀態下的股價,可以轉變成下一時刻的股價,股價的轉變即 狀態的改變 。這個狀態現在可以上升(股價提高),狀態也可以下降。我可以根據當前股票的價格去決定下一刻股價上升、下降、不變的概率。這種股價變動的概率稱為 狀態轉移概率 。
馬爾可夫鏈中的 三元素是 :狀態空間S、轉移概率矩陣P、初始概率分布π。
1、狀態空間S - 例: S是一個集合,包含所有的狀態 S 股價 ={高,中,低} ;
2、初始概率分布π - 例:
股價剛發行的時候有一個初始價格,我們認為初始價格為高的概率為50%,初始價格為中的概率是30%,初始價格為低的概率是20%。我們記股票價格的初始概率分布為:π=(0.5,0.3,0.2);對應狀態:(高、中、低); 初始概率分布是一個向量 ,如果有n個狀態,π是n維向量。
3、轉移概率矩陣P - 例:
現在有個股價為中,下一個時刻狀態轉變的可能性有三種,中→高、中→低、中→中;將三種轉變的概率。此外當前時刻也有股票的價格屬於低,對應的轉變可能包括低→高、低→低、低→中;即每種狀態都有可能轉變成其他的狀態,若一共有n個狀態,形成的 轉移概率矩陣 應該是n×n階矩陣。這里需要注意的是,股價從高→低,和低→高的概率是不同的。
設將天氣狀態分為晴、陰、雨三種狀態,假定某天的天氣狀態只和上一天的天氣狀態有關,狀態使用1(晴)、2(陰)、3(雨)表示,轉移概率矩陣P如下:
第n+1天天氣狀態為j的概率為:
因此,矩陣P即為條件概率轉移矩陣。矩陣P的第i行元素表示,在上一個狀態為i的時候的分布概率,即每行元素的和必須為1。
隱馬爾可夫模型(Hidden Markov Model, HMM)是一種統計模型,在語音識別、行為識別、NLP、故障診斷等領域具有高效的性能。
HMM是關於時序的概率模型,描述一個含有未知參數的馬爾可夫鏈所生成的不可觀測的狀態隨機序列,再由各個狀態生成觀測隨機序列的過程。
HMM是一個雙重隨機過程---具有一定狀態的隱馬爾可夫鏈和隨機的觀測序列。
HMM隨機生成的狀態隨機序列被稱為狀態序列;每個狀態生成一個觀測,由此產生的觀測隨機序列,被稱為觀測序列。
思考: z1,z2...,zn是 不可觀測的狀態,x1,x2,...xn是 可觀測到的序列 ;不可觀測的狀態覺得可觀測序列的值(z的取值決定x的取值);
1、在 z1、z2 不可觀測 的情況下,x1和z2獨立嗎?x1和x2獨立嗎?
回答: 這個問題可以回顧之前的 貝葉斯網路 來理解。
首先z1,z2都是離散的值,但x1的值可能是離散的也可能是連續的。比如z是天氣情況,每天天氣的改變是離散的。x是因為天氣而改變的一些其他狀態,比如x=(地面是否潮濕、路上行人數量、雨傘銷售數量...);
在z1和z2不可觀測的情況下,x1和z2不獨立,x1和x2也是不獨立的。
2、 在 z1、z2可觀測 的情況下,x1和z2獨立嗎?x1和x2獨立嗎?
回答: 在z1和z2可觀測的情況下,因為x1和z2的取值只和z1有關,所以就獨立了。同樣在給定了z1和z2的情況下,x1和x2也獨立。
請回顧貝葉斯網路中的獨立性問題來思考這個問題。
04 貝葉斯演算法 - 貝葉斯網路
回顧:
一般而言,貝葉斯網路的有向無環圖中的節點表示隨機變數,可以是可觀察到的變數,或隱變數,未知參數等等。連接兩個節點之間的箭頭代表兩個隨機變數之間的因果關系(也就是這兩個隨機變數之間非條件獨立);如果兩個節點間以一個單箭頭連接在一起,表示其中一個節點是「因」,另外一個節點是「果」,從而兩節點之間就會產生一個條件概率值。
PS:每個節點在給定其直接前驅的時候,條件獨立於其非後繼。
HMM 由隱含狀態S、可觀測狀態O、初始狀態概率矩陣π、隱含狀態轉移概率矩陣A、可觀測值轉移矩陣B(又稱為混淆矩陣,Confusion Matrix);
π和A決定了狀態序列,B決定觀測序列,因此HMM可以使用三元符號表示,稱為HMM的三元素:
S可以統計歷史出現的所有狀態;
初始概率分布π,統計S中各個狀態各自出現的概率作為我們的初始概率分布π向量值;
S是所有可能的狀態集合,O是所有可能的觀測集合:
I是長度為T的狀態序列,Q是對應的觀測序列:
S={下雨,陰天,晴天};O={地上干,地上濕}
I = {晴,雨,雨,陰,晴,陰}
Q={干,濕,濕,濕,干,干}
A是隱含狀態轉移概率矩陣:
其中aij是在時刻t處於狀態si的條件下時刻t+1轉移到狀態sj的概率。
a 晴雨 = 某天是晴天條件下,下一天是雨天的概率。 (某一時刻→下一時刻)
B是可觀測值轉移概率矩陣:
其中bij是在時刻t處於狀態si的條件下生成觀測值oj的概率。
b 晴干 = 某天是晴天條件下,某天是地是乾的的概率。 (同一時刻)
π是初始狀態概率向量:
其中πi是在時刻t=1處於狀態si的概率。
π 晴 = 初始第一天是晴天的概率;
π 雨 = 初始第一天是雨天的概率;
p(i t | .....) 表示在從 t-1時刻的觀測值q t-1 ,一直到第1時刻觀測值q1 的條件下,在第t時刻發生狀態的概率。
性質1: 最終分析結果發現,在第t時刻發生狀態的概率it只和t-1時刻有關。
性質2: 第t時刻的觀測值qt只和第t時刻的狀態it有關。
假設有三個盒子,編號為1,2,3;每個盒子都裝有黑白兩種顏色的小球,球的比例。如下:
按照下列規則的方式進行有放回的抽取小球,得到球顏色的觀測序列:
1、按照π的概率選擇一個盒子,從盒子中隨機抽取出一個球,記錄顏色後放回盒子中;
2、按照某種條件概率選擇新的盒子,重復該操作;
3、最終得到觀測序列:「白黑白白黑」
例如: 每次抽盒子按一定的概率來抽,也可以理解成隨機抽。
第1次抽了1號盒子①,第2次抽了3號盒子③,第3次抽了2號盒子②.... ; 最終如下:
①→③→②→②→③ 狀態值
白→黑→白→白→黑 觀測值
1、 狀態集合: S={盒子1,盒子2,盒子3}
2、 觀測集合: O={白,黑}
3、 狀態序列和觀測序列的長度 T=5 (我抽了5次)
4、 初始概率分布: π 表示初次抽時,抽到1盒子的概率是0.2,抽到2盒子的概率是0.5,抽到3盒子的概率是0.3。
5、 狀態轉移概率矩陣 A:a11=0.5 表示當前我抽到1盒子,下次還抽到1盒子的概率是0.5;
6、 觀測概率矩陣 B:如最初的圖,b11=第一個盒子抽到白球概率0.4,b12=第一個盒子抽到黑球概率0.6;
在給定參數π、A、B的時候,得到觀測序列為「白黑白白黑」的概率是多少?
這個時候,我們不知道隱含條件,即不知道狀態值:①→③→②→②→③ ;
我們如何根據π、A、B求出測序列為「白黑白白黑」的概率?
02 隱馬爾可夫模型 - HMM的三個問題 - 概率計算、學習、預測
㈡ 西方期權定價理論的二項分布期權定價模型
針對布-肖模型股價波動假設過嚴,未考慮股息派發的影響等問題,考克斯、羅斯以及羅賓斯坦等人提出了二項分布期權定價模型(binomial option pricing model-bopm),又稱考克斯-羅斯-羅賓斯坦模型〔(1)e〕。
該模型假設:
第一,股價生成的過程是幾何隨機遊走過程(geometric random walk),股票價格服從二項分布。與布-肖模型一樣,在bopm模型中,股價的波動彼此獨立且具有同樣的分布,但這種分布是二項分布,而非對數正態分布。也就是說,把期權的有效期分成n個相等的區間,在每一個區間結束時,股價將上浮或下跌一定的量,從而:
(附圖 {圖})
令snj代表第n個區間後的股價,其間假定股價上浮了j次,下跌了(n-j)次,則:
(附圖 {圖})
第二,風險中立(risk-neutral economy)。由於連續交易機會的存在,期權的價格與投資者的風險偏好無關,它之所以等於某一個值,是因為偏離這一數值產生了套利機會,市場力量將使之回到原先的水平。 假設股票現價為s[0],一個區間後買方期權到期,那時股價或者上升為s[11]或者下降為s[10]即,:
(附圖 {圖})
根據風險中立的假設,任何一種資產都應當具有相同的期望收益率,否則就會發生套利行為。也就是說此時無風險債券、股票及買方期權的將來價值滿足如下關系:
(附圖 {圖})
上式中,q表示的是股票價格上漲的概率,因而期權的價格乃相當於其預期價格的貼現值。 上述分析可以進一步推廣到n個區間的買方期權價格的確定。首先,需計算出買方期權價格的預期值,假設在n個區間里,在股價上漲k次前,買方期權仍然是減值期權,內在價值仍為0,而k次到n次之間,它具有內在價值,則:
(附圖 {圖})
(附圖 {圖}) 先前的分析沒有考慮股息的存在,假定某種股票每股在t時將派發一定量的股息,股息因子為f,除息日與付息日相同,則在除息日股價將會下降相當於股息的金額fs[t]。
(附圖 {圖})
對於美式期權,則需考慮提前執行的情況:
在t時若提前執行,其價格等於內在的價值;不執行,則可按前面的推導得到相應的價格。最終t時的價格應當是提前執行與不提前執行情況下的最大者。即:
(附圖 {圖}) 根據歐洲期權的平價關系,可直接從其買方期權導出賣方期權價格,而美國期權則不能。利用上述推導美國買方期權價格的方法,可以同樣得到:
(附圖 {圖})
這就是美國賣方期權的定價公式。從上述bopm模型的推演中可看出其主要特點:
1.影響期權價格的變數主要有基礎商品的市價(s),期權協定價格(x),無風險利率(r),股價上升與下降的因子(u,d),以及股息因子(f)及除息次數。事實上u與d描述的是股價的離散度,因而與布-肖模型相比,bopm所考慮的主要因素與前者基本相同,但因為增加了有關股息的討論,因而在派發股息的期權及美國期權的定價方面,具有優勢。
2.根據二項分布的特點,bopm模型中只要對u與d及p作出適當的界定,它就可以回答跳動情況下的期權的定價問題。這是布-肖模型所不能夠的。同時,當n達到一定規模後,二項分布趨向於正態分布,只要u、d及p的選擇正確,bopm模型會逼近布-肖模型。
與布-肖模型一樣,二項分布定價模型也被推廣到外匯、利率、期貨等的期權定價上,受到理論界與實業界的高度重視。
三、對西方期權定價理論的評價
以布萊克-肖萊斯模型和bopm模型為代表的西方期權定價理論,是伴隨著期權交易,特別是場內期權交易的擴大與發展而逐漸豐富與成熟起來的。這些理論基本上是以期權交易的實踐為背景,並直接服務於這種實踐,具有一定的科學價值與借鑒意義。
首先,模型將影響期權價格的因素歸納為基礎商品價格、協定價格、期權有效期、基礎商品價格離散度以及無風險利率和股息等,並認為期權價格是這些因素的函數,即:
c或p=(s,x,t,σ,γ,d)
在此基礎上得到了計算期權價格的公式,具有較高的可操作性。比如在布-肖模型中,s、x及t都可以直接得到,γ亦可以通過相同期限的國庫券收益率而求出,因而運用該模型進行估價,只需求出相應的σ值即基礎商品的價格離散度即可。實踐中,σ值既可通過對歷史價格的分析得到,亦可假定未行使的期權的市場價格即為均衡價格,將相應變數代入求得(此時稱為隱含的離散度implicit volatility)。因而操作起來比較方便。同時,這種概括是基於期權的內在特點,把它放在統一的資本市場考慮的結果。其分析觸及到了期權價格的實質,力圖揭示期權價格「應當是」多少,而不是「可能是」多少的問題,因而比早期的計量定價模型向前邁了一大步。
其次,模型具有較強的實踐性,對期權交易有一定的指導作用。布-肖模型以及二項分布模型都被編製成了計算機軟體,成為投資者分析期權市場的一種有效工具。金融界也根據模型編製成現成的期權價格計算表,使用方便,一目瞭然,方便了投資者。正如羅伯特·海爾等所編著的《債券期權交易與投資》一書所言:「(布-肖)模型已被證明在基本假設滿足的前提下是十分准確的,已成為期權交易中的一種標准工具。」具體來講,這些模型在實踐中的運用主要體現於兩方面:1.指導交易。投資者可以藉助模型發現市場定價過高或過低的期權,買進定價過低期權,賣出定價過高期權,從中獲利。同時,還可依據其評估,制定相應的期權交易策略。此外,從模型中還可以得到一些有益的參數,比如得耳他值(△),反映的是基礎商品價格變動一單位所引起的期權價格的變化,這是調整期權頭寸進行保值的一個十分有用的指標。此外還有γ值(衡量△值變動的敏感性指標);q值(基礎商品價格不變前提下,期權價格對於時間變動的敏感度或彈性大小),值(利率每變動一個百分點所引起的期權價格的變化)等。這些參數對於資產組合的管理與期權策略的調整,具有重要參考價值。2.研究市場行為。可以利用定價模型對市場效率的高低進行考察,這對於深化期權市場的研究也具有一定意義。