A. 正螺旋效應是怎麼產生的
滬深A股市場價格混沌特性研究
Study on Chaos process of stock price in Shanghai and Shenzhen A shares Stock market
研究領域: 金融學
1、前言
現代金融經濟學理論假定投資者是理性的,證券價格等於其內在「基本價值」,在這種理想的市場環境中,市場是有效率的。Fama(1970)提出有效市場假說(Efficient Market Hypothesis,EMH),認為在一個有效率的市場中,證券的價格充分反映了所有可獲得的信息。為了檢驗市場是否有效,所採用的方法一般是通過檢驗證券價格收益率序列是否符合隨機遊走模型。關於市場效率的實證研究持續了近半個世紀,但結論仍然是存在極大爭議的。
自然科學的研究成果表明,一個非線性正反饋系統的演化過程可能產生混沌(Chaos)。許多經濟行為模式都是非線性的,例如,投資者對風險與收益的偏好、市場參與者之間的決策博弈、一些經濟合同及金融工具的選擇性條款等。行為金融學派認為,投資者並非完全理性的,而是存在「代表性直覺(Representativeness heuristic)」等認知偏差(Kahneman 與 Tversky,1979),在這些認知偏差影響下,由於羊群效應(Scharfstein 與 Stein,1990)、外推預期等因素,證券市場存在正反饋機制(De Long等,1990b)。因此,證券價格形成過程中,存在非線性正反饋機制, 在這種機制的驅動下,證券價格有可能出現混沌(Chaos)現象,使證券價格的演變表現出復雜性(Complexity)。
混沌概念是E.Lorenz(1963)最早在研究大氣運動時提出的,它是指確定性系統的內在不規則的、永不重復的非周期性運動,這種系統存在內在非線性正反饋動力,其定常狀態是一種性態復雜、紊亂但卻使終有限的運動狀態,且系統的運動路徑受系統初始條件及參數影響很大。混沌表面上看起來像隨機運動,它能通過所有傳統的隨機性檢驗,例如,在許多計算機系統中,類似於Logistic映射這樣的混沌過程演算法就被作為偽隨機數發生器(Pseudo Random Number Generators)產生隨機數序列。混沌貌似隨機性(Randomness),但它不是隨機性。隨機性是隨機過程,是雜訊擾動引起的。而混沌則是由內在確定性的非線性正反饋引起的,因此也被稱為確定性混沌(Deterministic Chaos)。
混沌的概念提出以後,對現代金融經濟學中有效市場理論的沖擊是巨大的。Fama(1970)通過檢驗證券價格收益率序列在統計上能通過隨機行走模型檢驗,從而認為市場是有效的。但是,如果證券價格收益率序列存在確定性混沌過程,它在數學上也完全能夠通過所有隨機性檢驗,但它卻不是隨機運動,而是受內部確定性過程驅動,這樣,傳統金融經濟學有效市場理論的基礎將變得十分脆弱。
本文將簡要回顧混沌理論的研究成果及其在金融市場研究中的應用,並對滬深A股市場價格的混沌特性進行實證研究。本文的研究表明,滬深A股市場存在低維確定性過程。
本文餘下部分安排如下,第二部分是對混沌理論及相關研究成果進行簡要回顧,第三部分對滬深A股市場股票價格混沌特性進行實證研究,第四部分是全文的總結。
2、混沌理論及證券價格的混沌特性
Lorenz(1963)在研究氣象預測時發現,大氣運動這樣的復雜系統存在混沌過程,在一定的條件下,系統運動的軌跡將是圍繞兩個不動點(即奇異吸引子,Strange Attractor)的發散的螺旋,並局限在一個有界的、體積為零的曲面上,進行不斷無規則的振盪。這種不規則的來回振盪,好像飛蛾看到兩個光源,飛向一個光源,當靠近時感到太熱又飛向另一光源,如此不規則地來回飛騰,其飛行的軌跡永不重復。由於它的形狀類似蝴蝶的雙翼,所以也被稱為Lorenz蝴蝶結,如圖1所示。
圖1 Lorenz 蝴蝶結
周期運動或周期性振盪是大量存在的,但上述Lorenz過程是非周期振盪,好像永不結束的過程,然而它既不發散也不消失,一直是不規則的振盪。這種振盪的軌跡在三維相空間上是螺旋線,非常密集的曲線在無窮多層平面上呈分形結構(Fractal Structure,參見Mandelbrot, 1985),無窮長,且對初始條件敏感,初始條件中無足輕重的誤差能夠被系統迅速放大,導致系統的演變路徑大相徑庭。正如Lorenz 所指出的那樣:「巴西一隻蝴蝶的扇動可以引發得克薩斯洲的颶風」,即所謂「蝴蝶效應(Butterfly Effect)」。
混沌是作為確定性過程與隨機性過程的橋梁,確定性過程是完全可預測的,而隨機性過程則是完全不可預測的,而混沌過程則是界於確定性過程與隨機性過程之間。由於混沌過程對初始條件敏感,初始細微的誤差可以成倍地放大,因此,對於長期來看,系統的演變是不可預測的。但是,如果初始條件保持穩定,運用混沌過程對系統的短期演化狀態進行預測,得到的結果將比採用線性隨機過程可能得到的預測結果精確得多,因此,混沌過程對經濟分析與預測的意義是明顯的。這可以解釋為什麼傳統經典金融理論認為奉行圖表分析的技術分析是無意義的,但在金融市場仍然存在為數眾多的投資者採用技術圖表分析,追隨證券價格趨勢(Murphy, 1986),而且這些交易者並不像傳統理論所認為的那樣,在與理性交易者長期博弈過程中,這些交易者將因遭受虧損而被趕出市場。
在行為金融學分析框架下,由於證券市場投資者並非完全是古典意義上的理性經濟人,投資者存在認知偏差,對同一事件不同投資者具有不同的價值判斷,從而表現出不同的決策行為。事實上,按照Kahneman 與 Tversky(1974,1979)提出的前景理論(Prospect Theory),各類投資者的風險偏好並不是固定不變的,存在風險偏好的反轉。投資者的價值函數是根據參考點進行定義的,在贏利時是凹函數,在虧損時是凸函數,即在贏利時是風險厭惡型的,而在虧損時是風險追求型的,而且在虧損區間比在贏利區間更陡峭,人們對虧損比對贏利更加敏感。
此外,在前景理論中,投資者權重函數也是非線性的。在極端低概率及極端高概率處,權重函數都存在跳躍,某一事件如果其發生的概率極端地高,明顯地接近於1,則決策者在編輯階段將明確地將其視為確定性的事件,相反,如果某一事件發生的概率極端地小,接近於零,則決策者在編輯階段可能就將其忽略。因此,人們傾向於對那些極端不可能的事件或者忽略或者高估,而對於一些極端高概率的事件則或者忽視或者誇大。
投資者在決策時存在保守主義(Edwards, W., 1968),不會輕易對新收到的信息做出反應,除非人們確信得到足夠的信息表明環境已經改變。而且投資者的行為模式一般是當環境的變化已經達到一定閥值以後,才一起對所有的信息集中做出反應。例如,對理性投資者來說,其對證券的需求並不完全與證券價格偏離基礎價值的程度呈線性關系。在投資實務中,證券分析師與投資經理會經常設定一個他們認為安全的價格線, 價格在此安全價格線以上, 他將進一步等待, 而一旦價格低於這一預先判定的價格時, 他們將迅速大量買入。例如,價值投資理論的創立者本傑明•格拉厄姆(Benjamin Graham)特別強調投資的安全邊際(Safety Margin),只有投資者的預期收益達到一定程度以上時,才會建議買入證券。
總之,在證券市場,由於雜訊交易者的存在、從眾心理及羊群效應等產生的群體性非理性行為可能形成正反饋效應,這種正反饋機制會使證券價格的演變產生十分復雜的運動,在一定條件下產生混沌過程,導致證券價格收益率分布呈現分形等復雜結構,表現出高度的復雜性。例如,價格的突然大幅度波動則導致分布產生胖尾現象,而混沌及局部奇異吸引子的出現,導致證券價格膠著於一些價格附近,來回進行無規則的反復振盪,則使證券價格分布出現局部尖峰的特徵。
現實市場中的非線性特性將進一步增加證券價格形成的復雜程度,使市場交易在本質上變成一種不同投資者之間的多輪博弈。由於證券價格的演變可能形成混沌過程,系統的初始狀態對證券價格的演變路徑影響很大,初始狀態細微的差別將導致長期結果的巨大差別,即所謂「失之毫釐,謬以千里」的蝴蝶效應。因此,就長時間跨度來說,證券價格波動的方向及波動的幅度都是難於預測的。股票價格的波動形式既可以呈現出穩定的均衡(即通常所說的「盤整」),也可以是非周期性的振盪,還可以突然出現暴發性上漲(泡沫)或者大幅度下跌(泡沫破滅或者負泡沫)等劇烈波動,局部可能與整體相似,但永不重復且不可逆轉,呈現分形等復雜且不規則的分形結構,表現出高度的復雜性。混沌過程所擁有的「蝴蝶效應」還可以解釋一些偶然性局部事件所引發的全球性金融市場異常波動,例如,上世紀90年代初的「墨西哥金融危機」及90年代後期的東南亞金融危機等。如果證券價格存在混沌特性,則意味著證券價格變化在短期內存在一定的可預測性,而進行長期預測則是極為困難的,從投資策略角度看,這意味著基於證券價格短期變化的交易者可能存在生存的空間。
在實證研究方面,Fama 1970年提出有效市場假說以後,關於資本市場效率的實證研究不勝枚舉,大量經驗研究表明,證券價格收益率分布不是高斯分布,具有尖峰與胖尾的特點,經常產生一些極端數值,而且,按不同的時間間隔建立收益率分布曲線,得到的都具有相似的尖峰與胖尾的特徵,具有時間分形的特徵。Mandelbrot(1972)提出重標極差分析法(Rescaled Range Analysis, R/S分析方法)以後,許多學者運用R/S方法研究了股票市場效率及檢驗股票市場價格是否存在記憶特性。這方面的文獻包括:Peters(1989,1991,1996),Lo(1991), Pandey,Kohers與Kohers(1998)等。這些經驗研究結果顯示,金融數據具有長期記憶的特徵,即是說,股票當前價格運動受到以前的價格運動的影響。這意味著股票價格存在一定時間區間內的趨勢持續效應,這也在一定程度上印證了股票價格形成過程中存在正反饋效應。
Lorenz(1963)提出混沌理論以後,Grassberger and Procaccia(1983a)提出了關聯維數(Correlation Dimension)的分析方法,用以識別時間序列是否存在低維確定性過程。Scheinkman 與Lebaron(1989)根據美國證券價格研究中心(CRSP)提供的以市值為權重的美國股票收益率指數,對始於1960年代初期的共1226個周收益率數據考察了其關聯維數(Correlation Dimension, CD), 他們研究得到CD值為6,從而認為美國股票周收益率序列總體表現出了非線性關聯,並認為這種非線性關聯可以解釋金融資產分布的尖峰、胖尾等特性。Brock與Back(1991)再度擴展了Scheinkman 與LeBaron的研究,得到的CD值在7-9之間,因此,也拒絕了股票價格收益率是獨立同分布(Independent Identical Distribution,IID)的假設,傾向於支持股價收益率分布存在低維確定性過程的備擇假設,但他們同時指出,並不能就此認為存在混沌過程。Urrutia等(2002)的研究則提出了針鋒相對觀點,他們研究了1984年至1998年期間美國保險公司股票收益率特性,研究表明保險公司股票收益率存在非線性特徵,並且進一步驗證導致這種非線性的原因就是低維混沌過程。總體而言,這些經驗研究提供了實質性的證據表明,股票、匯率、商品期貨等金融數據序列存在非線性結構,但就是否明確存在低維確定性混沌過程,則結論不完全一致,仍然存在爭論。
對於中國大陸股票市場,戴國強等(1999)對上證綜合指數及深證成份指數進行R/S分析,計算得到Hurst指數分別為0.661和0.643;史永東(2000)所作的R/S分析顯示,上海證券交易所股票市場的Hurst指數為0.687,而深圳證券交易所股票市場的Hurst指數為0.667;曹宏鐸等(2003)計算的深證證券交易所股票市場日收益率、周收益率、月收益率的Hurst指數分別為0.6507,0.7000,0.6906及0.7576。上述經驗研究表明,上海及深圳股票市場並不呈隨機行走的特徵,而具有狀態持續特徵,同時也意味著中國股票市場不是弱式有效的。
事實上,關於中國股票市場是否弱式有效,一致存在極大爭議。正如張亦春與周穎剛(2001)所意識到的那樣,一方面,多數研究人士憑經驗就感覺到中國股票市場投機性強,遠未達到有效狀態。例如,滬深A股市場近年來上市公司財務造假不斷案發 ,莊家操作市場盛行 ,股價嚴重脫離內在價值,上海A股市場在2000年及2001年平均市盈率高達60多倍,被很多學者斥為「賭場」,宣稱這樣一個市場已達到弱式有效狀態,確實讓人們難以接受。另一方面,許多學者所作的實證研究卻表明,證券價格收益率序列十分接近隨機行走模型,因而無法有力地拒絕有效市場假設。經驗感覺與理論研究結論大相徑庭,這其中的原因究竟是什麼?到底是現實錯了?還是學術理論研究有問題?混沌的思想讓我們豁然開朗!因為,如果證券價格存在混沌過程,或者是在混沌過程基礎上迭加一個隨機過程,那麼,市場顯然是無效的,但證券價格收益率序列同樣能通過隨機性檢驗。例如,假設證券價格波動序列是一個Logistic 映射過程,它顯然是一個確定性的混沌過程,但是,這一過程在許多計算機系統是被當作偽隨機數發生器,常規的檢驗方法根本無法識別確定性過程,而是將其視為隨機序列!如果這樣的話,所有通過考察證券價格是否能夠通隨機性檢驗的方法來考察資本市場有效性的研究,其理論基礎及研究結論都將受到質疑。
3、滬深A股市場價格混沌特性實證研究
本文同時採用R/S分析方法及關聯維數(Correlation Dimension,CD)分析方法考察滬深A股市場的非線性特徵。通過R/S分析方法能夠識別出證券價格序列是否存在持續效應,這在某種程度上可以驗證股票市場是否存在正反饋交易機制,正反饋過程是產生混沌的前提。採用關聯維數分析,可以識別股價序列是否存在混沌特徵。我們的數據來源於乾隆公司的錢龍資訊系統。
3.1 R/S分析
Hurst(1951),Mandelbrot(1972)及Lo(1991)等所發展並完善了赫斯特指數(Hurst Index)的分析方法,即重標定域(Re-scaled range,R/S)分析方法。
赫斯特指數(H)可以用來識別時間序列的非隨機性, 還可以識別序列的非周期性循環,因而可以用於識別時間序列的非線性特徵。如果序列的赫斯特指數不等於0.50,則觀測就不是獨立的,每一個觀測值都帶著在它之前發生的所有事件的「記憶」,這種記憶不是短期的,它是長期的,理論上講,它是永遠延續的。雖然遠期事件的影響不如近期事件的影響大,但殘留影響總是存在的。在更寬泛的尺度上,一個表現出赫斯特統計特性的系統是一長串相互聯系的事件的結果。今天發生的事情影響未來,今天我們所處的地位是過去我們所曾處的地位的一個結果。
關於Hurst赫斯特指數的詳細計算參見文獻Mandelbrot(1972)及Lo(1991)等,其計算過程如下:
1.對一個時間序列 ,考察長度為n的時間窗口內的子序列, ,n=1,2,3,……K,計算序列的平均值為:
………………………………(1)
2.計運算元序列偏離均值的差值
………………………………(2)
顯然, 的均值為零,這是重標定或歸一化(標准化)。
3.計算偏離均值的累加值
……………………………(3)
4.計算時子序列的域
………………………………(4)
5.計算采樣子序列的標准差
………………………………(5)
6.計運算元序列重標定域
……………………………(6)
7.求解全序列 的均值
………………………………(7)
8.求解赫斯特指數
與 有冪關系,即:
……………………………(8)
……………………………(9)
在對數坐標上,設水平軸n,縱軸為 ,對 與 進行回歸, 則線性回歸的斜率為赫斯特指數。
我們選取上海證券交易所A股綜合指數從1990年12月19日至2003年12月23日,以及深圳證券交易所A股綜合指數從1992年10月4日至2003年12月23日期間的交易數據,分別計算其日收益率及周收益率序列的赫斯特指數,從而考察滬深A股市場的證券價格是否存在非線性特徵。
採用上述方法,計算得到滬深A股綜合指數的赫斯特指數,如表1所示,在圖2—圖5中,還詳細地列出了R/S分析圖。
表1 滬深A股綜合指數Hurst 指數
上海A股指數 深圳A股指數
日收益率序列H值 0.66(t=336) 0.63(t=306)
周收益率序列H值 0.69(t=84 ) 0.69(t=97 )
圖2 上證A股指數日收益率序列 圖3 上證A股指數周收益率序列
圖4 深圳A股指數日收益率序列 圖5 深圳A股指數周收益率序列
從表中數據我們可以看到,滬深A股市場的赫斯特指數無論以周數據統計還是以日數據統計,結果基本一致,均在0.60以上。H值大於0.50,意味著今天的事件確實影響明天,即是說,今天收到的信息在其被接收到之後繼續被市場計算進去, 這從另一側面印證滬深A股市場價格並不呈隨機行走狀態,收益序列之間存在一定的關聯性,這是一種持續效應(Persistence effect)。如果股價序列在前一個期間是向上運動的,則它在下一個期間將更可能繼續向上運動的趨勢,反之,在前一個期間是向下運動的,則它在下一個期間更可能持續向下運動的趨勢。股價序列的這一特性與經驗感覺是一致的,無論是國內股票市場還是全球其它地區的股票市場,典型的牛市或者熊市,並非短暫的數日或者數月,往往持續數年。而股票市場極其異常的波動,例如,美國股市1929年股災、1987年的暴跌等,均使投資者對市場的信心受到嚴重打擊,市場在其後很長一段時間深受其影響。股價的持續效應在某種程度上印證了股票市場存在的正反饋效應機制。
3.2 關聯維數分析
Grassberger 與Procaccia(1983a,1983b)提出了關聯維數(Correlation Dimension,CD)方法,用以考察時間序列的非線性特性。其基本思想是:如果一個混沌過程是n維確定性過程,則該過程將充滿n維空間,但如將其置於更高維的空間里,該過程將留下許多「洞眼」。一般地,關聯維數度量的是相空間被一組時間序列「填充」的程度,關聯維數越大,填充程度越高,表示時間序列內部結構越復雜,它類似隨機過程時間序列的程度越強。需要指出的是,我們僅對低維混沌過程感興趣。 如果股票價格真的是高復雜性的混沌過程,我們採用有限的樣本數據是永遠也無法識別出其復雜的結構的。此時,它可能與一個良好的「偽隨機數發生器」產生的數據相近,高維混沌過程與隨機過程將沒有實際意義的區別。
設時間序列 由具有 個自由度的非線性動態系統產生,可以構造 維相空間失量:
………………(10)
其中, 被稱為鑲嵌維(Embedding dimension), 為適當的時滯單位。時間序列過程在相空間的運行軌道是由一系列 維失量構成。如果該系統最終收斂為一組確定性過程,則該系統的運行軌道將收斂於相空間中維數低於 的相空間子集,即吸引子(Attractor),在這些吸引子周圍的運動是混沌過程,具有非周期性且長期運動狀態無法預測。
考慮吸引子附近的失量集合 ,關聯積分(Correlation Integral) 定義為對於任意給定的 ,那些彼此之間的距離小於 的點數對(Pairs of Points) 的數量占所有可能的點數對的比例,即:
……………………(11)
其中, ……………(12)
當 時,對任意小 ,可以預期C遵循指數冪變化規律,即:
,從而關聯冪(Correlation Exponent)可以通過對 與 對回歸計算得到:
……………………………(13)
如果系統存在確定性混沌過程,隨著鑲嵌維數的增加,關聯冪D值達到飽和值以後,將大約保持不變,這一關聯冪指數的飽和值就是吸引子的關聯維數。如果系統是隨機過程,則隨著鑲嵌維數的增加,D值亦將成比例地增加,趨向無窮大 。
圖6 上證A股指數在不同鑲嵌維空間中的關聯積分
圖7 上證A股指數關聯維
我們考察上海證券交易所A股綜合指數從1990年12月19日至2003年12月31日期間日收益率時間序列的關聯維。圖6為上證A股綜合指數在1-8維相空間中關聯積分 隨 值的變化情況。從圖中我們可以看到,在 值處於0.0003-0.005區間時, 與 的變化呈現出指數冪關系。圖7是關聯冪D隨鑲嵌維數m的變化情況,我們可以看到,隨著鑲嵌維數m超過2以後,關聯冪D值不再增加,而是穩定於大約 區間, 即上證A股綜合指數的關聯維數大約為1.4, 因此, 我們可以推測, 上證A股綜合指數存在關聯維數大約為 的低維確定性混沌過程。
相對於Scheinkman 與Lebaron(1989)及Brock與Back(1991)等計算得到的成熟資本市場關聯維數,我們計算得到的上海A股市場的關聯維數明顯更低。如果時間序列是一個低維確定性過程,則意味著時間序列在短期是具有一定的可預測性的。從這個意義上看,我們認為,相對成熟資本市場,上海A股市場指數的隨機性程度更低,而短期可預測性更強,這在某程度上也說明市場效率程度相對更低。另外,由於混沌特性,證券價格在短期具有一定的預測性,但進行長期預測則是極為困難的,從投資策略角度看,意味著基於證券價格短期變化的交易者可能存在獲取利潤的空間。
4、結論
在一個存在非線性正反饋機制的系統中,系統的演化理論上可能出現混沌過程。 證券市場由於雜訊交易者的存在、從眾心理及羊群效應等產生的群體性非理性行為,形成正反饋效應,從而可能導致證券價格的演變呈現出混沌過程,表現出復雜性。
本論文所做的實證研究表明,滬深A股市場指數的赫斯特指數大於0.5,這意味著滬深A股市場價格並不呈隨機行走狀態,收益序列之間存在趨勢持續的特性,這也在一定程度上說明了股價形成過程中存在正反饋效應。對上海A股市場指數的考察進一步表明,上海A股市場指數收益率序列存在低維確定性混沌過程,其關聯維數大約為1.4。 這一數值遠低於成熟資本市場的指標,這表明上海股票市場指數收益率序列隨機性低於成熟資本市場, 市場在短期的可預測性更強一些, 這在某種程度上表明市場的效率程度更低一些。市場存在確定性混沌過程,市場顯然是無效的,但是,由於混沌過程同樣能夠通過隨機行走模型檢驗, 我們認為, 這也許是為什麼關於資本市場效率的傳統實證檢驗結果仍然存在極大爭議的原因。因為常規檢驗方法無法區分混沌過程與隨機過程,因此,本論文認為,所有採用常規方法,通過考察證券價格是否符合隨機遊走模型,從而推斷資本市場有效性的研究,其理論基礎及研究結論均存在嚴重缺陷。由於證券價格運動的混沌特性,這意味著證券價格在短期具有一定的可預測性,但進行長期預測則是極為困難的。證券價格的這種混沌特性,從投資策略角度看,意味著基於證券價格短期變化的交易者可能存在生存的空間。
內 容 提 要
行為金融理論認為,投資者不是完全理性的,而是存在各種認知偏差。由於雜訊交易者的存在、從眾心理及羊群效應等產生的群體性非理性行為,證券市場存在正反饋效應。而且,投資者行為模式都是非線性的,在一個存在非線性正反饋機制的系統中,證券價格的演化可能出現混沌過程。
本論文所做的實證研究表明,滬深A股市場價格並不呈隨機行走狀態,而是存在非線性結構;上海A股市場指數收益率序列存在低維確定性混沌過程,其維數大約為1.4, 這一數值遠低於成熟資本市場的指標,這表明上海股票市場指數收益率序列隨機性低於成熟資本市場。由於市場存在確定性混沌過程,市場雖然是無效的,但同樣能夠通過隨機行走模型檢驗,這也從某一角度說明了,為什麼關於資本市場效率的傳統實證檢驗結果仍然存在極大爭議。由於混沌的存在,證券價格變化在短期具有一定的可預測性,但進行長期預測則是十分困難的。
B. 為什麼我用邏輯回歸預測股票漲跌的效果非常好
機器學習量化交易策略的制定,是通過從海量歷史數據中,利用計算機強大的處理能力,挖掘並分析出那些能夠為投資者帶來收益的各種大概率可行的投資方式來實現的。通過數學模型對這些策略進行分析並加以驗證,以期望讓投資者獲得更高更穩定的收益,或更合理地規避風險。
邏輯回歸模型主要用來解決二分類問題,計算效率高,魯棒性較優
預測股票漲跌趨勢本質上是一個二分類問題。邏輯回歸作為處理二分類問題常見的分類方法,既能提供類概率估計又能提高預測精度。邏輯回歸可以處理大量的數據,並且受到多重共線性的影響相對較小。它不僅能預測出類別,而且可以得到近似概率預測,這對許多需利用概率輔助決策的任務很有用。
基於邏輯回歸模型的擇時策略具有高收益,高夏普比率,低回撤率等特點
由於邏輯回歸模型可以預測股票的漲跌趨勢,並且具有較高預測精度,所以可以根據模型對股票漲跌趨勢的判斷進行交易,通過在滬深300 上的回測表明模型具有高收益,高夏普比率,低回撤率的優點。
C. 明年一月股票價格屬於邏輯回歸問題嗎
是的,明年一月股票價格屬於邏輯回歸問題。邏輯回歸這個模型很神奇,雖然它的本質也是回歸,但是它是一個分類模型,並且它的名字當中又包含」回歸「兩個字,未免讓人覺得莫名其妙。
如果是初學者,覺得頭暈是正常的,沒關系,讓我們一點點捋清楚。
讓我們先回到線性回歸,我們都知道,線性回歸當中 y = WX + b。我們通過W和b可以求出X對應的y,這里的y是一個連續值,是回歸模型對吧。但如果我們希望這個模型來做分類呢,應該怎麼辦?很容易想到,我們可以人為地設置閾值對吧,比如我們規定y > 0最後的分類是1,y < 0最後的分類是0。從表面上來看,這當然是可以的,但實際上這樣操作會有很多問題。
最大的問題在於如果我們簡單地設計一個閾值來做判斷,那麼會導致最後的y是一個分段函數,而分段函數不連續,使得我們沒有辦法對它求梯度,為了解決這個問題,我們得找到一個平滑的函數使得既可以用來做分類,又可以解決梯度的問題。
很快,信息學家們找到了這樣一個函數,它就是Sigmoid函數,它的表達式是:
.png
它的函數圖像如下:
.png
可以看到,sigmoid函數在x=0處取值0.5,在正無窮處極限是1,在負無窮處極限是0,並且函數連續,處處可導。sigmoid的函數值的取值范圍是0-1,非常適合用來反映一個事物發生的概率。我們認為
σ(x) 表示x發生的概率,那麼x不發生的概率就是 1 - σ(x) 。我們把發生和不發生看成是兩個類別,那麼sigmoid函數就轉化成了分類函數,如果 σ(x) > 0.5 表示類別1,否則表示類別0.
到這里就很簡單了,通過線性回歸我們可以得到
.png
也就是說我們在線性回歸模型的外面套了一層sigmoid函數,我們通過計算出不同的y,從而獲得不同的概率,最後得到不同的分類結果。
損失函數
下面的推導全程高能,我相信你們看完會三連的(點贊、轉發、關注)。
讓我們開始吧,我們先來確定一下符號,為了區分,我們把訓練樣本當中的真實分類命名為y,y的矩陣寫成 Y 。同樣,單條樣本寫成 x , x 的矩陣寫成 X。單條預測的結果寫成 y_hat,所有的預測結果寫成Y_hat。
對於單條樣本來說,y有兩個取值,可能是1,也可能是0,1和0代表兩個不同的分類。我們希望 y = 1 的時候,y_hat 盡量大, y = 0 時, 1 - y_hat 盡量大,也就是 y_hat 盡量小,因為它取值在0-1之間。我們用一個式子來統一這兩種情況:
.png
我們代入一下,y = 0 時前項為1,表達式就只剩下後項,同理,y = 1 時,後項為1,只剩下前項。所以這個式子就可以表示預測准確的概率,我們希望這個概率盡量大。顯然,P(y|x) > 0,所以我們可以對它求對數,因為log函數是單調的。所以 P(y|x) 取最值時的取值,就是 log P(y|x) 取最值的取值。
.png
我們期望這個值最大,也就是期望它的相反數最小,我們令
.png
這樣就得到了它的損失函數:
.png
如果知道交叉熵這個概念的同學,會發現這個損失函數的表達式其實就是交叉熵。交叉熵是用來衡量兩個概率分布之間的」距離「,交叉熵越小說明兩個概率分布越接近,所以經常被用來當做分類模型的損失函數。關於交叉熵的概念我們這里不多贅述,會在之後文章當中詳細介紹。我們隨手推導的損失函數剛好就是交叉熵,這並不是巧合,其實底層是有一套資訊理論的數學邏輯支撐的,我們不多做延伸,感興趣的同學可以了解一下。
硬核推導
損失函數有了,接下來就是求梯度來實現梯度下降了。
這個函數看起來非常復雜,要對它直接求偏導算梯度過於硬核(危),如果是許久不碰高數的同學直接肝不亞於硬抗葦名一心。
.png
為了簡化難度,我們先來做一些准備工作。首先,我們先來看下σ 函數,它本身的形式很復雜,我們先把它的導數搞定。
.png
因為 y_hat = σ(θX) ,我們將它帶入損失函數,可以得到,其中σ(θX)簡寫成σ(θ) :
.png
接著我們求 J(θ) 對 θ 的偏導,這里要代入上面對 σ(x) 求導的結論:
.png
代碼實戰
梯度的公式都推出來了,離寫代碼實現還遠嗎?
不過巧婦難為無米之炊,在我們擼模型之前,我們先試著造一批數據。
我們選擇生活中一個很簡單的場景——考試。假設每個學生需要參加兩門考試,兩門考試的成績相加得到最終成績,我們有一批學生是否合格的數據。希望設計一個邏輯回歸模型,幫助我們直接計算學生是否合格。
為了防止sigmoid函數產生偏差,我們把每門課的成績縮放到(0, 1)的區間內。兩門課成績相加超過140分就認為總體及格。
.png
這樣得到的訓練數據有兩個特徵,分別是學生兩門課的成績,還有一個偏移量1,用來記錄常數的偏移量。
接著,根據上文當中的公式,我們不難(真的不難)實現sigmoid以及梯度下降的函數。
.png
這段函數實現的是批量梯度下降,對Numpy熟悉的同學可以看得出來,這就是在直接套公式。
最後,我們把數據集以及邏輯回歸的分割線繪制出來。
.png
最後得到的結果如下:
.png
隨機梯度下降版本
可以發現,經過了1萬次的迭代,我們得到的模型已經可以正確識別所有的樣本了。
我們剛剛實現的是全量梯度下降演算法,我們還可以利用隨機梯度下降來進行優化。優化也非常簡單,我們計算梯度的時候不再是針對全量的數據,而是從數據集中選擇一條進行梯度計算。
基本上可以復用梯度下降的代碼,只需要對樣本選取的部分加入優化。
.png
我們設置迭代次數為2000,最後得到的分隔圖像結果如下:
.png
當然上面的代碼並不完美,只是一個簡單的demo,還有很多改進和優化的空間。只是作為一個例子,讓大家直觀感受一下:其實自己親手寫模型並不難,公式的推導也很有意思。這也是為什麼我會設置高數專題的原因。CS的很多知識也是想通的,在學習的過程當中靈感迸發旁徵博引真的是非常有樂趣的事情,希望大家也都能找到自己的樂趣。
今天的文章就是這些,如果覺得有所收獲,請順手點個關注或者轉發吧,你們的舉手之勞對我來說很重要。
相關資源:【原創】R語言對二分連續變數進行邏輯回歸數據分析報告論文(代碼...
文章知識點與官方知識檔案匹配
演算法技能樹首頁概覽
33030 人正在系統學習中
打開CSDN,閱讀體驗更佳
VGG論文筆記及代碼_麻花地的博客_vgg論文
VGG論文筆記及代碼 VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION 牛津大學視覺組(VGG)官方網站:https://www.robots.ox.ac.uk/~vgg/ Abstract 在這項工作中,我們研究了在大規模圖像識別環境中卷積網路深度對其...
...MNIST研究》論文和Python代碼_通信與逆向那些事的博客_機器...
1、邏輯回歸演算法 邏輯回歸(Logistic Regression),與它的名字恰恰相反,它是一個分類器而非回歸方法,在一些文獻里它也被稱為logit回歸、最大熵分類器(MaxEnt)、對數線性分類器等。 使用sklearn.linear_model中的LogisticRegression方法來訓練...
兩個重要極限的推導
兩個重要極限 (1) limθ→0sinθθ=1 (θ為弧度) \underset{\theta \rightarrow 0}{\lim}\frac{\sin \theta}{\theta}=1\ \ \text{(}\theta \text{為弧度)} θ→0limθsinθ=1 (θ為弧度) (2) limx→∞(1+1x)x=e \underset{x\rightarrow \infty}{\lim}\left( 1+\frac{1}{x} \ri
繼續訪問
兩個重要極限及其推導過程
一、 證明:由上圖可知, 即 二、 證明:首先證明此極限存在 構造數列 而對於n+1 ...
繼續訪問
...是多項式回歸】Jeff Dean等論文發現邏輯回歸和深度學習一樣好_qq...
其中,基線 aEWS(augmented Early Warning Score)是一個有 28 個因子的邏輯回歸模型,在論文作者對預測患者死亡率的傳統方法 EWS 進行的擴展。而 Full feature simple baseline 則是 Uri Shalit 說的標准化邏輯回歸。 注意到基線模型(紅...
數學模型——Logistic回歸模型(含Matlab代碼)_蘇三有春的博客...
Logistic回歸模型是一種非常常見的統計回歸模型,在處理大量數據,揭示各自變數如何作用於因變數(描述X與Y之間的關系)時有著十分重要的作用。筆者在寫Logit回歸模型前參加了一次市場調研比賽,在這次比賽中學到了很多東西,同時發現,許多優秀獲...
《神經網路設計》第二章中傳遞函數
import math #硬極限函數 def hardlim(data): if data < 0: a = 0 else: a = 1 print("fun:hardlim,result:%f"%a) #對稱硬極限函數 def hardlims(data): if data < 0: a = -1 e
繼續訪問
兩個重要極限定理推導
兩個重要極限定理: limx→0sinxx=1(1) \lim_{x \rightarrow 0} \frac{\sin x}{x} = 1 \tag{1} x→0limxsinx=1(1) 和 limx→∞(1+1x)x=e(2) \lim_{x \rightarrow \infty} (1 + \frac{1}{x})^x = e \tag{2} x→∞lim(1+x1)x=e(2) 引理(夾逼定理) 定義一: 如果數列 {Xn}\lbrace X_n \rbrace{Xn},{Yn}
繼續訪問
【原創】R語言對二分連續變數進行邏輯回歸數據分析報告論文(代碼...
【原創】R語言對二分連續變數進行邏輯回歸數據分析報告論文(代碼數據).docx資源推薦 資源評論 鯨魚演算法(WOA)優化變分模態分解(VMD)參數python 5星 · 資源好評率100% 1.python程序 2.有數據集,可直接運行 matlab批量讀取excel表格數據...
機器學習--邏輯回歸_科技論文精講的博客
機器學習-邏輯回歸分析(Python) 02-24 回歸和分類方法是機器學習中經常用到的方法區分回歸問題和分類問題:回歸問題:輸入變數和輸出變數均為連續變數的問題;分類問題:輸出變數為有限個離散變數的問題。因此分類及回歸分別為研究這兩類問題...
常見函數極限
limx→0sinx=1\lim_{x\to 0}\frac{\sin}{x}=1x→0limxsin=1 limx→∞(1+1x)x=e\lim_{x\to \infty}(1+\frac{1}{x})^x=ex→∞lim(1+x1)x=e limα→0(1+α)1α=e\lim_{\alpha\to 0}(1+\alpha)^\frac{1}{\alpha}=eα→0lim(...
繼續訪問
邏輯回歸原理及代碼實現
公式自變數取值為任意實數,值域[0,1]解釋將任意的輸入映射到了[0,1]區間,我們在線性回歸中可以得到一個預測值,再將該值映射到Sigmoid函數中這樣就完成了由值到概率的轉換,也就是分類任務預測函數其中,分類任務整合解釋對於二分類任務(0,1),整合後y取0隻保留,y取1隻保留似然函數對數似然此時應用梯度上升求最大值,引入轉換為梯度下降任務求導過程參數更新多分類的softmax。............
繼續訪問
python手寫數字識別論文_Python利用邏輯回歸模型解決MNIST手寫數字識別問...
本文實例講述了Python利用邏輯回歸模型解決MNIST手寫數字識別問題。分享給大家供大家參考,具體如下: 1、MNIST手寫識別問題 MNIST手寫數字識別問題:輸入黑白的手寫阿拉伯數字,通過機器學習判斷輸入的是幾。可以通過TensorFLow下載MNIST手寫數據集,...
邏輯回歸問題整理_暮雨林鍾的博客
邏輯回歸問題整理 之前只是簡單的接觸過邏輯回歸,今天針對於最近看論文的疑惑做一個整理; 邏輯回歸與極大似然的關系: 邏輯回歸的提出主要是在線性問題下為分類問題而提出的; 簡單來說,針對於一個二分類問題,我們需要將線性函數映射為一...
機器學習演算法-邏輯回歸(一):基於邏輯回歸的分類預測(代碼附詳細注釋)
1 邏輯回歸的介紹和應用 1.1 邏輯回歸的介紹 邏輯回歸(Logistic regression,簡稱LR)雖然其中帶有"回歸"兩個字,但邏輯回歸其實是一個分類模型,並且廣泛應用於各個領域之中。雖然現在深度學習相對於這些傳統方法更為火熱,但實則這些傳統方法由於其獨特的優勢依然廣泛應用於各個領域中。 而對於邏輯回歸而且,最為突出的兩點就是其模型簡單和模型的可解釋性強。 邏輯回歸模型的優劣勢: 優點:實現簡單,易於理解和實現;計算代價不高,速度很快,存儲資源低; 缺點:容易欠擬合,分類精度可能不高 1.2
繼續訪問
邏輯回歸:原理+代碼
(作者:陳玓玏) 邏輯回歸算是傳統機器學習中最簡單的模型了,它的基礎是線性回歸,為了弄明白邏輯回歸,我們先來看線性回歸。 一、線性回歸 假設共N個樣本,每個樣本有M個特徵,這樣就產生了一個N*M大小的樣本矩陣。令矩陣為X,第i個樣本為Xi,第i個樣本的第j個特徵為Xij。令樣本的觀測向量為Y,第i個樣本的觀測值為Yi,那麼就會有以下公式: (X+[1]N*1)*W = Y 也就是說,...
繼續訪問
淺談邏輯回歸_jzhx107的博客
LMSE回歸的回歸平面受左上角兩個綠色樣本的影響而向上傾斜。 支持向量機的分離平面只由兩個支持向量決定。 另外我們看到,在本例中邏輯回歸和支持向量機得到的分離平面很接近,但是支持向量機的推導和訓練過程要比邏輯回歸復雜很多。所以加州...
論文研究-基於HBase的多分類邏輯回歸演算法研究.pdf_多分類邏輯回歸...
論文研究-基於HBase的多分類邏輯回歸演算法研究.pdf,為解決在大數據環境下,用於訓練多分類邏輯回歸模型的數據集可能會超過執行計算的客戶端內存的問題,提出了塊批量梯度下降演算法,用於計算回歸模型的系數。將訓練數據集存入HBase後,通過設置表...
【機器學習】 邏輯回歸原理及代碼
大家好,我是機器俠~1 Linear Regression(線性回歸)在了解邏輯回歸之前,我們先簡單介紹一下Linear Regression(線性回歸)。線性回歸是利用連續性的變數來預估實際數值(比如房價),通過找出自變數與因變數之間的線性關系,確定一條最佳直線,稱之為回歸線。並且,我們將這個回歸關系表示為2 Logistic Regression(...
繼續訪問
最新發布 【大道至簡】機器學習演算法之邏輯回歸(Logistic Regression)詳解(附代碼)---非常通俗易懂!
邏輯回歸詳細推導,附github代碼
繼續訪問
第二重要極限公式推導過程_機器學習——一文詳解邏輯回歸「附詳細推導和代碼」...
在之前的文章當中,我們推導了線性回歸的公式,線性回歸本質是線性函數,模型的原理不難,核心是求解模型參數的過程。通過對線性回歸的推導和學習,我們基本上了解了機器學習模型學習的過程,這是機器學習的精髓,要比單個模型的原理重要得多。新關注和有所遺忘的同學可以點擊下方的鏈接回顧一下之前的線性回歸和梯度下降的內容。講透機器學習中的梯度下降機器學習基礎——線性回歸公式推導(附代碼和演示圖)回歸與分類在機器學習...
繼續訪問
機器學習之邏輯回歸,代碼實現(附帶sklearn代碼,小白版)
用小白的角度解釋邏輯回歸,並且附帶代碼實現
繼續訪問
熱門推薦 兩個重要極限及相關推導極限
兩個重要極限: ①limx→0sinxx=1\lim_{x \to 0}\frac{\sin x}{x} = 1 ②limx→∞(1+1x)x=e\lim_{x \to \infty}(1 + \frac{1}{x})^x = e 關於重要極限①的推導極限可以參考: 無窮小的等價代換 由重要極限②可以推導出: limx→∞(1+1x)x⇒limx→0(1+x)1x=e\lim_{x \t
繼續訪問
(一)機器學習——邏輯回歸(附完整代碼和數據集)
什麼是邏輯回歸? 首先邏輯回歸是一種分類演算法。邏輯回歸演算法和預測類演算法中的線性回歸演算法有一定的類似性。簡單來講,邏輯回歸,就是通過回歸的方法來進行分類,而不是進行預測,比如預測房價等。 邏輯回歸解決的問題 先看下面的圖,已知平面上分布的紅點和藍點,邏輯回歸演算法就是解決怎麼根據一系列點,計算出一條直線(或者是平面)將平面上的點分成兩類,一般的解決方法就是建立一個數學模型,然後通過迭代優化得到一個最優...
繼續訪問
機器學習:邏輯回歸及其代碼實現
一、邏輯回歸(logistic regression)介紹 邏輯回歸,又稱為對數幾率回歸,雖然它名字裡面有回歸二字,但是它並不像線性回歸一樣用來預測數值型數據,相反,它一般用來解決分類任務,特別是二分類任務。 本質上,它是一個percetron再加上一個sigmoid激活函數,如下所示: 然後邏輯回歸採用的損失函數是交叉熵: ...
繼續訪問
邏輯回歸,原理及代碼實現
Ⅰ.邏輯回歸概述: 邏輯回歸(LR,Logistic Regression)是傳統機器學習中的一種分類模型,它屬於一種在線學習演算法,可以利用新的數據對各個特徵的權重進行更新,而不需要重新利用歷史數據訓練。因此在實際開發中,一般針對該類任務首先都會構建一個基於LR的模型作為Baseline Model,實現快速上線,然後在此基礎上結合後續業務與數據的演進,不斷的優化改進。 由於LR演算法具有簡單、高效、易於並行且在線學習(動態擴展)的特點,在工業界具有非常廣泛的應用。例如:評論信息正負情感分析(二分類)、用戶點
繼續訪問
邏輯(logistic)回歸演算法原理及兩種代碼實現
①簡單介紹了邏輯回歸的原理 ②介紹了兩種代碼實現方法
繼續訪問
由兩個重要極限推導常見等價無窮小以及常見導數公式
兩個重要極限 第一個重要極限 limx→0xsinx=1 \lim_{x\rightarrow0}\frac{x}{sinx}=1x→0limsinxx=1 第二個重要極限 limx→+∞(1+1x)x=e \lim_{x\rightarrow+\infty}(1+\frac{1}{x})^x=ex→+∞lim(1+x1)x=e 等價無窮小 1. ln(1+x)~x limx→0ln(1+x)x=limx→0ln(1+x)1x=ln(limx→+∞(1+1x)x)=lne=1 \lim_{
繼續訪問
機器學習——邏輯回歸演算法代碼實現
機器學習——邏輯回歸演算法代碼實現前言一、邏輯回歸是什麼?二、代碼實現1.數據說明2.邏輯回歸代碼 前言 最近准備開始學習機器學習,後續將對學習內容進行記錄,該文主要針對邏輯回歸代碼實現進行記錄!同時也准備建一個群,大家可以進行交流,微信:ffengjixuchui 一、邏輯回歸是什麼? 邏輯回歸概念篇可看博主之前的文章,傳送門 二、代碼實現 1.數據說明 你想根據兩次考試的結果來決定每個申請人的錄取機會。你有以前的申請人的歷史數據,你可以用它作為邏輯回歸的訓練集。