這周讀了很多關(guān)于分形和冪律分布的文章,算是打開了新世界。很多我們不自知的行為,冥冥之中已經(jīng)被數(shù)學(xué)決定。
1.股價(jià)
用分形模擬股價(jià)波動(dòng)
學(xué)金融時(shí)最大的一個(gè)困惑是,股價(jià)每時(shí)每刻的波動(dòng),背后到底是什么在起作用?
在我看來,股票市場(chǎng)是一個(gè)天然的行為實(shí)驗(yàn)平臺(tái)。這個(gè)平臺(tái)由人們自己創(chuàng)造,又吸引成千上萬的人參與其中。世界各地的人們博弈互動(dòng),最終反映在一根上上下下的曲線上。我以為,這跟曲線一定可以體現(xiàn)出一種群體行為背后的規(guī)律。這種規(guī)律是不以某個(gè)人的意志為轉(zhuǎn)移的,并且冥冥之中早已被決定的。
傳統(tǒng)的教科書會(huì)講股價(jià)的走勢(shì)是隨機(jī)游走的。但是,最近在閱讀一篇1999年的老文章A Multifractal Walk down Wall Street時(shí),發(fā)現(xiàn)分形理論的創(chuàng)始人,美國(guó)數(shù)學(xué)家Mandelbrot用分形理論更好的模擬了股票市場(chǎng),解答了我的困惑。
什么是分形
分形是一種幾何圖案。這種幾何圖案的特點(diǎn)是,在放大后者縮小以后都會(huì)呈現(xiàn)同樣的樣式。這種特點(diǎn)被叫做自相似(self-similarity)。Mandelbrot認(rèn)為,股票和貨幣的波動(dòng)都是類似的。當(dāng)我們打開一張股價(jià)走勢(shì)圖并把它放大或縮小,我們會(huì)發(fā)現(xiàn)同樣的模式出現(xiàn)。
該圖是一個(gè)計(jì)算機(jī)產(chǎn)生的分形模擬??梢钥吹剑瑥牡谝粡垐D到第四張圖,圖形在縮小或者放大的過程中,呈現(xiàn)出同樣的模式。這種模式就可以模擬股價(jià)走勢(shì)。
你能看出這八張圖哪一張時(shí)真的股價(jià)波動(dòng),哪一張是作者做的分形模擬嗎?
第一行:顯然走勢(shì)太過單調(diào)。實(shí)際上這是根據(jù)著名的路易·巴舍利耶(Louis Bachelier)提出的服從鐘形曲線的隨機(jī)游走產(chǎn)生的圖像;
第二行的圖更加的不真實(shí),因?yàn)榇蠖鄶?shù)時(shí)候相對(duì)平緩,少數(shù)時(shí)候卻有非常高的突出;
第三行的圖綜合了圖一圖二的優(yōu)點(diǎn)和缺點(diǎn),但是缺少一些股價(jià)波動(dòng)的突出點(diǎn)。實(shí)際上,圖二圖三是Mandelbrot在早些時(shí)候?qū)τ陔S機(jī)游走模型做出的改進(jìn)。
但是接下來從第四幅到第八幅圖像就不是那么好判斷了。其中5是IBM的股價(jià),6是美元與德國(guó)馬克的匯率。4.7.8是作者做的多重分形模擬??梢钥闯鲞@幾張圖的差別和模式已經(jīng)非常接近了。
成千上萬的交易者做出不同決策,最終影響到一條線的上下波動(dòng)。這條線卻如此服從數(shù)學(xué)的分形的模型。
2.詞頻
莎士比亞作品服從冪律分布
莎士比亞怎么也不會(huì)想到,自己所有作品中的用詞詞頻,竟然精準(zhǔn)的服從冪律分布。這就是著名的Zipf定律(Zipf's law)。
美國(guó)哈佛大學(xué)語言學(xué)家齊夫(G.Zipf)在1935年對(duì)莎士比亞的所有作品的用詞詞頻做過一次統(tǒng)計(jì)。這里采用卓克老師在課程里提到的數(shù)據(jù)。
莎士比亞在作品中一共用了10000個(gè)單詞。如果按照詞頻統(tǒng)計(jì),the出現(xiàn)了318次,and出現(xiàn)了294次,I出現(xiàn)了235次,to出現(xiàn)了215次,of出現(xiàn)了195次等等,一直排到最后一名。如果計(jì)算詞頻和排位的幾次冪的比值,就會(huì)發(fā)現(xiàn)他們?nèi)肯嗟?。并且可以求得?/span>=1.132。
也就是說,排序?yàn)?/span>r的單詞出現(xiàn)次數(shù)f(r)反比于r的幾次冪(f(r)~r^β)。
卓克老師的課里還提到,如果考察莎士比亞的中文譯本,會(huì)發(fā)現(xiàn)如果統(tǒng)計(jì)字頻,那么冪律分布會(huì)消失,如果統(tǒng)計(jì)詞頻,冪律分布又會(huì)顯現(xiàn)。(暫時(shí)還沒找到這篇論文)
還有人對(duì)中國(guó)的文學(xué)作品進(jìn)行了統(tǒng)計(jì)。從甲骨文,青銅器銘文,到唐詩宋詞,再到《紅樓夢(mèng)》《毛選》《鄧選》甚至莫言小說,《亮劍》等,發(fā)現(xiàn)秦朝以前字頻的冪律分布存在,越到近代詞頻的冪律分布越明顯。
文學(xué)作品中呈現(xiàn)冪律分布的原因主要是語法。英語中,由于語法要求,定冠詞,介詞,代詞應(yīng)該在固定的位置出現(xiàn)。但對(duì)于中文來說,秦朝以前單字就可以代表一個(gè)意群。但是越到近代,詞語之間越互相綁定。
冪律分布出現(xiàn)最主要的原因是,樣本之間不獨(dú)立。
3. 28法則
28法則也是一種冪律分布
符合冪律分布的事件,絕大多數(shù)事件規(guī)模極小,只有少數(shù)事件規(guī)模極大。另一種更著名的描述方法是二八定律。
莎士比亞作品的詞頻統(tǒng)計(jì)還可以得出另一個(gè)結(jié)論——百分之二十的詞占用了百分之八十的篇幅。這也就是為什么學(xué)習(xí)一門新語言只需要認(rèn)識(shí)兩千詞左右,就基本可以看懂文章內(nèi)容。
冪律分布在詞頻中的定律叫做齊夫定律,在經(jīng)濟(jì)發(fā)展領(lǐng)域則叫做帕累托定律(Pareto’s law)。他發(fā)現(xiàn),如果統(tǒng)計(jì)個(gè)人收入,20%的人瓜分了80%的社會(huì)財(cái)富。
同樣,打開支付寶可以看到我們的本年度理財(cái)收益率。我有時(shí)候竟然可以排到全國(guó)98%,但其實(shí)收益率也并不高??上攵?,支付寶的收益率也可能服從冪律分布,極少數(shù)的人的收益率遠(yuǎn)高于絕大多數(shù)人。
(類似的,Gutenberg 和Richter以及其他研究還發(fā)現(xiàn)了地震等自然災(zāi)害的嚴(yán)重程度和頻次一樣服從冪律分布)
4.城市規(guī)模
一舉一動(dòng),難逃天意
我們看似自發(fā)建立了城市。有的人在這蓋房子,有的人在那開超市,可是冥冥之中,城市的規(guī)模和人口之間的關(guān)系也早以被確定。
萬維鋼老師在講《規(guī)?!?/strong>這本書的時(shí)候提到了城市的標(biāo)度率,即冪律分布的那個(gè)冪指數(shù)。其中,城市的基礎(chǔ)設(shè)施建設(shè)和人口的0.85次方成正比,城市的產(chǎn)出和人口的1.15次方成正比。
另外,地球城市燈光的衛(wèi)星圖和星系圖也驚人的相似。
這是Mandelbrot用分形模擬的一張1/8天空?qǐng)D。燈光的建設(shè)者對(duì)于分形和可能一無所知,但是最終我們不得不服從自然的定律。原因就在于,城市是一個(gè)社交網(wǎng)絡(luò),城市不是獨(dú)立分布的樣本,人與人之間互相影響。
不論是之前說的最優(yōu)停止理論,還是這次說的股票市場(chǎng),詞頻,收入水平,城市規(guī)模,我們自以為自己可以決定的事情,冥冥之中,早已被數(shù)學(xué)定律決定。
總結(jié)一下,
1.股價(jià)的波動(dòng)可以用分形來模擬
2.日常語言的詞頻服從冪律分布,即齊夫定律
3.冪律分布在經(jīng)濟(jì)領(lǐng)域的應(yīng)用是帕累托定律,即二八法則
4.城市的規(guī)模與人口的關(guān)系服從冪律分布
5.冪律分布的成因是樣本之間不獨(dú)立
參考,
Mandelbrot, B.B., 1999. A multifractal walkdown Wall Street. Scientific American, 280(2), pp.70-73.
Mandelbrot, B.B., 1983. The fractal geometry of nature (Vol. 173, p. 51). New York: WH freeman.
Mandelbrot, B., 1967. How long is the coast of Britain? Statistical self-similarity and fractional dimension. science, 156(3775), pp.636-638.
卓克《科學(xué)思維課》冪律揭示生活規(guī)律
萬維鋼精英日課第二季 《為什么城市越大越好》
Wang,D., Li, M., Di, Z., 2005. True reason for Zipf’s law in language. Physica A,pp.358-545.
Zipf,G.K., 2013. Thepsycho-biology of language: An introduction to dynamic philology. Routledge.
https://www.docin.com/p-1549084317.html
聯(lián)系客服