第二十二回 赌神索普创造传奇 香农凯利协防有功

返回首页 永远好奇的唐朝 唐书房 2020-05-14 20:20:00 👍赞 (2)
纸质版《巴芒演义》请点击:
当当下单 京东下单
音频版请到喜马拉雅搜索《巴芒演义》
天生学霸
索普出生于1932年8月14日,从小就是传说中那种天才儿童的标准模样。
比如3岁能数到100万;5岁能背诵历史上几十位英国国王的名字、登基和退位的准确时间;
6岁能够进行任意数字的四则混合运算,能口算平方根、立方根,各种心算比旁人按计算器速度还快……
索普从小酷爱各种实验,对木工、电工、制图、无线电等技能具有浓厚的兴趣。
由于家境不好,索普11岁就和巴菲特一样送报挣钱,并依赖这些收入购买各种实验材料。
索普在13岁拿到联邦政府认证的无线电发报员证书,14岁成功自制炸药和强效染料。
高一时索普得知,如果在全国化学竞赛里拿到前三名,可以获得大学奖学金,于是找来化学教材自学。
结果考试时因为不知道需要配备昂贵的专用计算尺,索普在竞赛时间内凭手算完成1000分里的873分题目,得分869,获全美第四,痛失奖学金。
为了挣到读大学的奖学金,索普高二参加过全加州物理竞赛,以931分(领先第二名50多分)获冠军。
高三参加过西屋科学奖大赛,以一篇计算天体轨迹和玻璃棱镜折射率方法的论文,从1.6万名竞争者中脱颖而出,成为40名获奖者之一……
西屋科学奖(West House Science Prize)被称为“美国中学生的诺贝尔奖”,由美国西屋电气服务公司于1942年创建,目的在于发现具有科技创造潜力的青年人。
多项优异表现,让索普有了在加州随心所欲挑选大学的权利。
本来加州理工学院是他最心仪的大学,但是该校的奖学金仅包含学费,索普没钱支付住宿费和生活费。
于是他选择了提供包含学费、生活费和住宿费奖学金的加州大学。
当严谨的学术应用于赌博研究
读书期间,有次同学们聊天聊到轮盘赌的话题。
大家的观点分为两派,一派认为轮盘赌纯粹是随机运动,无法预测;一派认为轮盘赌设备不可能完美,总有物理缺陷导致某些数字出现的概率会更高,从而可以利用这种概率赢钱。
索普对两种观点都持认可态度,他认为如果轮盘赌是完美的,可以利用物理学知识预测小球轨迹赢钱;
如果轮盘赌是不完美的,那会导致某些数字具备微弱的胜率,通过计算这个概率,也可以赢钱。
不过很可惜,索普没钱购买赌场专用的轮盘赌设备来研究,该想法暂时搁置。
直到1956年的一次聚会上,已经拿下物理学硕士学位的索普,偶遇加州理工学院最负盛名的物理学家理查德·费曼。
【注:费曼是1965年诺贝尔物理学奖得主,纳米科技之父,量子计算理论奠基者,美国曼哈顿计划创立成员,美剧《曼哈顿计划》主人公查理的原型】
两人在聊天中也聊到轮盘赌,费曼说目前科学界还没有能够打败轮盘赌的方法。
见全美顶级的物理学家持如此看法,索普隐藏内心的对轮盘赌的兴趣又浮上心头。
因为利用物理学知识计算轮盘里小球的落点需要大量的数学知识,索普为此恶补数学,并顺便于1958年6月拿到数学博士学位。
拿到博士学位后,索普暂时担任加州大学洛杉矶分校数学系临时讲师。
当年冬天,索普携妻子到拉斯维加斯过圣诞节。
之所以选择拉斯维加斯,一者因为索普此前从未参与过赌博,他想亲眼看看轮盘赌的运作;
二者因为当地政府为了吸引更多赌客,已经将当地打造为一个性价比极高的旅游度假区,可以节省费用。
出发前,学校一位教授向索普推荐了一种21点的策略,是四位知名数学家刚刚发表的论文。
这种策略将庄家的优势压低为0.62%,是所有赌博活动中庄家优势最小的一种。
这虽然依然无法确保赢钱,却已经是最接近公平的赌博。索普打算拿10美元去试试。
结局没什么意外的。
依靠一张密密麻麻写满数字的策略卡片,在超人的记忆力和严谨的心算能力帮助下,索普无视干扰、冷静分析,在15分钟时间,成功地——输掉了8.5美元,离开了赌场。
回家后,索普的注意力就从轮盘赌转移了。
因为21点不需要购买什么昂贵的设备,只需要思考和计算就可以了,更适合数学家,尤其是贫穷的数学家做研究。
虽然学界普遍认为战胜赌场的策略是不存在的,但索普经过深刻的思考后,发现一种理论上的可能性。
理论上说,每张牌出现的概率一样,这种情况下赌场拥有0.62%的胜率优势。但随着一张张扑克牌暴露在赌桌上,剩余的牌出现的概率会发生改变。
举个简化的例子,如果发了20张牌,其中出现四张5,那么剩下的牌堆里再出现5的概率就不会是4/32,而是0。
由于玩家掌握是否下注和下注多少的主动权,因此存在一种可能,就是玩家只在剩余扑克会导致自己赢面高于50%时下注,并在赢面大时下较大的注,似乎就有了战胜庄家的可能。
索普写信给在21点上已经有深入研究的那四位数学家。
经过交流和讨论,索普得到了四位数学家数千页的原始实验手稿。
伴随索普继续研究,他发现整套策略要面对庄家10种手牌和玩家55种手牌的组合。
这550种组合下,每副牌有3000多万种变化,全套策略靠人工计算需要大约4亿年。
幸运的是,1959年索普申请到麻省理工学院两年的讲师合同,而麻省理工拥有一台IBM公司1957年4月推出的IBM 704大型计算机,运算速度为每秒4万次。

有了704的帮助,索普终于在1960年夏天完成测试,证实了自己的猜想。

院士助力,赌博研究更上一层楼

他计划向《美国国家科学院院刊》提交论文。但向这份具有学术影响力的杂志投稿,需要一位院士的推荐才行。
于是索普求见麻省理工学院唯一一名国家科学院院士——信息论的创立者、数字计算机和数字电路设计理论的奠基人、伟大的数学家和密码学家、麻省理工终身教授克劳德·香农。
克劳德·香农(1916年4月30日—2001年2月24日)取得的成就,被认为是“自文艺复兴以来无人企及”。
他独立开创了一门重要的新科学:信息论。信息论是计算机、互联网和其他一切数字媒体的理论依据。
简单地说,我们今天能用上电脑、手机,能上网、听音乐、看电影,就依赖于香农建立的二进制数字在电路里的表达方式。
香农的秘书给索普安排了几分钟会面时间,但索普的介绍迅速吸引了香农的注意。
几分钟的会面变成长达数小时的沟通,最终香农同意推荐索普的论文。
不仅如此,香农这个老小孩,后来还和索普一起下功夫研究轮盘赌,一起去赌场实践。
为了提升参与轮盘赌的胜率,香农和索普共同发明了人类最早的数字可穿戴智能设备。
香农对索普最大的帮助,除了作为论文推荐者,还在于帮助索普解决了不同胜率情况下赌注分配的问题。
他给索普介绍了同事凯利的研究成果:凯利公式(也称“凯利准则”)。他们之间的对话大概是这样的。
索普:“香农,我还有一个问题没解决,如何确定每一副牌下注多少,才能既保证最大化地赢钱,又能防止因连续很多次运气不好而赔光所有的筹码呢?”

香农:“这个问题,你去看一篇贝尔实验室约翰·凯利1956年的一篇论文就知道了。”

凯利公式

约翰·凯利(1923—1965年)是物理学博士。他和香农同在著名的贝尔实验室任职。
他那篇论文题目原本叫作《信息理论与赌博》,1956年发表,发表时考虑公众影响改名为《信息率的一种新解释》。
公式起源于凯利对信息噪音的研究,同属于香农的信息论理论范畴。
具体理论深奥,与咱们投资领域无关。老唐举个简单的例子来帮助理解信息噪音。
信息的传递是有噪音的,比如你收到一条信息,内容是“索普没有偷你的钱”。
这句话要传达的真实信息,可能是以下任何一种:
①索普没有偷你的“钱”——他偷的是你的手表。
②索普没有偷“你”的钱——他偷的是老唐的钱。
③索普没有“偷”你的钱——他只是拿走了属于他的那部分。
④索普“没有”偷你的钱——所以你的钱还在原处。
⑤“索普”没有偷你的钱——是其他人偷的。
……
凯利由此联想到一个数学命题:假设在赌场、赛马场或者股市,有个内线经常给你传递内幕消息。
但一者由于内幕消息不能保证100%正确,二者在消息传递过程中或许会因噪音发生误解(就像巴鲁克那位买入联合煤气的美女亲戚),

那么,赌徒收到内幕消息后,应该如何下注,才能既保证最大化地赢钱,又能防止因连续多次运气不好而输光赌本呢?

在香农教授长途电话噪音问题的研究基础上,凯利最终推导出著名的凯利公式。

公式为:f=(bp-q)/b。
其中,f就是需要计算的最优下注比例,b为赔率,p为胜率,q为败率=1-p。
在这个公式指导下,一个胜率51%,赔率为1∶1的赌局,每次下注比例为(1×51%-49%)/1=2%。
举个简化的错误定价游戏。
一个公平的抛硬币游戏,正反面出现的概率均为50%,即p=50%,q=1-p=50%。
如果此时有个赌局,开出的赔率为2∶1,即正面朝上你赢2元(含本金拿回3元),反面朝上你输1元,b=2。
很显然,参与这个游戏具备显著的胜率优势,但是赌徒每次应该拿多少钱下注呢?
凯利公式的答案是每次拿出全部资金的25%下注,可以在保证永远不会出局的前提下,获得最大化盈利。
计算过程:f=(bp-q)/b=(2×50%-50%)/2=25%。
索普的研究成果,解决了如何取得相对于庄家的胜率优势,而凯利公式则解决了在不同优势胜率下的最优下注比例问题。
通过凯利公式我们可以发现,有些赌局一分钱都不应该投。
比如b≤0的,公式无法计算。什么是b≤0呢?简单一点说,就是正面他赢,反面你输的游戏。
赌桌上不会有这种游戏,但证券市场很常见,而且参与者众。
再比如同样是抛硬币,胜率还是50%,如果赌局开的赔率是0.9∶1,即正面朝上拿回1.9元,反面朝上输1元。
根据凯利公式计算结果,下注比例f=(0.9×50%-50%)÷0.9×100%=-5.56%,f小于零,不参与。
相反,如果胜率100%的游戏,赔率只要大于零,无论多小,都应该下注所有资金。
因为f=(b×100%-0)÷b×100%=100%。
理论结合实践:战绩不俗成“赌神”
索普就有个经典的、下注所有资金的知名案例,该案例创造了纽约交易所有史以来(截至1981年)最大单笔成交纪录。
有趣的是,该案例的投资手法,和格雷厄姆套利G公司一模一样。
1981年美国政府认定AT&T公司形成垄断,公司被要求将下属7个子公司分拆出去。
AT&T公司股东将获得对应比例的7家下属子公司的股票,以及一家“新AT&T公司”股票。
在分拆实施过程中,新老AT&T以及下属7家子公司的股票均在市场有交易。
索普和年轻的格雷厄姆一样,发现老公司股价低于对应的8家新公司股价之和。价差很小,除去交易成本后利润微薄。
当时索普管理的普林斯顿-新港公司资金总额约6000万美元。
鉴于这场交易获利确定性为100%,索普借入3.3亿美元,买进老AT&T公司股票500万股,同时等量卖空8家新公司股票。
分拆后的新股到账,归还卖空股票,差额为净利润。
索普支付80万美元的利息之后,净赚160万美元。
获利概率100%,按照凯利公式应该押上所有的钱。
这种案例早在这笔“有史以来规模最大”的投资引起媒体注意之前,索普其实已经演练过很多回了。
比如1974年,他就做过一笔更加精彩的套利,只是那时资金还比较少,没有1981年这笔动人心魄罢了。
当时,美国汽车公司(AMC)的可转债在市场流通,债券面值1000美元,票面利率是5%,每张可转债可以随时申请转换为100股公司股票,到期日是1988年。
在1973年爆发的全球性股灾后,AMC股价一路下跌到6美元,此时可转债市价跟随下跌至600美元。
索普发现了这个荒谬的市场定价,立刻押上全部资金并使用了杠杆。
他购买AMC可转债,并抛空等量的AMC股票,即每买入一张面值1000元、市价600元的可转债,对应抛空100股股票。
这是一个100%确定获利的交易。
由于持有一张可转债,可以享受面值5%的年利息,对于花600元买下的索普而言,年回报率是50÷600×100%=8.33%。
同时,只要公司不破产,最长持有到1988年,还能确保收回额外的400美元差额。
由于债券随时可以申请转换成100股股票,所以一张可转债很明显比100股股票更有价值。
索普买入可转债并卖空股票后,只需等市场发现这一点,导致债券价格涨幅大于股价涨幅时,卖出债券同时平仓股票空单,即可兑现利润。
如果这家公司最终破产,债券股票双双下跌呢?索普会赚得更多。
因为公司一旦破产清算,拍卖资产的收入将优先分配给债券持有者。
AMC股票将变得一文不值,而债券持有者除了获得持有期间的利息,还可以获得清算收入。
对于持有债券同时卖空股票的人,破产带来的获利空间更大。
即便是最糟糕的情况:价格原地不动,或债券与股票价格比始终保持1∶1,索普仍然能够获得可观的收益。
600美元买入可转债,年收入50美元利息,回报率8.33%。索普以8%的利率借钱购买债券,年回报率0.33%。
同时,索普可以将卖空AMC股票收到的现金,以6%的利率出借。
这样,即使最糟糕的情况出现,索普每年仍能保证赚到6.33%——这还是由于条件所限,索普出借资金利率低于借入资金利率的情况下。
经过索普几本畅销书的科普,加上索普基金的辉煌战绩,今天凯利公式已经是赌博界和投资圈,尤其是量化投资领域必不可少的风控工具。
然而,凯利公式的使用其实存在巨大的认知风险。
不仅以保罗·萨缪尔森及其弟子默顿为代表的主流经济学家,写过大量论文驳斥凯利公式的有效性。
就连有效市场理论的反对者,推荐凯利公式给索普的香农教授,在处理自己的投资时,也没有采用凯利公式操作。
这是为什么呢?

声明:该文章系转载,文章版权归原作者及原出处所有,内容为作者个人观点, 登载该文章目的为更广泛的传递市场信息,并不代表本站赞同其观点和对其真实性负责,本站只提供参考并不构成任何投资及应用建议,并不用于任何商业目的,我们已经尽可能的对作者和来源进行了通告,但是能力有限或疏忽,造成漏登,请及时联系我们 zhicx#qq.com ,我们将根据著作权人的要求,立即更正或者删除有关内容。