将数据用作菠菜策略的一部分是惯常的做法。然而,尽管某些结果可能看上去很惊人,但是产生这些结果的过程才是关键所在。体育菠菜的数据挖掘有哪些问题?继续阅读,找出答案。
在过去几个月中,我在数量可观的网站、博客和论坛帖子上看到人们声称已经寻获了盈利的菠菜系统:只需回顾性地将一些看似随意的选择标准应用于大量历史结果和投注赔率的数据集。
在本文中,我调查了通过数据挖掘来搜索有利优势的陷阱:对于体育菠菜玩家而言,没有因果性的相关性将带来麻烦。
数据挖掘和捕捞
数据挖掘需要分析大量数据来找出模式和信息。更具体地说,数据捕捞的任务是使用数据挖掘来找出数据中的模式,这些数据具有统计显著性。
我们不能在结果发生之后重新解释原因,因为这会改变事件的因果关系。
体育菠菜的数据挖掘和捕捞都非常容易进行。诸多网站上都能找到大量的足球历史结果和投注赔率,它们可以被用于回顾性搜索以及测试盈利的菠菜系统。
然而,能够解释这些模式为何可能发生的先验假设通常不会被提出,这一点是将数据挖掘用作数据分析工具的主要限制。
没有因果性的相关性
之前我已经讨论过混淆相关性和因果性以及将准确度和效度与精密度混为一谈的陷阱。如果想要得到有效的菠菜系统,让它真正发挥功效,我们首先必须了解让这种菠菜系统成功的原因是什么。
除非你在相关性背后建立了因果性,否则你不会知道哪些因素可能会让你的相关性失败——没有因果性的相关性不过是绣花枕头。
几周前,我的twitter推送上的一些内容吸引了我的注意:如果有人盲目投注在英格兰足球乙级联赛2012/13至2016/17赛季的所有客场取胜上(接近3,000个投注),他能获得的回报让人震惊——收盘赔率的投注回报高达4.3%,市场最佳赔率的投注回报接近10%。
这五个赛季中只有一个赛季见证了收盘赔率上的投注损失,而且损失很小。利润图表如下所示:
从中可以看出市场低估了这个联赛级别上的客队,就是说他们的赔率价格过高。不过这并不是某种短期失误;相反,看起来这是持续性和系统性的错误——菠菜玩家低估了英格兰乙级联赛中客队获胜的可能性,远远超出了菠菜公司利润抽水的界限。但是,我们真的能相信在这里找到的信息有任何因果性吗?
支持平局:听上去真简单
最近我还看到了另一种发布出来的策略,叫做“支持平局”。这种策略声称在回顾性测试2012年至今的足球比赛结果和(李天和)比赛投注赔率时,2,500个投注带来了接近16%的净利润。
盘口选择标准很简单:两队在过去三场比赛中都没有平局;赔率范围应该为3.20至3.56。测试这个利润的统计显著性之后,我们发现这个记录确实超乎寻常。如果我们假设这个模式只是随机的,那么从这些赔率中得到如此惊人利润的几率可能只有百万分之一或者更低。让我们想想为什么选择这些特定的标准范围。为什么不是之前四场、五场或者六场比赛?为什么赔率不是3.07至3.41,或者3.13至3.72?没错,我们几乎可以肯定这些标准不是在挖掘数据之前选择的;它们只是数据挖掘之后被发现曾经产出了富有利润的结果。我们不能在结果发生之后重新解释原因,因为这会改变事件的因果关系。
如果你想为这种策略辩护,你现在也许会说:“百万分之一的机会:这肯定代表它不是随机的,对吗?” 没错,你说的对。但是如果我们测试一百万种策略,然后发现其中一种和这种一样有统计显著性,意义何在?正如Nassim Taleb在《随机致富的傻瓜》一书中讲述的幻想试图在打字机上重现荷马史诗的猴子那样:
“如果只有五只猴子在打字,那么我会对打出《伊利亚特》的那只猴子刮目相看,甚至可能怀疑它是古代诗人的投胎转世。但如果有十亿只到十亿只的平方那么多的猴子,那就没什么了不起了……”
正如Taleb指出的那样,没有太多人会想到数一数所有的猴子,而且如果他们数了猴子,他们中几乎没有人能总结出值得一提的有趣模式。幸存者偏差让我们只注意到了赢家。
为何菠菜玩家需要“数猴子”
如果我们在为了找到盈利模式而捕捞数据之前没有提出先验假设,那么我们应当测试大量的菠菜系统以查看找到统计显著性的频率。正如我在我的twitter推送上对这个讨论的回复,“让我们根据10,000种不同的标准选择盲目投注并产生10,000个样本,然后画出它们的收益分布图,看看会是什么样子”。
好吧,我没能找到10,000个合适大小的盲目投注样本——这需要大量的数据——但是我找到了1,686个样本,每个都包含100个投注或者更多。每个样本代表了对单一足球联赛的单一赛季中的某个特定结果(主胜、平局或者客胜)进行盲目投注的赛季。
我首先移除了利润抽水以计算每种结果的“真实”价格,然后计算了每个样本的理论回报以及它们的T统计量——我喜欢使用T统计量来测量此类回报有多不可能偶然发生。这些在下方的分布图中标出。正的T分数代表盈利的样本,负数代表损失;数字越大,可能性就越低。
熟悉正态分布(钟形曲线)的读者会将这认作是随机性的证据。也就是说,如果一切都只受到了机会影响,那么这些盲目投注样本的表现非常符合我们期望发生的情况。
菠菜玩家可以从数据挖掘和捕捞中学到什么?
足球联赛的赛季利润的分布是随机的,这一点可能在你的意料之外。这绝对不是设计菠菜系统的最复杂深奥的方法。但是这一点具有重要意义:如果我们使用数据捕捞一直到找到有利可图的标准为止,并且以此来着手设计菠菜系统,那么我们就有可能无法为我们找到的东西建立因果解释。
除非我们可以解释利润的产生原因,否则一切可能只是纯粹的无稽之谈。没有因果性的相关性一定会回归到均值。对于体育菠菜玩家而言,这在长远上意味着输钱。
有人可能会辩称,把握住好运气来盈利无可厚非;归根到底,菠菜就是为了要赚钱。不过,当我们这么做的时候,我们不应该欺骗自己——认为自己的成功需要归功于其他因素。
据报道,马来西亚在线扑克和赌鲸维生“保罗”普华近五年前在澳门击败了对他的非法体育菠菜指控。 2014年6月,phua是永利澳门赌场酒店逮捕的近24名个人中的一员,当地政府当时声称这是中...
德国在线体育菠菜品牌我正加紧准备在国内市场重新推出在去年秋天关闭运营之后。 周一有消息称菠菜网站将升级了一本由Kambi集团提供动力的运动本一家在斯德哥尔摩上市的体育菠菜供应商...
尽管美国肯塔基洲有过反菠菜的历史,但是他们新提交的HB175法案,有望将该州的在线扑克和体育菠菜合法化。 肯塔基州境内没有一家赌场,但如果州议员们的行为得以成功的话,那么肯塔基...
爱荷华州的立法者本周非常忙,因为他们分析和辩论了四项不同的法案以体育菠菜合法化为目标。令人惊讶的是,这些法案中没有一项会通过法律程序进行。相反,立法者计划利用他们在几个...
意大利的体育菠菜运营商从2019年开始就走错了路,1月份的菠菜收入同比下降了六分之一。 意大利agenzia della dogane e dei垄断者(ADM)监管机构公布的数据显示,1月份意大利特许体育菠菜收入总...
Powered by 澳门旅游攻略 @2013-2022 RSS地图 HTML地图
网站统计——