【公式管理】
侠客

发帖: 118
威望: 119 点
金钱: 1180 RMB
贡献值: 0 点
注册: 2010-06-14
|
#1
发表于 2010-06-14 19:00
短消息
引用
|
┫转贴=特围统计教程,特围跟风杂谈┣
┫转贴=特围统计教程,特围跟风杂谈┣ ___________________________________________________________________________
1>>>〖转贴〗〖理論與實踐〗特围统计教程.
六合是个随机的东东,一切统计理论都是二重性,看起来理由充足,却也存在一击即破的致命缺点 正如一个鳖脚老师在台上讲课,台下学生在起哄,理还乱 把统计的经验整理出来,让更多同道少走弯路,是早就有的想法, 但上面说的矛盾却一直因扰着,很难一步一步摆开来写, 说是教程,不如称为杂谈更合适
未切入正题前先泼冷水,说些不中听的
一:统计是一种很平常甚至很差的方法 统计只是一种出码或杀码的方法,并没什么神奇之处,看码报看电视看日历牌数星星猜特都比统计精准得多。 网上到处都能看到什么无错呀今年错一之类的厉害高手,想在统计中找个杀10码10错一都罕见,见得最多是某某突然研究出个新方法,称10中9.9不是问题,最后这种高手都是几期后消失无影无踪到天堂发财了。除了在柜底翻出来唬人的记录,网上这么多人实际发表,没几个统计可以值得使用,统计就算不是垃圾也攀不上高级,和大部分人乱统几期就自称数理派满口概率一副高手自居的身份极不相称。
二:统计是效率最低的方法 所有方法中,最费时就是统计,要是把材料收集处理统计综合全包,还有对方法验证。一期花10多个小时的不在少数。花时间越多,有时是为了求个心理上的安慰,下注时用的结果不一定是最稳的,却往往是最费时的。所以说统计是效率最低的取码方法。
三:中率无用论 几乎99.98的人都在用材料命中率估算来进行统计,每个人都有自己一套看起来很过关的理论来支持统计,事实上一千种方法,也只能归类为正杀,反杀和正反综合三种,论坛材料是各个位置都均匀出特的,用固定杀就是在等死,而且综合越多越是接近数据直统结果,淹没了分组挑杀的优点。用简单统计还是复杂综合一直是困绕着统计者的矛盾。所以说命中概率统计做得越深,结果越差,导致统计者方法不断变换,在命中率的怪圈里找方法呀验算呀,花时间又烧钱还找苦恼。
说完坏话,转入正题,还得以命中率为基础来做统计的,嘿嘿
一:认识特围材料的特性 材料分析是统计的基础,不熟悉材料特征,一切统计都是空谈,甚至会与统计前的设想相反。
1,出特范围
◆ 高中率盲区 统计前,几乎所有的人都要去查找和计算所选材料的中率,并以此为依据对目标范围进行统计 而98%的人都会不自觉地把目光停留在记录特别好的材料上,或者因发表者删差留好的面子原因,和自身喜好厌差而忽略对差料的分析甚至淡忘,心理上就产生一种论坛材料偏好的印象。这个盲点会导致统计者盲目乐观和统计方向失误。
◆ 平均中率计算 平均中率是统计的一个指导系数,但这个简单的系数却没有几个人去正确理解。 很多人都是去看那些高手的记录达到多高,凭记录来做未来中率判断,这种虚高的中率,会害死自己。
正确而又最简单计算平均中率是:平均杀码数/49码,如35码围,中率是35/49=71.4%,平均杀14码的出错率是14/49=28.6%. 只要有一定数量的围(如100个以上)和足够长的周期(如30-40期), 把出错次数除以总发表次数,得出的结果和用平均码数/49码的值,误差不会超过2%。篇幅有限这儿就不详细计算了,有对此计算怀疑或兴趣的朋友可以随便找一个特围区的加星榜计算一下,加星榜是实际发表的记录,用来计算是最准确的了。 计算方法可用TXT文档替换,如用1替换★,0替换☆,会显示多少个被替换,再计算一下就行了。
平均中率的值,用在单个围的判断也是有用的,固定方法计算的围,长期成绩会趋向平均,如一个35码围,前面20期错2成绩达90%,在未来很难保持这么高中率的,正常是出错增大,下个20期会错4以上,向35/49=71.4%靠拢而不是远离,同样,一个10错5的围,下一个10期还错6,就是奇观了。把成绩好的围组合同杀的来杀码,受伤的例子很多的。
◆ 波动范围和统计目标范围圈定 数据量足够大,可以求得平衡,但并不是期期开中心次那么理想,甚至中心次附近的小范围所占的比例也不高。 特围数据是动态平衡,跟踪数据直统会发现,号码集中在中心次+-10%,而出特更为集中在中心次+-5%,引用二个时间段二种不同方式来说明
从开次数看出特波动范围
资料时间:2004年099-128期 资料来源:网上收集100围(共30期)
17次|116 19次|103,113,120 20次|110, ────────────────── 21次|100,108,124, 22次| 23次|115,123, 24次| 25次|099,117, 26次| 27次|101,--------------------移动中心 28次|105,111,114,122,127,----中心 29次|119, 30次| 31次|102,118,121, 32次|112, ────────────────── 33次|104,125, 34次|106, 35次| 36次| 37次| 38次|128, 39次| 40次| 41次| 42次|107, 43次| 44次| 45次|109, 56次|126
这是2004年的资料保存,固定100个围,用来分析杀次较为清楚, 从表中看出,出特集中在21-32次,共18期,占60%,因为100围是在网上有选择收集,平均中率相对高一点, 用固定中心显然不合适,因而小小调整以27次为移动中心,出特范围为+5-6,统计时以这个范围为定量标准,结果较为稳定。
从顺数取码看出特波动范围
资料时间:2006年037-063期 资料来源:震东特围区(共26期,缺056期数据)
开第01-07码:037,041,046,049, 开第08-14码:060,
开第15-21码:040,057, 开第22-28码:038,042,050,051,053,058, 开第29-35码:043,045,047,061,063,
开第36-42码:039,048,054,062, 开第43-49码:044,052,055,059,
震东发表的人数较多,且号码稳定在杀14-19码,是一版良好的统计数据,上面是自037期并区后的直统跟踪 从表中看,开第15-35码的次数最多,共13期,占总体50%,号码数量比例为21/49=42.85%,可认为这个区域是最佳范围。
二表综合分析,会发现出特位置很均匀,各个位置都会开出,且比例相当,只是不同时期小有变化, 事实上这是大规律,不论是以网上某个特围区的局部数据,或是高中率为标准选择收集,或是以发表时间早的所谓原创料收集,在时间跨度超过30期后,都显现均匀分布。
从统计角度来看,这二个表会对统计者的信心打击很大,目前99%的人都在沿用较为直观的命中概率统计,并以正杀为主。 中率统计有明显的缺陷,一是手段单一,不论多复杂巧妙的理论,在转化成结果后,都只能归为正杀,反杀和正反综合三大类, 二是取杀位置固定,这个拿数据直统和自己统计后的统计表对比就看得出了,基本是同杀某个位置的大多数号码。说得不好听就是在等死,一种杀法的理论是每期有1/3机会出错。 比如震东37-63期的材料,假设正杀取杀15码,在26期里会错8期,相当平均10错3,杀10码也会26错4,而反杀10码也会26错4,哪儿都撞鬼。 也是这个原因,网上想找个10错1的杀10-15码非常难,而那些一想出个看似很稳的方法就号称十中八九的高手,在用心跟踪几十期的直统规律,对比自己统计和直统位置,不知有何感想。
不过中率统计被用得最为广泛,是有其优势的,方法直观易被接受,用的人多,开发得最为系统,论坛材料统计有个趋势,由新哥到老猫,发表结果会由杀码转换到范围出码,原因一是水平提高,能从单一杀码进步到稳定出码,二是中率统计缺陷迫使统计由稳杀向博对转移。
◆ 论坛材料的波动周期特性 论坛材料的波动周期,是在大数据长期跟踪才会发现的,网上对此有研究的估计不超过5人,灵活运用到统计规律指导就不用说了 波动规律由于要超长时间跟踪才能得到表格形式的资料,做这个太费时,就不列出来了,个人经验是25-30期为一个周期,一个周期里包括二种波形,一是稳定期,出特稳定在中心次附近,持续时间为10-15期,这是统计的黄金时期, 二是大幅波动,持续时间在8-12期,这个时期的特码是上蹦下跳不规律的,统计者信心打击最大就是这个时候了。二个不同形态的短周期构成一个完整的周期,周而复始。
周期规律在统计中运用得当,能在平衡时赚到最大利润,动荡时警惕投注,或者反利用,大胆追大冷大热。 另一个利用是方法验证,一个优秀的理论转化为统计,一般要经过多期验证,改进,调整取杀位置等工序,最为严密的验证是验40期以上,以1.5-2个周期为底线,灵活的验证是在二个周期中各选几个极端形态来验证。
认清周期特性后,会对网上大对大错现象处之泰然,也会对统计的盲目乐观打上预防针。
2,号码分布
◆ 号码集中和分散特性 一个最明显的现象,就是数据在30行以上直统,几乎都把上期特杀在尽位,其次是前二三期的特,再其次是前面开得多的单项,如某肖连开二期,第三期的特围肯定把这个肖的号码杀得很多。 说明发表的杀码,都有目标杀的,反映大多数人的喜好,只能说数据直统杀最多的10码是大家一致讨厌的,并不符合规律。 在统计中,大家用得最多便是正杀,把正杀得到号称最稳杀的15码和直统后15码对比,会可笑地发现,同杀至少在10码以上,这还算统计吗?不如直接一统把下面的10码杀掉算了,而且后10码是平均10错2左右的,把正杀称为最没有效率的方法也不为过。
而在另一向,大家杀剩的号码,也趋向集中,在中心一带,是杀和出的分岐点,目标分散的表现是号码数量增多,所以论坛收集来的杀码呈现中间大二头尖,而同样数量软件数据是块状。 以数据的目光来看,杀向的码是非理性的,出向的码是相对分散,而中心一带则是最符合规律,以出码为目标统计时,中心是理想的出特范围。
前面100围和震东二个统计表也看得出,震东围正杀是26错8,反杀26错5。100围正杀30错7,反杀30错5。二个不同时期二种不同收集方式,反映出来都是非理性的正杀比相对分散的反杀更稳。反杀少被使用,部分人是错一次恨一世,印象深刻,正杀错得更多却毫无知觉。 为什么经常出特的地方会被认为杀得最稳,最易错的方法却被用得最多?究期原因,就是做统计的人没几个人愿意去看数据直统这个简单明了的方向标,更没几个人去跟踪直统规律。股市最强调是看大盘,大盘是庄家亿万资金争夺的焦点,最终也是为了操控个股的利益。不看大盘炒盘是股盲, 另一原因是没有花时间去了解材料,只凭个人感觉进行统计。这个和出错围统计一样,网上大多数人都认为上期出错,今期再错的机率会更低,基于这个看法,找上期错材料做组合统计的人一批接一批。可是没发现有人对上错围做过量化研究,上期错后,今期再错的机率是多少,是平均百分之几呢? 2004年我曾经在迎客松做过专题研究,29期总结是普通围平均出错率28.37%,上错围平均出错率是32.94%,29期时间跟踪,得出二个苍白的数字,有没有人留意呢?
◆ 局部偏离 用一版20行的杀码来说明,假设特为01,
◆1次 ★01★,03,05,07,08,09,10,21,23,28,40,44,46,49, =14码. ◆1次 ★01★,02,08,11,12,22,31,32,35,38,41,42,44,45,46,47,48,49, =18码. ◆1次 ★01★,06,09,12,14,15,16,24,25,26,29,35,37,39,40,48, =16码. ◆1次 ★01★,03,08,09,12,16,22,24,25,26,27,28,33,35,39,41,44,47,48, =19码. ◆1次 04,05,06,07,09,16,18,20,27,34,36,40,43,44, =14码. ◆1次 05,06,10,17,18,20,22,29,30,34,40,41,42,48, =14码. ◆1次 ★01★,04,11,12,13,19,20,22,27,28,31,40,41,42,49, =15码. ◆1次 08,10,18,20,22,26,30,32,34,35,36,42,44,46, =14码. ◆1次 07,10,11,16,19,24,26,30,33,39,40,43,44,49, =14码. ◆1次 07,10,12,13,18,28,29,30,37,39,40,41,44,49, =14码. ◆1次 05,06,08,10,11,13,23,26,32,34,35,43,44,46, =14码. ◆1次 03,06,09,10,15,16,20,21,22,26,27,30,33,34,36,39,40,45,46, =19码. ◆1次 04,05,14,16,17,24,26,27,30,31,42,44,46,49, =14码. ◆1次 03,07,08,10,18,20,22,32,37,39,40,42,44,45,46, =15码. ◆1次 04,09,10,16,20,22,26,27,28,40,42,44,48,49, =14码. ◆1次 09,10,23,24,29,31,32,34,35,38,42,44,46,49, =14码. ◆1次 03,06,07,10,12,18,21,22,23,24,32,41,43,46,48,49, =16码. ◆1次 02,12,14,18,23,24,26,29,31,34,35,36,38,39,42, =15码. ◆1次 ★01★,08,10,14,24,25,28,35,36,37,38,42,43,44, =14码. ◆1次 02,10,12,14,20,24,26,30,36,38,40,47,48,49, =14码.
直接统计是 ============<总共301码次> ★平均{6.14次}============= ◆2次 15,17,19, =3码' ◆3次 02,13,21,25,33,45,47, =7码 ◆4次 04,11,37, =3码 ◆5次 03,05,14,23,29,31,38,43, =8码 ◆6次 01,06,07,27,28,32,36,41, =8码---01 ◆7次 08,09,16,18,30,34,39,48, =8码 ◆8次 12,20,35, =3码 ◆9次 22,24,46, =3码 ◆10次 26,42,49, =3码 ◆11次 40, =1码 ◆13次 10,44, =2码.
在直统中是20错6,出错率为30%,很正常的范围内,分组统计,却很难避开杀特。
用5行一组杀4-5次的码,理论是80%错才会杀错,这样设置是远远大于平均概率,但在统计中却常常出现几个小组错的,最终结果也错得一塌胡涂。在开奖后检查,谁都看得出是因几个小组出错影响的,除了惊讶,就不去继续寻求深层原因。 一版数据,把特码标出来,会发现分布是由杀特集中,杀特稀疏这样一块块组成,小分组的80%容错,在局部中是经不起考验的。这个情况总结为局部偏离。 统计软件数据的朋友局部偏离感受更深,软件数据的量很大,全部一统,几乎没有超范围的情况,统计中出错,最大的原因就是数据局部偏离造成。 在小量数据中局部偏离常被忽略,在大量数据中却上升为影响统计的最大因素, 以命中概率来统计,稳定程度还得靠数据均匀分布为前提
◆ 连续现象 旋转统计器的出现,扩展了统计思维,旋转是连续分组,数据分布中连续出现多少行有特或无特,在旋转中成了重点。随着数据量的增大,连续N行杀特或缺失,会由偶然变成必然,从而造成统计失误,同时也可把这种情况反利用,化成更稳定的统计 如上列20行杀码中,连续4行杀特和11行空白,二个偏向会把特码杀到天上,不对数据进行预分散处理,统计结果根本无法保证。 连续现象是局部偏离的特殊情况,但这个特殊情况的存在却很普遍,在统计中,考虑了出错平均或最大范围,还得考虑局部偏离的比重和极限,才可减少统计理论设计中和漏洞。
在数据分布中,把不杀特的看成对,杀特的看成错,一版数据就是多个对错组合的千变万化的排列,什么样的排列最易出特,什么样的排列最不可能有特,把这样的理论,用统计方式表达出来,就是数据排列概率统计,排列能无限扩展思维,是比中率统计更高一级的,也是统计发展的方向。
小结 命中率和分布情况,是数据构成的二个部分 而做统计的朋友,多是看到中率,却没留意到特的分布,在统计时考虑不全面,限制了水平的提高。 在统计中,命中概率的方法非常局限,而数据排列却千变万化,把排列概率运用到统计中。思维无限驰骋,统计的优点就发挥得淋漓尽致。 希望认真看了材料特性分析的朋友,能用更全面的角度去了解材料,在统计理论设计时把各个因素都考虑进去,尽量降低无谓的风险,再一个是跳出局限的思维方式,向无限广阔的境界进军。
二:统计目的和方法选择 ◆ 范围出码 ◆ 精准出码 ◆ 稳定杀码
根据材料选用适合的方法 根据方法调理和处理材料
覆盖率决定杀码的稳定程度
三:选择组合统计和纯数据统计 1,选择组合 ◆ 选材小组合的优缺点和注意事项 ◆ 选材分组统计重在选材功夫 ◆ 2,纯数据统计 ◆ 数据收集和处理 ◆ 常用方法和多种方法对数据统计综合
四:二次综合硬功修炼 五:验算 六:用统计器提高统计效率和开阔思维 七:向更严密的统计思维进军 ◆ 数据排列概率统计 ◆ 模拟统计和逻辑统计
八:统计盲区 ◆ 出错后的稳定性分析 ◆ 大对大错的原因,规律和反利用
=============================================================== ===============================================================
2>>>〖转贴〗〖理論與實踐〗特围跟风杂谈.
跟风是个令人憎恶的词,在一个区新开时,在集体大错时,都有人呼吁提昌原创,反对跟风
跟风是什么?到目前为止未有人对跟风下定义。大家都在心里说:我的围100%原创。别人的则可以怀疑。没有明确定义,这个词就成了一把标尺,用来证明自己清白和出错责任推卸的托辞了。如果让发表的人自由选择,一定是100%都跑到原创区发表,那么跟风的人都跑到哪去了呢?没有跟风吗?不可能吧!
存在就是事实,跟风这件事儿当然不会因几句辩解就消失的。下面举几个例子来证明跟风的存在。
1,我收集的特围全部一统结果中,几乎每期都把上期特杀在尽位,100个特围大概有40-50个杀上期特的,如果把目标同杀看作跟风,发表特围的人大概有40%以上是发表跟风围,哈哈。这是事实,只不过大家对上期特杀尽位已经习惯并形成盲区罢了,难道一年要重开十期八期,杀上期特错了才算跟风吗?
2,记得有一回,震东帮新提几位版主上来,准备振兴特围区大干一场,这期顶置的26个特围全对,于是乎一片欢腾。我却晕了,35码围平均出错率是28%左右,正常出特范围应该是出错22-33%,26个围全对,100%呀,从数据统计角度来看,不是严重超出正常范围了吗?这期有非常严重的跟风问题,顶置的26个高手都有跟风嫌疑,嘿嘿。
3,举一个特例,2005年049-053期分别开08,05,02,01,06,0头连开5期,个人收集的100个特围直统分别开在错25人17码中,错34人40码中,错39人42码中,错40人46码中,错32人39码中。开第一个时正常,后面4期都是出错面积很大。是跟风吗?发表特围的人难道都去跟了杀头的风吗?在网上也没找到哪个代表性的高手连杀了几期0头,如果说是跟风,风源却找不到,大概是大家自己吹出来的。一人一口气就成风了。
4,2005年043,044二期开特为49,10,也是大错,分别开在错35人44码中,错40人46码中,奇怪,前面5期特分别为48,45,13,14,06,这几个号码重叠不大,为什么这二期突然错得这么厉害呢?看看落珠情况 2005年04月14日044期:45-12-17-47-43-33 特码:10(鼠) 2005年04月12日043期:22-(10)-36-23-28-09 特码:49(鸡) 2005年04月10日042期:14-03-40-(49)-46-05 特码:06(龙) 原来都在前一期的平码开出来了,算围的人或许没留意到,是软件悄悄帮你杀了的。性质上和杀上期特差不多,如果归类到跟风,这个跟风的问题可大了,一是所有用软件算围的人都是用以前开出的平特为依据计算的,细分也不过落球序和大小序二种,这是跟风的风源。二是好用的软件不外几个,查找出来的好公式会出现雷同或相近,直接反映到最终计算的特围上,有相近就难避免了。要消灭这类跟风,除非大家每人开发一个软件,去街上看车牌取数字来算码啦。
所以把集体大面积出错,开在同杀次数多的位置归结为跟风是不够科学的。关于原创和跟风,普遍认同的分类方法是:独立算出来的围是原创,参考别人材料的围为跟风。而参考材料也分几种,一是参考肖尾头行波等单项综合出来的围为一个全新的特围,二是参考特围综合出来的特围,即使是参考特围综合出来的特围,也因参考对象,数量和综合方法差异,算出来的特围也是网上独一无二的,既无雷同,能否划到原创一类中去呢?这样辩解,当然不能服人,不过这类围的数量极少,对总量影响也非常之小。真正有罪的,就是材料的大部分或全部取自同一围区,并在大面积出错时也错的特围。想找一个这样的围也不易呀。
不管所谓的跟风围的数量是那么的少,对整体影响是那么的渺小,但使用特围统计的人对此还是心存恐惧的,从大多数人选择材料时喜欢找早发表的就可以看得出。由于无法一一了解各个围的算法,越早发表的围便成了跟风嫌疑最少的围,几乎成了标准。
这种原创特围好吗?
我本人也有把网上发表较早的100个特围做成一版数据,在迎客松公开发表几十期了,但这版数据在稳定性并不比全版收集的好。一个用特围统计三年多的朋友也反对只用开完就发表的围来统计,说是集体大对大错很厉害,无法捕捉出特范围。原创围不好吗?为什么会出现这种和直觉相反的现象呢,本人对算围方法没有多少经验,就没办法深入研究了,不过有一点可以猜到,一掉下第七码就能算出来的围,算法一般很简单的,越简单就越易出现雷同。
举二个实例,如年初,蝴蝶重新启用认证区,有二位高手都用好成绩顺利进入认证区,后来有人发现是相同的围,便引出一个抄袭的话题,事实上都是独立算围的,只不过算法相同,后来其中一位主动改用其它算法,避免了同区数据重叠的尴尬,这二位高手同期也在震东发表,只是没人留意,这种算法我知道一个网友也用,不拿出来在围区发表罢了,他是从表哥那儿学来的,谁知道这个表哥又收了多少徒弟呢。
第二件事是去年我在区分不同名在各个围区发表同一围的人时发现,有一个成绩相当好的围,居然有5个名发表,再后来又发现,这5个名居然是5个不同的人,都是用同一算法,而这种算法在以前统计杀5码时就发现过有三个人同时使用,究竟有多少人用这个方法呀,当时我就晕了。一个人错就等于错几次,特码都不知杀到哪去了。
最后总结 1,人人都在跟风 2,不必理会跟风
|
|
|
|
|
|
|