网站首页    信息智能    复杂的12306系统
  • 全球产业链演化历程

    技术演进、竞争优势和风险环境是推动全球产业链发展的三股主要力量。技术演进是产业链结构变化的基础。在不同时期,三股力量以不同形式共同塑造全球产业链格局。在当前,三者分别对应着绿色化、效率性和安全性,使产业链呈现绿色化与多国多中心化的发展趋势。

    61 ¥ 0.00
  • “三得利”的扩张之路

    酿制威士忌100年企业——日本三得利控股的家族长期以来以自己节奏行事,注重长期发展。2022年有190亿美元收入。在日本烈酒、啤酒和软饮料等零散型市场上保持着自己的地位。据穆迪数据,按收入计算,三得利是全球第三大烈酒制造商,仅次于英国帝亚吉欧和法国保乐力加。

    23 ¥ 0.00
  • 4000年利率趋势

    面对历史,大家的归纳判断都不尽相同,对未来,分歧就更大了。利率研究的迷人之处和难度之大,也许就在于其既有一定规律可循,又充满着随机扰动,是无数因素相互作用的结果。特别是在低利率环境下,利率绝对值的一点变动就是百分比的很大变动,利率风险更大。

    23 ¥ 0.00
  • 崛起的伊朗制造业

    4000多年历史的伊朗,会是有力的合作伙伴,是最好要避免的敌人,以及永远不可能是任何人的附庸。它处于亚洲交通要冲,对基础设施改善的需求极大。它有大致完备的工业体系;制造业属于集中化生产,少数大型国有企业掌控;人口年轻化,缺少制造业技术人才储备。

    36 ¥ 0.00
  • 紫禁城里的楠木

    楠木产于川、云、桂、贵、鲁等地区。在紫禁城营建之初,皇帝下命令让80万工匠去这些地方的深山老林里找楠木。太和殿第一次营建使用的是楠木,气味芬芳,不怕虫子也不怕糟朽。但生长周期是300年。第五次复建太和殿时,已没有大尺寸楠木了。所以太和殿里有松木。

    14 ¥ 0.00
  • 泰国,中等收入陷阱样本

    泰国在20世纪70年代末进入中等收入阶段后,经济增长迅猛,曾被视为四国中最有潜力赶及“四小龙”的国家;但自90年代末期以来,泰国长期处于经济增长低迷的状态,GDP增长率一度低于马来西亚、印尼和菲律宾。泰国人口规模和领土面积处于中间水平等基础条件上不具有特殊性,有更强的代表性。

    37 ¥ 0.00
  • 中国各地博物馆镇馆之宝

    文物承载灿烂文明,传承历史文化。中国历史悠久,地大物博,作为世界文物大国,我国各地博物馆中的珍贵藏品数不胜数。并且每个博物馆都有自己的“镇馆之宝”,展示着在不同历史背景中的文化内涵。接下来就让我们从“镇馆之宝”中感受历史的传承。

    15 ¥ 0.00
  • 毛利相差10倍的猕猴桃

    中国猕猴桃种子研发培育滞后严重,导致在产业上与国际水平差距巨大:新西兰的亩产是2.49吨,中国亩产只有0.8吨。收益上,新西兰每亩收益1.9万元、金果的平均收益每亩4万元。而中国每亩的毛利仅有3000-4000元。如果说芯片是现代工业的核心,种子便是农业的“芯片”。

    12 ¥ 0.00
  • 地址,国家视角的众生平等

    与姓名、照片、身份证号码、指纹或DNA特征一样,地址帮助提高国家识别个人并因此加强了社会控制的能力,而它反过来也成为了构成一个现代人身份认同不可或缺的组成部分。门牌号码是18世纪最重要的创新之一, “为了帮助政府找到你。”在国家的视角下众生平等。

    30 ¥ 0.00
  • 可口可乐帝国的缔造节点

    可口可乐之所以能在不同的地区都取得成功,恰恰体现了在文化差异下,人类追求共同体验。任何地区的人享受生命乐趣的方式是一样的,可口可乐能带给他们这样的乐趣。“企业既不像我试图告诉你们的那样美好,也没有传说中的那么邪恶。事实上,它处于这两者之间。”

    36 ¥ 0.00
  • 欧亚电网互联的地缘要素

    欧亚电网互联问题上,欧盟和俄罗斯等传统“电力中心”依然重要,新“中心”如中国、印度、土耳其、伊朗等也在崛起。随着技术发展,电网容易受外部力量影响,美国也在不断尝试渗透。电网联通可以建立包容、平等、开放的政治空间;同时,也可以成为政治制度堡垒。

    44 ¥ 0.00
  • 北京与“繁华”

    相比窄路,大宽马路大街区反而才堵车。小尺度的交叉口信号相位少、周期短,可使清空距离和损失时间变短。北京“宽马路、疏路网”,与东京、纽约、香港“窄马路、密路网”,后者利于微循环打通,利于商业繁荣。另外,不是街区制,三百万以上人口就会爆发城市病。

    28 ¥ 0.00
  • 日本基金业萧条30年后

    90年代初至今,日本基金行业直面“失去的30年”。但仍实现一定程度结构性发展:当资金逃离权益市场,通过出海等方式拥抱固收业务、后开发养老金投资、逐月决算基金等特殊业态,头部机构又依托日本央行购买ETF扩表等,在被动产品上做大规模,最终铸成今日格局。

    16 ¥ 0.00
  • 超5700家芯片厂商注销

    2022年中国吊销/注销的芯片企业超过5700家。前8个月,吊销/注销芯片相关企业3470家。9月到12月增加了2300多家。平均每天就有超15家注销。波及的范围也更加广泛,不仅包括有技术研发实力的初创明星企业,也包括众多在市场上摸爬滚打多年有一定行业影响力的“老将”。

    27 ¥ 0.00
  • 游戏里的芯片战争

    回溯电子产业的发展,往往会聚焦于顶层政策、产业英雄、技术路线,反而忽略了构筑起人类工业与科技结晶的地基:市场——消费者用钱投票,选出了那些屹立在产业链顶端的庞然大物。如果复盘计算机发展史,就会发现游戏是不断加速的硅基革命最重要的推动力之一。

    19 ¥ 0.00
  • 银行巨头如何倒下

    银行业和其他行业的最大的区别在于,它没有中间状态,只有两个极端(稳态)——信任它,它良好经营;不信任它,它光速破产。不像其他行业,可以 “猥琐发育”几年。真正脆弱的是信心。尽管SVB的倒闭、瑞信的被收购乃至第一共和银行的被牵连固然有其经营上的原因。

    21 ¥ 0.00
  • 加密货币十年

    2014年是token死亡率最高的一年,793种token中的76.5%已不再流通,551种消失。2017年,有704个现已消失的token开始发行流通,比2016年的224个多。2018年是加密行业较危险的一年,有751种token消失。在比特币暴涨前,加密市场上只有14种token,截至2022年,只有比特币和莱特币留在前10名。

    15 ¥ 0.00
  • 六次全球金融危机

    各次金融危机,实质上都是债务危机或杠杆危机,无非表现形式不同。国外债务危机主要是债务违约、汇率贬值和资本出逃,国内债务危机主要是通货膨胀、资产价格泡沫和货币贬值。全球化危机主要通过贸易、外需、产业链、资本流动、金融市场、外汇、房地产等传导。

    24 ¥ 0.00
  • AI游戏的可能

    游戏作为终极在线社交体验的力量——在这里,创造力、技能和协作汇聚成乐趣。游戏玩家在所有垂直消费领域中拥有参与度和忠诚度最高的受众。AIGC的出现是游戏行业的“第四次工业革命”。与此前UGC化、模块化变革一样,AIGC将掀起又一波的游戏革命,游戏的范式将彻底更新。

    25 ¥ 0.00
  • 土壤正在退化

    根据联合国报告,全球每五秒钟就有一片足球场大小的土地受到侵蚀。照这速度,到2050年,全球超过90%的土壤都可能出现退化危机,进而导致粮食减产、清洁用水减少、生物多样性受威胁等一系列连锁反应。我国土壤“变累”、“变瘦”、“变薄”等退化问题也同样严峻。

    17 ¥ 0.00

【作者:周琦;源自:中国经济周刊《探秘12306监控中心|最高日访问量1500亿次,12306到底有多牛》2020.01】

 

每年的高考、国考、春运,被称为中国的“三大全民参与活动”。其中,尤以春运涉及的范围最广,关注最多。

时至年关,春运出行必备的12306,再次成为人们使用频率最高的APP之一。从春运车票开售的那一刻开始,在外打拼的人们夜以继日地点击着刷新,期待订票成功那一刻的到来。

但是,热门方向、热门时段、热门车次的需求量巨大,难以满足所有人的购票需求,延伸出了不少人对于12306的疑问——为什么我就抢不到票?在前些年12306多次出现系统不稳定的情况时,中国铁路总公司(现为国铁集团)备受关注。

其实,12306系统的复杂性远超外界想象——在SKU(商品存货)数量计算难度远大于淘宝等电商的情况下,还要每天完成超过1500万个订单,并承受近1500亿次的点击。

“天天‘双11’。”是12306内部人士自嘲的“口头禅”,但也是现实的写照。

春运首日(1月10日),《中国经济周刊》记者走进了铁科院12306全路客票系统监控中心,对12306的“秘密”一探究竟。

12306全路客票系统监控中心监控大屏。《中国经济周刊》记者周琦摄

 

库存复杂性远超淘宝、京东

 

12306系统到底难在哪儿?

在提出疑问的网友中,不乏软件工程师,甚至还有人表示,只要40台服务器、2个架构师、4个程序员,就足以开发出和12306类似的网上购票系统。

但实际上,12306的库存复杂性比淘宝、京东等电商高很多倍,运算量也大得多,传统的分布式数据库、缓存、负载均衡技术,并不能满足12306的需求。

一位淘宝前资深工程师曾对此有过非常详细的分析。

在电商平台上,每个商品对应一个SKU,有人购买1件,库存就减1。而12306的特殊性在于,火车票是一种动态的SKU,计算起来的数据量可能是普通电商产品的数百倍。

以北京西到深圳福田的G71次高铁为例,共有17个站、3种座位。表面看起来是3个SKU,即G71商务座、一等座、二等座,但实际上,G71次高铁有408个SKU。

原因很简单:从北京西站始发的车票,后面有16个车站,即16种不同的车票;涿州东站是第二站,有15种不同的车票,以此类推,单以上下车的站来计算,G71次高铁就会有16+15……+2+1=136个SKU,而每种票对应3种座位,一共是408个商品。

也就是说,如果旅客购买了一张北京西站到涿州东站的车票,G71次高铁的SKU要减去16;而如果购买的是北京西站到深圳福田站的车票,则要减去136个SKU。

以上只是SKU的减值。若旅客购买的是短途票,如北京西站到涿州东站,则在SKU减去16的同时,还要增加涿州东站到之后各站、之后各站相互间的SKU,即增加120个SKU。

若再叠加当前的选座功能(A、B、C、D、F),计算数量可能还要再翻倍。而这些计算数据,需要在大量购票者抢票的数秒,甚至数毫秒内完成。

对于上述计算方法,铁科院12306技术部技术总监杨立鹏在接受《中国经济周刊》记者采访时说,车票在出售时会引发非常复杂的连锁的变化,是铁路业内独有的情况。因此,12306在设计时,首先是要考虑到铁路部门的业务需求,“铁路要支持沿途不同的旅客出行。尤其是一些停站特别多的车次,有的车要运行70多个小时,一列车可能正常是拉1000多个旅客,但实际上不同阶段、不同区间的可发售的车票,要远超过这个数值。”

杨立鹏介绍,车票售出后数据的变化,对12306系统的压力考验非常大,铁路部门通过采取数据的分析预测,根据不同的运力需求和运营安排,提前安排相应车票的发售等方式,缓解压力。“铁路部门从1996年到现在,通过20多年的技术积累,采取了一些独有的技术方案,解决了这个问题。”

例如,将车票分时段销售,就大大降低了同一时段的数据压力。12306的放票时间,已从最初的一天4个放票时间点,增加到10个,再到现在每天21个放票时间点。

12306全路客票系统监控中心内的车票发售时间表。《中国经济周刊》记者周琦摄

 

高峰日平均1秒承受170多万次点击

 

作为全球交易量最大的实时票务系统,中国铁路客票系统平均一年售出30亿张火车票,这些火车票首尾相接可以绕地球7圈。

铁科院12306技术部副主任阎志远介绍,目前铁路售票中,互联网销售占全渠道的80%以上,其中手机客户端占互联网售票的78%,网页端占互联网售票的22%。

在2020年春运以来的发售量最高日1月3日,铁路部门全渠道售出1637万张,其中网络售票占比88%。

在车票绝大多数通过互联网渠道售出的过程中,12306系统的稳定运行,是绝对的工作核心。

据铁科院首席研究员、12306技术部主任单杏花介绍,2020年春运期间,12306在高峰日网络点击量高达1495亿次。

也就是说,12306在高峰日平均1秒就要承受170多万次点击,大概相当于每个中国人每天在12306上点击了100次。

12306面临的流量压力,可想而知。一名IT工程师在听到《中国经济周刊》记者转述的这组数据时,表示自己很难想象,“即便是百度,也很难有这样的点击量,可以说是一组天文数字。”

作为对比,2019年淘宝的订单创建峰值,是54.4万笔/秒。Trustdata的数据显示,淘宝APP2019年“双11”当天的日活跃用户为4.76亿。

若以此计算,12306的最高访问量,相当于淘宝“双11”当天活跃用户每人点击超过300次。

对此,杨立鹏自嘲道,12306系统面临的,基本上是“天天被秒杀、天天被抢购、天天‘双11’”。

铁科院首席研究员、12306技术部主任单杏花介绍12306相关情况。《中国经济周刊》记者周琦摄

 

“组合拳”打击恶意刷票

 

值得注意的是,如此高的点击量中,风险请求的占比非常高。

1月10日上午,12306全路客票系统首次面向媒体开放。监控屏幕显示,截至当日上午9点,12306收到的风险请求访问占比已达52%,每秒的风险请求高达82.12万次。不断滚动的风险拦截报警,则详细记录了风险请求的IP地址和来自的省份。

阎志远说,12306从2018年开始构建风控系统,通过识别包括浏览器、IP在内的一些异常行为予以拦截。“例如,正常旅客购票可能每次操作需要一秒钟,而风险请求则可能达到毫秒级,对这种异常请求就会被风控系统拦截。当然,具体的拦截中,我们还有更多的考虑方面和识别手段。”

在这些风险请求中,来自第三方抢票软件的请求,占据不小的比例。

单杏花表示,其他网站提供的抢票服务,对12306系统造成了一定影响,铁路部门因此在风控方面进行了研发,通过风控系统对一些异常行为进行拦截,来保证12306能够运行稳定。“我们保障运行稳定的目的是什么?是为了让正常的旅客正常查询、正常下单、正常支付,更好保障售票的公平公正。避免出现一些加价、价高者得,避免出现一些退票、退手续费情况,让旅客受到损失。”

除了通过风控系统防范,铁路部门还打出了“组合拳”,通过“候补购票”,让刷票软件存在的意义大打折扣。

“自2019年12月12日开售春运车票以来,铁路12306售票系统候补购票订单兑现累计582.6万笔,车票723.7万张,兑现率达76.8%,减少了旅客反复查询次数。”单杏花说。

近年来,12306上需要进行“图片识别”的请求已大大降低,也是得益于这套“组合拳”。

此外,云技术的运用,也大大保证了12306系统运行的稳定性。

从2014年开始,12306把网站访问量最大的查询业务分担到“云端”。2016年,12306进一步扩大了云端容量,几乎所有查询访问都在云端进行。

杨立鹏接受《中国经济周刊》记者采访时介绍,12306通过采用公有云和私有云相结合的模式,提高12306的数据处理能力。“在日常情况下,国铁集团和铁科院两地各有一个数据中心,采用自有资源来提供售票服务。在节假日等高峰期,出于经济性等各方面的更考虑,采用公有、私有结合的混合云技术来提高服务能力。”

单杏花补充说,12306是一个弹性和扩展的架构,核心数据只在核心部位,扩展的功能则可以用一些外延的服务器,或者和公有云开展合作,“这些跟整个核心部位是不交织的,相互之间可以不影响。”

12306全路客票系统监控中心监控大屏,风险请求占比超过一半。《中国经济周刊》记者周琦摄

 

正在研究:往返车票一起购买

 

除了保障系统稳定运行,12306还通过大数据分析,为旅客们提供购票便利。

据悉,通过大数据分析,铁路部门可以提前预判一些热门地区的需求,进而在条件允许的情况下增加运力,例如将8节编组的动车组增加为16节编组的动车组,或者开行临客等。

单杏花介绍,2020年春运车票发售以来,截至1月9日,铁路全渠道共发售车票4.12亿张,其中预售春运车票1.3亿张。

她还说,春运车票预售,也就是车票发售首日预售出的车票占比不足1/3,说明很多旅客并不着急,没有在发售的第一天就去抢票。热门地区、热门方向、高峰时段列车票源紧张,但部分车次还有剩余车票。“这些剩余的车票大多是时间点比较差,或者席位比较差,如站票等。从大数据可以明显看出,旅客出行已经由‘走得了’向‘走得好’在转变。”

大数据的便利性不止于此,为老人优先配置下铺、为儿童配置相邻席位等,也需要12306系统的大数据支持。

单杏花对《中国经济周刊》记者说,12306上有购票者的基本身份信息,系统若判断订单里面有老人,就会去为老人优先寻找下铺,“哪怕只有一张下铺,就一定会给他找到。”

为儿童配置相邻席位方面,考虑到家长带孩子,购票时本身分为全价票和半价票两种票种,可能会出现位置不相邻、不好照看,甚至有时候出现在不同车厢这种问题,12306在2020年春运期间进行了优化。“哪怕是为了均衡运输需要,票已经卖散了,但是系统也会尽量将他们匹配在相邻的位置,如果没有相邻的位置,优先配置在同一个车厢。”她说。

值得注意的是,关于从大城市返往二三线城市的去程、返程同时购票的问题,铁路部门也在研究。

铁路部门通过大数据分析,有不少乘客,在大城市返往二、三线城市的过程中,会出现买了去程票买不到回程票,或者只买到回程票没买到去程票的问题。尤其是在春运等节假日,问题更加突出。

“我们一直在分析这种规律,准备展开研究,能否在出行时把去程和返程的需求一起考虑。尤其是在乘客已经买了去程的情况下,是不是优先配给返程?但是措施可能还得研究成熟之后再进行研发,再进行一些评估才能上线,可能还需要一定的时间。”

2020-05-16
12306系统复杂性远超外界想象——在SKU(商品存货)数量计算难度远大于淘宝等电商的情况下,还要每天完成超过1500万个订单,并承受近1500亿次点击。计算量可能是普通电商产品的数百倍。对比2019年淘宝54.4万笔/秒的订单峰值,12306的最高访问量相当于其活跃用户每人点击超过300次

复杂的12306系统

12306监控中心