网站首页    信息智能    复杂的12306系统
  • 汽车零部件首秀历史

    他们看似小小的发明却大大的改变了我们的生活。1916年,凯迪拉克在Type 53上第一次引入了点火钥匙;1967年倒闭的美国汽车制造商史蒂倍克发明了油表和雨刷器;1954年,通用汽车公司安装了汽车空调;第一个LED大灯诞生是在2008年的奥迪R8 V10上。在2014年,奥迪发明了激光大灯

    3 ¥ 0.00
  • 10亿销售额的国内购物中心

    2019年国内购物中心的总销售额约为3.5万亿元。占当年国内消费品零售总额的8.5%,这与成都购物中心占零售总额的比例相当。上海这个占比约为14%,全国最高。国内能够超过6.8亿元的购物中心总数不会超过2000个。2019年上海超过10亿元的购物中心总数不超过70家。

    0 ¥ 0.00
  • 揭秘家族办公室ICONIQ

    它目前共有225位高净值客户,管理资产规模620亿美元。提供服务含金融投资、税务规划、地产投资等业务。2020年,它抓住新冠疫情机会,在年初推出一个十亿级别的投资项目“战术机会”:寻找由于疫情而产生的各种投资机会,例如优先贷款、结构性股权以及救济性融资。

    1 ¥ 0.00
  • 神经科学商用案例

    过去几年内发表的一些学术研究表明,应用神经科学的方法有助于预测销售环节的购买决策以及广告的投放效能,甚至还能预测音乐的文化契合/流行度,这些都是通过直接粗放的问卷调查无法实现的。谷歌、微软、戴姆勒等已将神经科学研究手段纳入业务中,并获成功。

    2 ¥ 0.00
  • 互联网本质是新房东

    互联网所有的进化全部基于一个前提和原理:网络效应。网络上信息越多,就会吸引更多网民,会制造和生产更多的信息,又会吸引其他网民和增加上网时长。在网络效应下,即使没有智能手机的产生,只要时间够长,信息仍然会越来越多。媒体本身,就是最大的生意。

    0 ¥ 0.00
  • “逼良为劣”的国内商业模式

    国内稍具规模的线下零售商超基本上是“上游盈利模式”,就是商家向上游生产供应商要利润。此模式将线下零售商超变成“出租婆”:看似商家从上游供应商那确保了自己的盈利,实为“饮鸩止渴”,最终所有成本由“零售价格”承担,降低了商家自己的商品竞争力。

    14 ¥ 0.00
  • 掌握香奈儿的神秘家族

    掌控香奈儿品牌的韦特海默家族,曾历经普法战争、两次世界大战等百年之大变局。二战中涉险、与香奈儿女士的争产与诉讼后,韦特海默家族表现出了惊人的复原力,并通过与高价值社会资本的互动融合,实现家族企业的百年长青与持续发展。

    7 ¥ 0.00
  • DST全球投资战略:地缘套利

    2010年DST刚露头角,《经济学人》将其与南非的Naspers、中国的腾讯归为一个群体,称为新兴市场三巨头。DST在全球的投资战略就是四个字:地缘套利。 “世界从来以及未来都不可能达到所谓的‘扁平’状态,而所谓成功的商人,比的就是谁能够率先利用信息落差而某得利益”。

    23 ¥ 0.00
  • 清洁空气30年

    我国过去的经济增长在很大程度上依赖于化石燃料消费,造成了严重的空气污染问题,解决经济增长与污染改善之间的矛盾已成为我国发展生态文明的关键。我国一直致力于将大气污染、碳强度与经济增长脱钩,建立具有可持续发展和生态文明特征的社会发展模式。

    4 ¥ 0.00
  • “跛脚”的粤港澳大湾区

    区位优势支持了大湾区东岸和北岸城市的大发展,巨大的产业聚集和虹吸效应使各种生产要素都向深圳、广州等核心城市聚集,而西岸城市却发展缓慢。经过四十多年的基础设施建设,交通条件已经大为改观,周边产业和要素聚集情况开始逆转,西岸城市的新区位优势若隐若现

    1 ¥ 0.00
  • 拯救花旗总部大厦事件

    纽约花旗总部大楼危机整个事件中,它产生了英雄,却没有恶棍;从花旗集团到该市建筑部门的官员,与事件有关的每个人都表现得堪称楷模。LeMessurier不仅毫发无损,反而因此扩大了他的声望。一个做了正确选择的工程师涉及到一个更大的问题,即专业人士应该如何表现。

    2 ¥ 0.00
  • 好莱坞烂片流水线

    好莱坞百花齐放的电影公司被并购成了六大电影公司,并被要求每年产出稳定的收益。压力之下,制片方根本不敢冒险去拍摄任何新的题材。对编剧的压榨也越来越严重,谁还玩命搞创作?垄断北美80%市场后,六大只肯拍自己的独家IP,大片越来越无趣就很容易解释了。

    2 ¥ 0.00
  • 中国轮胎40年

    回头看中国轮胎业发展史,它几乎走过了大多数中国企业可能经历的每一个阶段:从粗制滥造靠低价抢占市场、到购买国际先进设备、让产品行销海外。再自主研发挑战世界头部品牌。最后把工厂开到全世界。经过这样一轮残酷的洗礼,资源将更多地向头部企业集中。

    0 ¥ 0.00
  • 21世纪以来美国制造业演变

    分析2000—2018年间制造业及其细分行业发展和演变发现,美国制造业经历了“空心化”再到回流,高端先进制造业不断优化升级,传统基础产业长期保持优势,顶层设计、科技创新、创新生态有重要驱动作用。化工产品、计算机及电子产品和交通装备制造业属优势行业。

    0 ¥ 0.00
  • 从土地金融到土地财政

    过去40年,根本没有土地“财政”,带给国家城市乃至整个经济巨变的是土地“金融”;未来要转向的,是土地财政,即进入运营阶段。最核心的内容就是有没有创造收入、有没有创造足够的税收。所以从获取金融一次性的收入为主,变成获取财政可持续的现金流收入为主

    8 ¥ 0.00
  • 视听价值链:“元宇宙”

    当物理空间去中心化之后会发生什么?多个行业对火遍欧美的元宇宙的投入将达到数万亿美元。它不光包括3D主机、VR头戴设备游戏、以及提供更多如沉浸式剧场的活动,像旅行、教育和现场表演这样的传统行业将以游戏思维和虚拟经济被重塑;同时还有内容社区综合体。

    9 ¥ 0.00
  • 从米其林看中国产业弱点

    中国的缺点是即使能够设计出来富有独创性的半导体和发动机,但缺乏能够实际制造这种高科技产品的工厂。中国要想成为制造业强国,首先试着挑战米其林三星怎么样?按照设计图,不论何时何地都能均质制造产品。代价恐怕就是变成死脑筋、不知变通、缺乏进取精神。

    3 ¥ 0.00
  • Reits的历程

    由于中国的直接融资占比低于发达国家,股票市场没有发达国家成熟,股票市场规模占GDP的比重要低于发达国家。因此使用REITs与股市规模之比来估算REITs市场规模并不合理。参考全球主要REITs市场REITs规模占GDP的比重的范围,可以计算得到中国REITs市场的规模大致在3-8万亿元。

    3 ¥ 0.00
  • 谷歌的人类大脑“地图”

    谷歌与哈佛大学的Lichtman实验室合作,发布了最新的「H01」数据集,这是一个1.4 PB 的人类脑组织小样本渲染图。H01 样本通过连续切片电子显微镜以 4nm 分辨率成像,再通过自动计算技术重建和注释,最后可以看到初步的人类大脑皮层结构。但H01只有整个人类大脑容量的百万分之一

    1 ¥ 0.00
  • 张小龙:微信这个产品

    很多人可能从人们的日常生活习惯,社会变迁等角度去考虑它,我从产品的角度来考虑,做了一些什么,我们做的事情可能很多,如果非要我把它归结为非常简单一两个词来表示的话,我想用两个词来表达它,一个是'连接',一个是'简单',这就是微信最核心的东西。

    3 ¥ 0.00

【作者:周琦;源自:中国经济周刊《探秘12306监控中心|最高日访问量1500亿次,12306到底有多牛》2020.01】

 

每年的高考、国考、春运,被称为中国的“三大全民参与活动”。其中,尤以春运涉及的范围最广,关注最多。

时至年关,春运出行必备的12306,再次成为人们使用频率最高的APP之一。从春运车票开售的那一刻开始,在外打拼的人们夜以继日地点击着刷新,期待订票成功那一刻的到来。

但是,热门方向、热门时段、热门车次的需求量巨大,难以满足所有人的购票需求,延伸出了不少人对于12306的疑问——为什么我就抢不到票?在前些年12306多次出现系统不稳定的情况时,中国铁路总公司(现为国铁集团)备受关注。

其实,12306系统的复杂性远超外界想象——在SKU(商品存货)数量计算难度远大于淘宝等电商的情况下,还要每天完成超过1500万个订单,并承受近1500亿次的点击。

“天天‘双11’。”是12306内部人士自嘲的“口头禅”,但也是现实的写照。

春运首日(1月10日),《中国经济周刊》记者走进了铁科院12306全路客票系统监控中心,对12306的“秘密”一探究竟。

12306全路客票系统监控中心监控大屏。《中国经济周刊》记者周琦摄

 

库存复杂性远超淘宝、京东

 

12306系统到底难在哪儿?

在提出疑问的网友中,不乏软件工程师,甚至还有人表示,只要40台服务器、2个架构师、4个程序员,就足以开发出和12306类似的网上购票系统。

但实际上,12306的库存复杂性比淘宝、京东等电商高很多倍,运算量也大得多,传统的分布式数据库、缓存、负载均衡技术,并不能满足12306的需求。

一位淘宝前资深工程师曾对此有过非常详细的分析。

在电商平台上,每个商品对应一个SKU,有人购买1件,库存就减1。而12306的特殊性在于,火车票是一种动态的SKU,计算起来的数据量可能是普通电商产品的数百倍。

以北京西到深圳福田的G71次高铁为例,共有17个站、3种座位。表面看起来是3个SKU,即G71商务座、一等座、二等座,但实际上,G71次高铁有408个SKU。

原因很简单:从北京西站始发的车票,后面有16个车站,即16种不同的车票;涿州东站是第二站,有15种不同的车票,以此类推,单以上下车的站来计算,G71次高铁就会有16+15……+2+1=136个SKU,而每种票对应3种座位,一共是408个商品。

也就是说,如果旅客购买了一张北京西站到涿州东站的车票,G71次高铁的SKU要减去16;而如果购买的是北京西站到深圳福田站的车票,则要减去136个SKU。

以上只是SKU的减值。若旅客购买的是短途票,如北京西站到涿州东站,则在SKU减去16的同时,还要增加涿州东站到之后各站、之后各站相互间的SKU,即增加120个SKU。

若再叠加当前的选座功能(A、B、C、D、F),计算数量可能还要再翻倍。而这些计算数据,需要在大量购票者抢票的数秒,甚至数毫秒内完成。

对于上述计算方法,铁科院12306技术部技术总监杨立鹏在接受《中国经济周刊》记者采访时说,车票在出售时会引发非常复杂的连锁的变化,是铁路业内独有的情况。因此,12306在设计时,首先是要考虑到铁路部门的业务需求,“铁路要支持沿途不同的旅客出行。尤其是一些停站特别多的车次,有的车要运行70多个小时,一列车可能正常是拉1000多个旅客,但实际上不同阶段、不同区间的可发售的车票,要远超过这个数值。”

杨立鹏介绍,车票售出后数据的变化,对12306系统的压力考验非常大,铁路部门通过采取数据的分析预测,根据不同的运力需求和运营安排,提前安排相应车票的发售等方式,缓解压力。“铁路部门从1996年到现在,通过20多年的技术积累,采取了一些独有的技术方案,解决了这个问题。”

例如,将车票分时段销售,就大大降低了同一时段的数据压力。12306的放票时间,已从最初的一天4个放票时间点,增加到10个,再到现在每天21个放票时间点。

12306全路客票系统监控中心内的车票发售时间表。《中国经济周刊》记者周琦摄

 

高峰日平均1秒承受170多万次点击

 

作为全球交易量最大的实时票务系统,中国铁路客票系统平均一年售出30亿张火车票,这些火车票首尾相接可以绕地球7圈。

铁科院12306技术部副主任阎志远介绍,目前铁路售票中,互联网销售占全渠道的80%以上,其中手机客户端占互联网售票的78%,网页端占互联网售票的22%。

在2020年春运以来的发售量最高日1月3日,铁路部门全渠道售出1637万张,其中网络售票占比88%。

在车票绝大多数通过互联网渠道售出的过程中,12306系统的稳定运行,是绝对的工作核心。

据铁科院首席研究员、12306技术部主任单杏花介绍,2020年春运期间,12306在高峰日网络点击量高达1495亿次。

也就是说,12306在高峰日平均1秒就要承受170多万次点击,大概相当于每个中国人每天在12306上点击了100次。

12306面临的流量压力,可想而知。一名IT工程师在听到《中国经济周刊》记者转述的这组数据时,表示自己很难想象,“即便是百度,也很难有这样的点击量,可以说是一组天文数字。”

作为对比,2019年淘宝的订单创建峰值,是54.4万笔/秒。Trustdata的数据显示,淘宝APP2019年“双11”当天的日活跃用户为4.76亿。

若以此计算,12306的最高访问量,相当于淘宝“双11”当天活跃用户每人点击超过300次。

对此,杨立鹏自嘲道,12306系统面临的,基本上是“天天被秒杀、天天被抢购、天天‘双11’”。

铁科院首席研究员、12306技术部主任单杏花介绍12306相关情况。《中国经济周刊》记者周琦摄

 

“组合拳”打击恶意刷票

 

值得注意的是,如此高的点击量中,风险请求的占比非常高。

1月10日上午,12306全路客票系统首次面向媒体开放。监控屏幕显示,截至当日上午9点,12306收到的风险请求访问占比已达52%,每秒的风险请求高达82.12万次。不断滚动的风险拦截报警,则详细记录了风险请求的IP地址和来自的省份。

阎志远说,12306从2018年开始构建风控系统,通过识别包括浏览器、IP在内的一些异常行为予以拦截。“例如,正常旅客购票可能每次操作需要一秒钟,而风险请求则可能达到毫秒级,对这种异常请求就会被风控系统拦截。当然,具体的拦截中,我们还有更多的考虑方面和识别手段。”

在这些风险请求中,来自第三方抢票软件的请求,占据不小的比例。

单杏花表示,其他网站提供的抢票服务,对12306系统造成了一定影响,铁路部门因此在风控方面进行了研发,通过风控系统对一些异常行为进行拦截,来保证12306能够运行稳定。“我们保障运行稳定的目的是什么?是为了让正常的旅客正常查询、正常下单、正常支付,更好保障售票的公平公正。避免出现一些加价、价高者得,避免出现一些退票、退手续费情况,让旅客受到损失。”

除了通过风控系统防范,铁路部门还打出了“组合拳”,通过“候补购票”,让刷票软件存在的意义大打折扣。

“自2019年12月12日开售春运车票以来,铁路12306售票系统候补购票订单兑现累计582.6万笔,车票723.7万张,兑现率达76.8%,减少了旅客反复查询次数。”单杏花说。

近年来,12306上需要进行“图片识别”的请求已大大降低,也是得益于这套“组合拳”。

此外,云技术的运用,也大大保证了12306系统运行的稳定性。

从2014年开始,12306把网站访问量最大的查询业务分担到“云端”。2016年,12306进一步扩大了云端容量,几乎所有查询访问都在云端进行。

杨立鹏接受《中国经济周刊》记者采访时介绍,12306通过采用公有云和私有云相结合的模式,提高12306的数据处理能力。“在日常情况下,国铁集团和铁科院两地各有一个数据中心,采用自有资源来提供售票服务。在节假日等高峰期,出于经济性等各方面的更考虑,采用公有、私有结合的混合云技术来提高服务能力。”

单杏花补充说,12306是一个弹性和扩展的架构,核心数据只在核心部位,扩展的功能则可以用一些外延的服务器,或者和公有云开展合作,“这些跟整个核心部位是不交织的,相互之间可以不影响。”

12306全路客票系统监控中心监控大屏,风险请求占比超过一半。《中国经济周刊》记者周琦摄

 

正在研究:往返车票一起购买

 

除了保障系统稳定运行,12306还通过大数据分析,为旅客们提供购票便利。

据悉,通过大数据分析,铁路部门可以提前预判一些热门地区的需求,进而在条件允许的情况下增加运力,例如将8节编组的动车组增加为16节编组的动车组,或者开行临客等。

单杏花介绍,2020年春运车票发售以来,截至1月9日,铁路全渠道共发售车票4.12亿张,其中预售春运车票1.3亿张。

她还说,春运车票预售,也就是车票发售首日预售出的车票占比不足1/3,说明很多旅客并不着急,没有在发售的第一天就去抢票。热门地区、热门方向、高峰时段列车票源紧张,但部分车次还有剩余车票。“这些剩余的车票大多是时间点比较差,或者席位比较差,如站票等。从大数据可以明显看出,旅客出行已经由‘走得了’向‘走得好’在转变。”

大数据的便利性不止于此,为老人优先配置下铺、为儿童配置相邻席位等,也需要12306系统的大数据支持。

单杏花对《中国经济周刊》记者说,12306上有购票者的基本身份信息,系统若判断订单里面有老人,就会去为老人优先寻找下铺,“哪怕只有一张下铺,就一定会给他找到。”

为儿童配置相邻席位方面,考虑到家长带孩子,购票时本身分为全价票和半价票两种票种,可能会出现位置不相邻、不好照看,甚至有时候出现在不同车厢这种问题,12306在2020年春运期间进行了优化。“哪怕是为了均衡运输需要,票已经卖散了,但是系统也会尽量将他们匹配在相邻的位置,如果没有相邻的位置,优先配置在同一个车厢。”她说。

值得注意的是,关于从大城市返往二三线城市的去程、返程同时购票的问题,铁路部门也在研究。

铁路部门通过大数据分析,有不少乘客,在大城市返往二、三线城市的过程中,会出现买了去程票买不到回程票,或者只买到回程票没买到去程票的问题。尤其是在春运等节假日,问题更加突出。

“我们一直在分析这种规律,准备展开研究,能否在出行时把去程和返程的需求一起考虑。尤其是在乘客已经买了去程的情况下,是不是优先配给返程?但是措施可能还得研究成熟之后再进行研发,再进行一些评估才能上线,可能还需要一定的时间。”

2020-05-16
12306系统复杂性远超外界想象——在SKU(商品存货)数量计算难度远大于淘宝等电商的情况下,还要每天完成超过1500万个订单,并承受近1500亿次点击。计算量可能是普通电商产品的数百倍。对比2019年淘宝54.4万笔/秒的订单峰值,12306的最高访问量相当于其活跃用户每人点击超过300次

复杂的12306系统

12306监控中心