网站首页    信息智能    2020谷歌技术发展
  •  “资本之王”黑石

    自1985年成立,两位连杠杆并购都没真正做过的创始人,如今凭借1.1万亿美元的管理规模,让黑石足以跨界比肩世界顶级的主权财富基金。黑石的业务虽多但却有着科学的分类和管理,并且随着大环境的变化而实时调整。2024年,黑石仍在对其业务进行归类和整合。

    8 ¥ 0.00
  • ESG披露标准启示

    目前主流披露标准主要分为两大类:第一类为综合性的披露标准,以GRI、SASB等为代表。第二类为聚焦气候变化、水资源等领域的披露标准,以TCFD、CDP等为代表。第二类标准适用于不同的领域,很难横向比较。GRI标准是全球使用最为广泛的披露标准,引用占比超过90%。

    8 ¥ 0.00
  • 中国钾盐缺口

    中国有56%的耕地需要“补钾”,总体上越往东南越严重,闽、湘、鄂、粤、海南以及江淮地区土壤钾含量都十分稀少,高效钾含量只有新疆、关中农业区的二分之一甚至四分之一。2023年,中国钾盐缺口68%,需进口1000多万吨,而由于钾的高度垄断,进口选项非常有限。

    45 ¥ 0.00
  • 三井物产的情报网

    微软的情报系统对企业经营的贡献率大约是17%左右,而三井这种贸易财团则是以信息为最终的经济效益,其情报就是整个公司的命脉。作为民间研究机构,从研究的深度、广度和企业接受程度来看,比政府研究机构更有效率。其成果被日本企业界认为是经济变化的风向标。

    78 ¥ 0.00
  • 为什么盒装奶是950毫升?

    国内的一些牛奶包装沿用了美国的可折叠屋顶式纸盒设计,用的模具一样,那标注的容量也跟别人一样,取近似值950毫升。制造商在保持包装大小和价格不变的情况下,稍微减少产品的体积。这可以帮助公司在生产成本上升时控制开支,而不会显著提高零售价格。

    20 ¥ 0.00
  • 一个县城与打火机

    12道工序、32个零配件、15项测试标准……制造出1元打火机。全球一年销售200亿只,约七成来自中国湖南邵东。这里年产打火机150亿只,远销120个国家和地区,串起来能绕地球20圈。在邵东,平均每1分钟就有2.8万个打火机下线,其打火机生产技术也在不断创新。

    21 ¥ 0.00
  • 重生的俄罗斯农业

    2002年俄出台《农业用土地流通法》后,一系列法律让农用土地流通得以明确、透明地进行,保证了农业政策的稳定性。2007年对农业发展做出规划,实行农业保护政策和农产品价格调控政策,对农作物保险费实施补贴。次年俄罗斯农业从粮食净进口国转变为粮食净出口国。

    105 ¥ 0.00
  • 印度,用糊糊驯服味蕾

    谷物的富余,让印度不怕浪费粮食,人们发现,面粉和米粉作为糊糊的增稠剂,质地更浓郁粘稠、香料与食材融合度更好,且可以保温和解腻,缓解糊油脂和肉类的油腻感。原本粗劣的糊糊,在不断融合的过程中,越来越能驯服各种各样的食材,并形成另一条美食路径。

    83 ¥ 0.00
  • 拜耳伤痕

    买下孟山都,彻底改变了拜耳的发展轨迹。拜耳最大的三项并购是2006年以199.5亿美元的价格收购先灵公司,2014年以142亿美元收购默沙东的OTC业务,以及2016-2018年间以630亿美元收购孟山都。前两项并购起码还增强了拜耳的制药业务竞争力,最糟糕的是对孟山都的收购。

    33 ¥ 0.00
  • 全球家族办公室现状

    只有少数家族办公室将注意力放在促进家族团结和长期稳定上。在职能专业化方面,投资管理进展最为显著,而其他职能专业化水平则存在差异。家族本身的专业化水平也呈现出类似的情况。许多家族和家族办公室都缺乏领导人接班规划,并且未为下一代制定教育规划

    126 ¥ 0.00
  • 全球文科倒闭潮

    文科衰退,是个全球性的问题。经合组织报告显示,过去10年人文学科的入学人数都在下降。在这股浪潮中,有的大学是迫于财政压力削减人文学科,有的则是出于对“教育优势”进行结构性的优化,也就是把跟不上时代的文科专业淘汰掉,去拥抱更具竞争优势的STEM学科。

    9 ¥ 0.00
  • 2024年最失败的八大技术

    麻省理工科技评论的年度科技失败案例盘点,记录了过去一年中的失误、骗局与灾难。有些失败带着荒诞色彩,如谷歌“觉醒AI”生成黑人纳粹图像而将公司推上舆论风口浪尖。另一些则更加严重,如CrowdStrike的一次计算机错误,导致数千名达美航空乘客被迫滞留机场,引发法律诉讼。

    4 ¥ 0.00
  • 游戏行业的肉与汤

    AI会不会彻底改变这个行业,“不好说”,“AI原生游戏大概率不会是我们先搞出来,可能是哪个做AI的实验室先做出来,然后其他人会在他们的基础上往下走,”卢竑岩表示,目前还没有看到离实用特别接近的科研成果,“但也很难说,会不会突然有爆发性地增长。”

    24 ¥ 0.00
  • 120年美国房价历史和规律

    从1890年到2013年的123年中,有28年下跌,95年上涨。其中跌得最深的是2008年,跌幅达18%。连续下跌达到5年的只有两次,第一次是1929-1933年累积跌幅达26%;2006-2011年累积跌幅达33%。在过去的123年中,美国房价平均增长率为3.07%,CPI 通胀率为2.82%。在扣除通胀率后,房价就基本不涨了。

    45 ¥ 0.00
  • 枢纽城市之争

    超级承运人与枢纽机场相辅相成,带来大量客流、物流,从而拉动当地经济发展。无论是超级承运人,还是枢纽机场,都强调“集中”,如达美航空在亚特兰大份额超过80%,堪称“堡垒枢纽”。而中国目前有57家航司,三大航在北上广基地份额都仅在40%-50%之间,市场份额较为分散。

    46 ¥ 0.00
  • 波音从工程奇迹到信任危机

    批评人士说,波音公司把安全当成了利润的牺牲品。”这样做是为了让波音的运营更像一家企业,而不是一家伟大的工程公司。波音的确是一家伟大的工程公司,但人们投资一家公司是因为他们想赚钱。”今天的波音既不是一家伟大的工程公司,也不是一个好的投资对象。

    44 ¥ 0.00
  • 计算机产业史

    本文从1946年第一台计算机ENIAC发明开始,阐述计算机作为不同效用工具为人所用。从科学计算、数据处理、适时控制,到线上社交、个人玩乐、办公效率、图形工具,再到内容平台、互联网与云计算时代,最后计算机已经融入到我们生活方方面面,无处不在。

    互联网之所以能够大而统一,发挥最大网络效应,与其去中心化的基础定位有很大关系:数据包发送方式和发送内容无关,任何设备都可以加入互联网,唯一中心化的域名管理机构获得了独立且非营利地位,互联网治理更多依赖社交机制,而不是靠特定机构来管理。

    44 ¥ 0.00
  • 墨西哥的中国工厂

    中国企业到墨西哥以前,目光紧盯着美国,到墨西哥后却发现了许多新机会。同时到了墨西哥后,它们惊觉,中国经验失灵了。不同于过去从欧美日企业到亚洲四小龙再到中国,再从中国到东南亚的产业转移,中资企业到墨西哥是一场大国博弈背景下的应变之策。

    224 ¥ 0.00
  • 像研究人类一样研究ChatGPT

    一篇有关“机器心理”的预印本。他在其中提出,把LLM当作一个人类对象来对话,可以揭示底层简单的计算之中产生的复杂行为。Google的研究引入“思维链提示”,来描述一种让LLM展示“想法”的做法,会让模型按相似的流程行事。它会输出思维链,这么做更可能获得正确答案

    45 ¥ 0.00
  • 欧亚电网互联的地缘要素

    欧亚电网互联问题上,欧盟和俄罗斯等传统“电力中心”依然重要,新“中心”如中国、印度、土耳其、伊朗等也在崛起。随着技术发展,电网容易受外部力量影响,美国也在不断尝试渗透。电网联通可以建立包容、平等、开放的政治空间;同时,也可以成为政治制度堡垒。

    144 ¥ 0.00

【作者:JeafDean;来源:GoogleAIBlog;转载自:新智元《JeafDean万字长文回顾2020谷歌技术发展》2021.01】

 

JeffDean发了一篇几万字长文,回顾了这一年来谷歌在各个领域的成就与突破,并展望了2021年的工作目标。本文为部分编译,参考链接可以查看原文。

当我20多年前加入谷歌的时候,只想弄清楚如何真正开始使用电脑在网络上提供高质量和全面的信息搜索服务。时间快进到今天,当面对更广泛的技术挑战时,我们仍然有着同样的总体目标,那就是组织全世界的信息,使其普遍可获取和有用。

2020年,随着世界被冠状病毒重塑,我们看到了技术可以帮助数十亿人更好地交流,理解世界和完成任务。我为我们所取得的成就感到骄傲,也为即将到来的新的可能性感到兴奋。

GoogleResearch的目标是解决一系列长期而又重大的问题,从预测冠状病毒疾病的传播,到设计算法、自动翻译越来越多的语言,再到减少机器学习模型中的偏见。基于我们对2016至2019年的年度回顾,本文涵盖了今年的关键亮点。

 

01

新冠病毒和健康

 

COVID-19的影响给人们的生活带来了巨大的损失,世界各地的研究人员和开发人员联合起来开发工具和技术,以帮助公共卫生官员和政策制定者理解和应对这场流行病。

苹果和谷歌在2020年合作开发了暴露通知系统(ENS),这是一种支持蓝牙的隐私保护技术,如果人们暴露在其他检测呈阳性的人群中,可以通知他们。

ENS补充了传统的接触者追踪工作,并由50多个国家、州和地区的公共卫生当局部署,以帮助遏制感染的传播。

在流感大流行的早期,公共卫生官员表示,他们需要更全面的数据来对抗病毒的快速传播。我们的社区流动性报告,提供了对人口流动趋势的匿名追踪,不仅帮助研究人员了解政策的影响,如居家指令和社会距离,同时还进行了经济影响的预测。

https://img-blog.csdnimg.cn/img_convert/5bb145d142659cd925001c78dbc6517d.png

我们自己的研究人员也探索了用这种匿名数据来预测COVID-19的传播,用图神经网络代替传统的基于时间序列的模型。

冠状病毒疾病搜索趋势症状允许研究人员探索时间或症状之间的联系,比如嗅觉缺失----嗅觉缺失有时是病毒的症状之一。为了进一步支持更广泛的研究社区,我们推出了谷歌健康研究应用程序,以提供公众参与研究的方式。

https://img-blog.csdnimg.cn/img_convert/d3c782114115a2c1bc2ad94416e95f6f.png

图:COVID-19搜索趋势正在帮助研究人员研究疾病传播和症状相关搜索之间的联系

谷歌的团队正在为更广泛的科学界提供工具和资源,这些科学界正在努力解决病毒对健康和经济的影响。

https://img-blog.csdnimg.cn/img_convert/da3bb7ceedc6d27833914dcf74603566.png

图:一个模拟新冠病毒扩散的时空图

我们还致力于帮助识别皮肤疾病,帮助检测老年黄斑变性(在美国和英国是导致失明的主要原因,在全世界是第三大致盲原因),以及潜在的新型非侵入性诊断(例如,能够从视网膜图像中检测出贫血的迹象)。

https://img-blog.csdnimg.cn/img_convert/7af56edccb325e5e1e167f1baf8da000.png

图:深度学习模型从视网膜图像中量化血红蛋白水平。血红蛋白水平是检测贫血的一项指标

今年,同样的技术如何可以窥视人类基因组,也带来了令人兴奋的演示。谷歌的开源工具DeepVariant,使用卷积神经网络基因组测序数据识别基因组变异,并在今年赢得了FDA的4个类别中的3个类别的最佳准确性的挑战。丹纳-法伯癌症研究所领导的一项研究使用同样的工具,在2367名癌症患者中,将导致前列腺癌和黑色素瘤的遗传变异的诊断率提高了14%。

 

02

天气、环境和气候变化

 

机器学习能帮助我们更好地了解环境,并帮助人们在日常生活中以及在灾难情况下做出有用的预测。

对于天气和降水预报,像NOAA的HRRR这样基于计算物理的模型一直占据着主导地位。然而,我们已经能够证明,基于ML的预报系统能够以更好的空间分辨率预测当前的降水量(“西雅图的本地公园是不是在下雨?”而不仅仅是“西雅图在下雨吗?”)它能够产生长达8小时的短期预报,比HRRR准确得多,并且能够以更高的时间和空间分辨率更快地计算预报。

https://img-blog.csdnimg.cn/img_convert/80926165f42181a7296749698a7c2a6f.png

我们还开发了一种改进的技术,称为HydroNets,它使用一个神经网络来建模真实的河流系统,以更准确地了解上游水位对下游洪水的相互作用,做出更准确的水位预测和洪水预报。利用这些技术,我们已经将印度和孟加拉国的洪水警报覆盖范围扩大了20倍,帮助在25万平方公里内更好地保护了2亿多人。

https://img-blog.csdnimg.cn/img_convert/d27a2789a49086341bdaf683ab3c05c8.png

03

可访问性(Accessibility)

 

机器学习继续为提高可访问性提供了惊人的机会,因为它可以学会将一种感官输入转化为其他输入。举个例子,我们发布了Lookout,一个Android应用程序,可以帮助视力受损的用户识别包装食品,无论是在杂货店还是在他们家的厨房橱柜里。

Lookout背后的机器学习系统演示了一个功能强大但紧凑的机器学习模型,可以在有近200万个产品的手机上实时完成这一任务。

同样,使用手语交流的人很难使用视频会议系统,因为即使他们在手语,基于音频的扬声器检测系统也检测不到他们在主动说话。为视频会议开发实时自动手语检测,我们提出了一种实时手语检测模型,并演示了如何利用该模型为视频会议系统提供一种识别手语者为主动说话者的机制。

04

机器学习在其他领域的应用

 

2020年,我们与FlyEM团队合作,发布了果蝇半脑连接体,这是一种大型突触分辨率图谱的大脑连接,重建使用大规模机器学习模型应用于高分辨率电子显微镜成像的脑组织。这些连接体信息将帮助神经科学家进行各种各样的研究,帮助我们更好地理解大脑是如何运作的。

05

负责任的人工智能

 

为了更好地理解语言模型的行为,我们开发了语言可解释性工具(LIT),这是一个可以更好地解释语言模型的工具包,使得交互式探索和分析语言模型的决策成为可能。

我们开发了在预训练语言模型中测量性别相关性的技术,以及在谷歌翻译中减少性别偏见的可扩展技术。

为了帮助非专业人员解释机器学习结果,我们扩展了2019年引入的TCAV技术,现在提供了一套完整而充分的概念。我们可以说“毛”和“长耳朵”是“兔子”预测的重要概念。通过这项工作,我们还可以说,这两个概念足以充分解释预测;您不需要任何其他概念。

https://img-blog.csdnimg.cn/img_convert/4188827d90f8145d6c3dbb871bc7f596.png

概念瓶颈模型是一种技术,通过训练模型,使其中一层与预先定义的专家概念(例如,“骨刺呈现”,或“翅膀颜色”,如下所示)保持一致,然后再对任务做出最终预测,这样我们不仅可以解释这些概念,还可以动态地打开/关闭这些概念。

 

06

自然语言理解

 

更好地理解语言是我们今年看到相当大进展的一个领域。谷歌和其他公司在这个领域的大部分工作现在都依赖于transformer,这是一种特殊风格的神经网络模型,最初是为了解决语言问题而开发的(但是越来越多的证据表明,它们对图像、视频、语音、蛋白质折叠以及其他各种各样的领域也很有用)。

在2020年,我们描述了Meena,一个对话机器人,可以聊任何事情。

https://img-blog.csdnimg.cn/img_convert/acf39bd5b139ce255cae64c9de46987a.png

 

07

机器学习算法

 

谷歌仍向无监督学习方向大力发展,例如2020年开发的SimCLR,推进自监督和半监督学习技术。

http://p2.itc.cn/q_70/images03/20210116/b015c744f259476f8f3722f7724971ce.png

使用不同的自监督方法(在ImageNet上预训练)学习的表示形式,对ImageClass的分类器进行ImageNettop-1准确性训练。灰色十字表示受监管的ResNet-50。

 

08

强化学习

 

强化学习通过学习其他主体以及改进探索,谷歌已经提高了RL算法的效率。

他们今年的主要重点是离线RL,它仅依赖于固定的,先前收集的数据集(例如先前的实验或人类演示),从而将RL扩展到了无法即时收集训练数据的应用程序中。研究人员为RL引入了对偶方法,开发了改进的算法以用于非策略评估,此外,他们正在与更广泛的社区合作,通过发布开源基准测试数据集和Atari的DQN数据集来解决这些问题。

http://p4.itc.cn/q_70/images03/20210116/3c02237baef34b2c8356730bfea88514.png

使用DQN重播数据集的Atari游戏的离线RL

另一个研究方向是通过学徒制学习(apprenticeshiplearning),向其他代理学习,从而提高了样本效率。

需要注意的是,将RL扩展到复杂的实际问题来说是一个重要的挑战。

http://p1.itc.cn/q_70/images03/20210116/83f80b44f96a4c26980e1b0ded6b333b.png

概述我们的方法并说明AttentionAgent中的数据处理流程。顶部:输入转换-一个滑动窗口将输入图像分割成更小的补丁,然后将它们"扁平化",以便将来处理。中间。补丁选举-修改后的自我注意力模块在补丁之间进行投票,以生成补丁重要性向量。底部:动作生成--AttentionAgent在补丁之间进行投票,生成补丁的重要性向量。行动生成--AttentionAgent选择重要性最高的补丁,提取相应的特征,并基于这些特征做出决策。

 

09

AutoML

 

毫无疑问,这是一个非常活跃和令人兴奋的研究领域。

我在AutoML-Zero中:不断学习的代码,我们采用了另一种方法,即为演化算法提供一个由非常原始的运算(例如加法,减法,变量赋值和矩阵乘法)组成的搜索空间,以查看是否有可能从头开始发展现代ML算法。

但是,有用的算法实在太少了。如下图所示,该系统重塑了过去30年中许多最重要的ML发现,例如线性模型,梯度下降,校正线性单位,有效的学习率设置和权重初始化以及梯度归一化。

http://p7.itc.cn/q_70/images03/20210116/6b7b28eb8cd54404afa81b3354a7a9df.png

 

10

更好地理解ML算法和模型

 

随着神经网络被做得更宽更深,它们往往训练得更快,泛化得更好。这是深度学习中的一个核心奥秘,因为经典学习理论表明,大型网络应该超配更多。

在无限宽的限制下,神经网络呈现出惊人的简单形式,并由神经网络高斯过程(NNGP)或神经切线核(NTK)来描述。谷歌研究人员从理论和实验上研究了这一现象,并发布了NeuralTangents,这是一个用JAX编写的开源软件库,允许研究人员构建和训练无限宽度的神经网络。

http://p9.itc.cn/q_70/images03/20210116/0fb5196cecb34ab8bf67afc9de841056.png

左:该示意图显示了深层神经网络如何随着简单的输入/输出图变得无限宽而引发它们。右图:随着神经网络宽度的增加,我们看到在网络的不同随机实例上的输出分布变为高斯分布。

 

11

机器感知

 

对我们周围世界的感知--对视觉、听觉和多模态输入的理解、建模和行动--仍然是一个具有巨大潜力的研究领域,对我们的日常生活大有裨益。

2020年,深度学习使3D计算机视觉和计算机图形学更紧密地结合在一起。CvxNet、3D形状的深度隐含函数、神经体素渲染和CoReNet是这个方向的几个例子。此外,他们关于将场景表示为神经辐射场的研究(又名NeRF,也可参见本篇博文)是一个很好的例子,说明GoogleResearch的学术合作如何刺激神经体量渲染领域的快速进展。

http://p6.itc.cn/q_70/images03/20210116/8655de9147c8405bbb0ee0199cfcbc0c.png

在与加州大学伯克利分校合作的《学习因素化和重新点亮城市》中,谷歌提出了一个基于学习的框架,用于将户外场景分解为时空变化的照明和永久场景因素。这能为任何街景全景改变照明效果和场景几何,甚至将其变成全天的延时视频。

http://p0.itc.cn/q_70/images03/20210116/37e85f869ab2425d9737961cd394cef2.gif

2020年,他们还使用神经网络进行媒体压缩的领域不断扩大,不仅在学习的图像压缩方面,而且在视频压缩的深层方法,体压缩以及深不可知的图像水印方面都取得了不错的成绩。

http://p0.itc.cn/q_70/images03/20210116/8544f28e2c314fb9a468a5ae79fbc2af.png

第一行:没有嵌入消息的封面图像。第二行:来自HiDDeN组合失真模型的编码图像。第三行:来自我们模型的编码图像。第四行:HiDDeN组合模型的编码图像和封面图像的归一化差异。第五行:模型的归一化差异

通过开源解决方案和数据集与更广泛的研究社区进行互动是另一个重要方面。2020年,谷歌在MediaPipe中开源了多种新的感知推理功能和解决方案,例如设备上的面部,手和姿势预测,实时身体姿势跟踪,实时虹膜跟踪和深度估计以及实时3D对象检测。

http://p3.itc.cn/q_70/images03/20210116/d5b8bb13cb3a41f4bff319e68736304d.png

最后,展望这一年,我特别热衷于构建更多通用机器学习模型的可能性,这些模型可以处理各种模式,并且可以通过很少的培训示例来自动学习完成新任务。该领域的进步将为人们提供功能更强大的产品,为全世界数十亿人带来更好的翻译,语音识别,语言理解和创作工具。这种探索和影响使我们对工作感到兴奋!

参考链接:

https://ai.googleblog.com/2021/01/google-research-looking-back-at-2020.html

2021-01-19
2020年,随着世界被冠状病毒重塑,我们看到了技术可以帮助数十亿人更好地交流,理解世界和完成任务。GoogleResearch的目标是解决一系列长期而又重大的问题,从预测冠状病毒疾病的传播,到设计算法、自动翻译越来越多的语言,再到减少机器学习模型中的偏见

2020谷歌技术发展

谷歌人工智能