超燃!英伟达GTC大会:黄仁勋公布大批硬核新品
- +1 你赞过了
【天极网网络频道】12月18日,英伟达GTC China 2019大会在苏州举行。上午,人称“AI教父”的黄仁勋穿着那一身标志性的黑色皮夹克出现在GTC主题演讲的舞台上,献上了长达两个小时的激情演讲。黄仁勋重点分享了英伟达在三个重大领域的创新,包括计算机图形、高性能计算以及人工智能。
会上,黄仁勋首先宣布,6款游戏将引入光线追踪技术,包括《暗影火炬》、Project X、《无限法则》、《轩辕剑柒》、《铃兰计划》以及《边境》。此外,英伟达GPU还将为腾讯游戏的START云游戏平台提供支持。腾讯游戏计划扩展该平台,为玩家提供与本地游戏主机一致的游戏体验。
在2018年的GTC China上,英伟达发布了TensorRT 5,支持自动低精度推理,而不失准确率。然而,TensorRT 5有一个不足,那就是仅能支持CNN。大多数语音模型需要RNN的支持,而语言推理需要大量的工作负载。在本次大会上,黄仁勋带来了NVIDIA第七代推理软件开发套件TensorRT 7。据介绍,TensorRT 7支持各种类型的RNN、Transformer和CNN。相比于TensorRT 5只支持30种变换,TensorRT 7能够支持1000多种不同的计算变换和优化。借助该软件,开发者都可以实现会话式AI应用,大幅减少推理延迟。
由于会话是交互式、应答式的,所以低延迟的计算是非常重要的。一套端到端的流程可能由二三十种模型组成,用到不同的模型结构。CPU推理延迟是3秒,但在T4 GPU上,整个过程只需要0.3秒,比CPU快10倍。
“现在我们能够实现非常自然的、内容非常丰富的会话式AI,这是TensorRT 7可以做的。”黄仁勋说。
除了会话AI外,推荐系统也是TensorRT 7的一大应用场景。黄仁勋介绍,推荐系统已经从基于CPU转向了现在的基于GPU。目前,百度推荐系统采用NVIDA AI,有100多个推荐模型被应用到百度的众多应用中。用GPU训练推荐系统,成本只有CPU的十分之一。
阿里巴巴的推荐系统同样使用的是NVIDIA AI。在今年的“双十一”,阿里巴巴创造了380亿美元的销售额。在这一天,有5亿人要决定这20亿件产品中买哪一件,所以每秒是几十亿次的查询请求,这样的计算工作负载对CPU来说非常高。阿里巴巴通过GPU为推荐模型提供加速,实现了每秒处理780个查询,而基于CPU的推理每秒只能处理3个查询。
在自动驾驶领域,英伟达发布了NVIDIA DRIVE AGX Orin。Orin包括170亿个晶体管、8个核心的64位CPU、200 TOPS的深度学习算力,几乎是NVIDIA上一代Xavier系统级芯片性能的7倍。Orin系列可以从L2扩展到L5,每个级别都可提供性能,同时降低功耗以容纳更高分辨率的传感器,同时保护EV的范围。Orin是提高针对OEM的低成本版本,即想用一个单路的摄像机来做L2级别的自动驾驶,同时能利用整个AV产品线中的软件栈。黄仁勋透露,Orin将于2022年开始投产。
在机器人领域,英伟达推出了全新版本的lsaac软件开发套件(SDK),提供更新的AI感知、仿真、操控功能。据了解,lsaac是一个端到端的平台,可以使世界上的机器人社区能够创建大规模的可操作机器人,包括:开发基础设施,具有软件堆栈的机器人计算平台、完全可操作性的应用程序,以及可借力NVIDIA迁移学习和联邦学习工具的预训练模型。
Isaac SDK可以加快研究人员、开发人员、初创企业和制造商开发和测试机器人的速度。使机器人能够通过仿真获得由人工智能技术驱动的感知和训练功能,从而可以在各种环境和情况下对机器人进行测试和验证。
现场,黄仁勋还展示了一款名为LEONARDO的机器人,LEONARDO可以感知并操纵物体,进行摆放、堆放和整理,而这些功能都是由NVIDIA Isaac SDK来实现的。
此外,在基因测序领域,英伟达发布了NVIDIA Parabricks基因组分析工具包。Parabricks是一个CUDA加速的基因组处理工具包,可与用于发现变异并能产生与行业标准GATK最佳实践流程一致的结果,能够实现30-50倍的加速。同时,Parabricks提供DeepVariant工具,利用深度学习技术进行基因变异检测。
“我们很高兴宣布华大基因已采用Parabricks”,黄仁勋说道,“通过借助若干GPU服务器,华大基因可按其测序仪生成数据的速率来处理基因组。”
随着摩尔定律走向终结,促使着人们去寻找新的方式推动计算性能的提升。英伟达用自己的硬件与并行计算软件相结合,为GPU找到了一个更广阔的空间。如今,从游戏、自动驾驶到机器人等领域都会有GPU的身影。显然,GPU的地位已随着时间的推移在不断提升。
最新资讯
热门视频
新品评测