久久黄色网站永久入口_亚洲精品中文字幕无乱码_久久激情综合网

看點：黃教主拋12項硬核更新！聚焦AI、自動駕駛、游戲、HPC四大方向。

智東西12月18日蘇州報道，又到了一年一度的NVIDIA GTC China大會，這次，NVIDIA創(chuàng)始人兼CEO黃仁勛將焦點放在四大主題：人工智能（AI）、汽車、游戲和HPC。

黃仁勛說，這是迄今為止最大規(guī)模的GTC China，與會人數達到6100，較三年前的2400人增加250%。

黃仁勛宣布一系列NVIDIA新品及合作進展，核心內容如下：

1、百度、阿里使用NVIDIA AI平臺做推薦系統(tǒng)；

2、推出第七代推理優(yōu)化軟件TensorRT 7，進一步優(yōu)化實時會話式AI，T4 GPU上推理延遲是CPU的1/10；

3、NVIDIA AI推理平臺在全世界范圍內得到了廣泛的應用；

4、推出軟件定義的AV平臺、新一代自動駕駛和機器人SoC Orin，算力達200TOPS，計劃于2022年開始投產；

5、向交通運輸行業(yè)開源NVIDIA DRIVE自動駕駛汽車深度神經網絡，在NGC上推出NVIDIA DRIVE預訓練模型；

6、滴滴將在數據中心使用NVIDIA GPU訓練機器學習算法，并采用NVIDIA DRIVE為其L4級自動駕駛汽車提供推理能力；

7、推出全新版本NVIDIA ISAAC軟件開發(fā)套件SDK，為機器人提供更新AI感知和仿真功能；

8、宣布六款支持RTX技術的游戲；

9、騰訊與NVIDIA合作推出START云游戲服務，在中國將電腦游戲體驗引入云端；

10、宣布全亞洲最大云渲染平臺瑞云云渲染平臺將配備NVIDIA RTX GPU，首批5000片RTX GPU將在2020年上線；

11、發(fā)布面向建筑行業(yè)（AEC）的Omniverse開放式3D設計協(xié)作平臺；

12、面向基因組測序，黃仁勛發(fā)布CUDA加速的基因組分析工具包NVIDIA Parabricks。

AI：入駐百度阿里推薦系統(tǒng)，推出新一代TensorRT軟件

自2012年Alex Krivzhevsky使用NVIDIA Kepler GPU贏得ImageNet競賽以來，NVIDIA在5年內將訓練性能提升300倍。

借助Volta、新Tensor Core GPU、Chip-on-wafer封裝、HBM 3D堆棧存儲器、NVLink和DGX系統(tǒng)組合，NVIDIA正助力更多AI研究。

AI將從云擴展到邊緣，NVIDIA正為以下每種用例分別打造一個平臺：用于訓練的DGX，用于超大規(guī)模云的HGX，用于邊緣的EGX和用于自治系統(tǒng)的AGX。

1、百度、阿里推薦系統(tǒng)采用NVIDIA GPU

黃仁勛說，互聯(lián)網一個最重要的機器學習模型是推薦系統(tǒng)模型。

沒有推薦系統(tǒng)，人們就無法從上億次網頁檢索、幾十億淘寶商品、幾十億抖音短視頻、各種網絡新聞、推文和照片中找到自己需要的內容。

深度學習可實現(xiàn)自動特征學習，支持非結構化內容數據，通過加速縮短延遲并提高吞吐率。

總體來看，做推薦系統(tǒng)面臨兩大挑戰(zhàn)：海量數據帶來的復雜模型處理任務，以及讓用戶立即看到推薦結果的實時性要求。

針對這一問題，百度提出AI-Box解決方案來訓練高級的大規(guī)模推薦系統(tǒng)。

百度AI-Box是Wide and Deep結構，采用NVIDIA AI平臺，基于NVIDIA GPU訓練TB級數據，速度比CPU更快的同時，訓練成本僅有CPU的1/10，且支持更大規(guī)模的模型訓練。

同樣，阿里做的推薦系統(tǒng)也選用了NVIDIA AI平臺。

今年“雙十一”當日，阿里的銷售額超過了380億美元的商品，電商網站上共列出約20億類商品，有5億用戶在購物，一天銷售額達2684億，每秒幾十億次推薦請求。

如果一位用戶花1秒看1個產品，那么看完所有商品要花32年的時間。

對此，阿里使用NVIDIA T4 GPU來訓練推薦系統(tǒng)，這使得每當用戶點擊一個商品，就會看到其他相關推薦商品。

原先使用CPU速度較慢，僅3QPS，而NVIDIA GPU將速度提升至780QPS。

2、推出第七代推理優(yōu)化軟件TensorRT

現(xiàn)場，黃仁勛宣布正式推出第七代推理優(yōu)化編譯器TensorRT 7，支持RNN、Transformer和CNN。

TensorRT是NVIDIA針對神經網絡推理階段提供的加速軟件，它能通過提供優(yōu)化的AI模型來大幅提升性能。

去年在GTC China大會上發(fā)布的TensorRT 5僅支持CNN，只支持30種變換，而TensorRT 7面向Transformer和RNN做了大量優(yōu)化，能以更少內存實現(xiàn)高效運算，并支持1000多種計算變換和優(yōu)化。

TensorRT 7能融合水平和垂直方向的運算，可為開發(fā)者設計的大量RNN配置自動生成代碼，逐點融合LSTM單元，甚至可跨多個時間步長進行融合，并盡可能做自動低精度推理。

此外，NVIDIA在TensorRT 7中引入一個內核生成功能，用任何RNN可生成一個優(yōu)化的內核。

會話式AI是TensorRT 7強大功能的典型代表。

其功能非常復雜，比如一個用戶用英文說了一句話，要把它翻譯成中文，這個過程需要先將英文口語轉化成文字，理解這段文字，然后轉化成想要的語言，再通過語音合成將這段文字轉化成語音。

一套端到端會話式AI的流程可能由二三十種模型組成，用到CNN、RNN、Transformer、自編碼器、NLP等多種模型結構。

推理會話式AI，CPU的推理延遲是3秒，現(xiàn)在使用TensorRT 7在T4 GPU上推理僅0.3s就完成，比CPU快10倍。

3、NVIDIA AI平臺得到廣泛的應用

另外，快手、美團等互聯(lián)網公司也在用NVIDIA AI平臺做深度推薦系統(tǒng)，以提高點擊率，并降低延遲和提高吞吐量，更好理解和滿足用戶需求。

例如，美團用戶想找一個餐廳或者是找酒店，都是通過用戶的搜索來實現(xiàn)的。

會話式AI需要可編程性、豐富的軟件推展及低GPU延遲。包含這些模型在內的NVIDIA AI平臺將為智能云提供支持。

NVIDIA EGX是面向邊緣AI應用打造的一體化AI云，專為流式AI應用程序、Kubernetes容器編排、保護動態(tài)數據和靜態(tài)數據安全而打造，已連接到所有物聯(lián)網云。

比如，沃爾瑪使用它進行智能結賬，美國郵政服務在EGX上通過計算機視覺分類郵件，愛立信將在EGX服務器上運行5G vRAN和AI物聯(lián)網。

推出新一代汽車SoC，算力200TOPS

NVIDIA DRIVE是一個端到端AV自動駕駛平臺，該平臺由軟件定義，而非固定功能的芯片，使得大量開發(fā)人員可按照持續(xù)集成、持續(xù)交付的開發(fā)方式進行協(xié)作。

黃仁勛表示，將在NGC容器注冊上，向交通運輸行業(yè)開源NVIDIA DRIVE自動駕駛汽車深度神經網絡。

1、下一代自動駕駛處理器ORIN，算力是Xavier的7倍

NVIDIA發(fā)布NVIDIA DRIVE AGX Orin，它是新一代自動駕駛和機器人處理器SoC，達到了ISO 26262 ASIL-D等系統(tǒng)安全標準，將包含一系列基于單一架構的配置，計劃于2022年開始投產。

Orin凝聚著NVIDIA團隊為期四年的努力，被用于處理多個高速傳感器、感知環(huán)境、創(chuàng)建一個周圍環(huán)境的模型并定義自己、根據特定目標制定合適的行動策略。

它使用了包含8個核心的64位Arm Hercules CPU，有170億個晶體管，再加上全新深度學習和計算機視覺加速器，其性能達到200TOPS，幾乎比上一代的技術（Xavier）提升7倍。

它擁有易編程性，有豐富工具和軟件庫支持，還擁有全新功能安全特性，可使CPU和GPU鎖步運行和提升容錯性。

Orin系列可從L2擴展到L5，與Xavier相兼容，可充分利用原有軟件，因此開發(fā)者能夠在一次性投資后使用跨多代的產品。

其新特性是提高針對OEM的低成本版本，即想用一個單路攝像機做L2級別的AV，同時能利用整個AV產品線中的軟件棧。

除了芯片外，NVIDIA的平臺、軟件等很多技術可應用在汽車中，幫助客戶定制化應用以進一步提升產品的性能。

2、推出NVIDIA DRIVE預訓練模型

黃仁勛還宣布在NGC上推出NVIDIA DRIVE預訓練模型。

一個正常運行的安全自動駕駛技術需要許多AI模型組成，其算法具有多樣性和冗余性。

NVIDIA開發(fā)了先進的感知模型，用于檢測、分類、跟蹤和軌跡預測，還可用于感知、本地化、規(guī)劃和制圖。

這些預訓練模型均可從NGC上注冊下載。

3、滴滴選用NVIDIA自動駕駛和云基礎設施

滴滴出行將使用NVIDIA GPU和其他技術開發(fā)自動駕駛和云計算解決方案。

滴滴將在數據中心使用NVIDIA GPU訓練機器學習算法，并采用NVIDIA DRIVE為其L5級自動駕駛汽車提供推理能力。

今年8月，滴滴將其自動駕駛部門升級為獨立公司，并與產業(yè)鏈合作伙伴開展廣泛合作。

作為滴滴自動駕駛AI處理的一部分，NVIDIA DRIVE借助多個深度神經網絡融合來自各類傳感器（攝像頭、激光雷達、雷達等）的數據，從而實現(xiàn)對汽車周圍環(huán)境360度全方位的理解，并規(guī)劃出安全的行駛路徑。

為了訓練更安全高效的深度神經網絡，滴滴將采用NVIDIA GPU數據中心服務器。

滴滴云將采用新的vGPU許可證模式，旨在為用戶提供體驗更佳、應用場景更豐富、效率更高、更具創(chuàng)新性和靈活的GPU計算云服務。

4、發(fā)布NVIDIA ISAAC機器人SDK

面向機器人領域，黃仁勛宣布推出全新NVIDIA Isaac機器人SDK，大大加快開發(fā)和測試機器人的速度，使機器人能通過仿真獲得由AI驅動的感知和訓練功能，從而可以在各種環(huán)境和情況下對機器人進行測試和驗證，并節(jié)省成本。

Isaac SDK包括Isaac Robotics Engine（提供應用程序框架），Isaac GEM（預先構建的深度神經網絡模型、算法、庫、驅動程序和API），用于室內物流的參考應用程序，并引入Isaac Sim訓練機器人，可將所生成的軟件部署到在現(xiàn)實世界中運行的真實機器人中。

其中，基于攝像頭的感知深度神經網絡有對象檢測、自由空間分割、3D姿態(tài)估計、2D人體姿態(tài)估計等模型。

全新SDK的對象檢測也已通過ResNet深度神經網絡進行了更新，可以使用NVIDIA的遷移學習工具包對其進行訓練，使添加新對象進行檢測和訓練新模型更加容易。

另外，該SDK提供了多機器人仿真，開發(fā)人員可將多個機器人放入仿真環(huán)境中進行測試，各個機器人可在共享的虛擬環(huán)境中移動時，運行獨立版本的Isaac導航軟件堆棧。

全新SDK還集成了對NVIDIA DeepStream軟件的支持，開發(fā)人員可在支持機器人應用程序的邊緣AI，部署DeepStream和NVIDIA GPU，以實現(xiàn)對視頻流的處理。

已開發(fā)了自己代碼的機器人開發(fā)人員，可將自己的軟件堆棧連接到Isaac SDK，通過C API訪問路由的Isaac功能，這樣極大程度地減少編程語言轉換。C-API訪問權限同時支持開發(fā)人員在其他編程語言中使用Isaac SDK。

據黃仁勛介紹，國內大學都采用Isaac來教授和研究機器人技術。

5、NVIDIA的汽車生態(tài)圈

NVIDIA在汽車領域已深耕了超過10年，和合作伙伴做了很多的事情，讓AI的大腦能更好的了解、甚至能夠去“駕駛”車輛。

經過不斷模擬、測試、驗證，確認系統(tǒng)奏效后，NVIDIA與合作伙伴才會將其真正應用于實際道路上。

無論是卡車公司、普通汽車公司還是出租車公司，均可使用這一平臺針對具體車型來定制化自己的軟件。

NVIDIA提供遷移學習工具，允許用戶對模型進行在訓練，并利用TensorRT進行再優(yōu)化。

另外，NVIDIA還開發(fā)了聯(lián)邦學習系統(tǒng)，它對看中數據隱私的行業(yè)都尤為受用。

無論是醫(yī)院、實驗室還是汽車公司，在開發(fā)訓練神經網絡后，可以只將訓練處理后的結果上傳到一些全球服務器中，同時將數據保留在本地，保證數據隱私。

游戲：與騰訊合作推出START云游戲服務

《我的世界》是全球最賣座的電子游戲，最近在中國已達到3億注冊用戶，NVIDIA和微軟共同宣布《我的世界》將支持實時光線追蹤（RTX）技術。當前NVIDIA RTX技術已被多個業(yè)界最流行的渲染平臺所支持。

現(xiàn)場，黃仁勛宣布了6款支持RTX的游戲：

（1）《暗影火炬》，由上海鈦核網絡開發(fā)；

（2）《Project X》（項目代號），由米哈游開發(fā)；

（3）《無限法則》，由騰訊北極光工作室群開發(fā)；

（4）《軒轅劍柒》，由大宇資訊開發(fā)；

（5）《鈴蘭計劃》，由龍之力科技開發(fā)；

（6）《邊境》，由柳葉刀科技開發(fā)。

人們想要更輕便、輕薄的游戲筆記本，對此NVIDIA創(chuàng)造Max-Q設計，將超高GPU能和總體系統(tǒng)優(yōu)化集于一身，使得功能強大的GPU可用于輕薄筆記本。

今年，中國游戲筆記本發(fā)貨量超過500萬臺，五年內增加4倍，其中GeForce RTX Max-Q筆記本電腦是增速最快的游戲平臺。

此外，黃仁勛宣布騰訊與NVIDIA合作推出START云游戲服務，在中國將電腦游戲體驗引入云端。

NVIDIA GPU將為騰訊START云游戲平臺提供支持，騰訊計劃擴展該平臺供數百萬玩家使用，為他們提供和本地游戲主機一致的游戲體驗，即便使用性能不足的終端也無損體驗。

NVIDIA RTX平臺包含40多個面向內容工作者打造的產品，涵蓋從配備GeForce RTX 2060的Max-Q輕薄筆記本，到配備4路SLI Quadro RTX 8000的工作站和配備8路RTX 8000的服務器。

黃仁勛宣布，瑞云云渲染平臺將配備NVIDIA RTX GPU，首批5000片RTX GPU將在2020年上線。

這是全亞洲最大的云渲染平臺，渲染了2019年中國三大熱門電影《戰(zhàn)狼2》、《哪吒和《流浪地球》，超過85%的中國電影工作室都是瑞云的客戶。

黃仁勛還發(fā)布了面向建筑行業(yè)（AEC）的Omniverse開放式3D設計協(xié)作平臺，本地和云端均支持在AEC工作流中增加實時協(xié)作功能，將支持Autodest REVIT、Trimble SketchUP和McNeel Rhino等主流AEC應用。

現(xiàn)場展示了使用OMNIVERSE AEC的Demo，中國華潤大廈由KPF建筑師事務所設計，在配備了8路RTX 8000的服務器上進行實時渲染。

HPC：面向基因組測序推出CUDA加速的基因組分析工具包

NVIDIA在HPC方面的應用也很豐富。比如計劃2030年將人類送上火星的NASA，在NVIDIA GPU上通過FUN3D流體力學軟件運行了數十萬次火星著陸場景模擬，生成150TB 的數據。

面向基因組測序，黃仁勛發(fā)布CUDA加速的基因組分析工具包NVIDIA Parabricks。

Parabricks可與用于發(fā)現(xiàn)變異，并能產生與行業(yè)標準GATK最佳實踐流程一致的結果，可實現(xiàn)30-50倍的加速，并提供DeepVariant工具，利用深度學習技術進行基因變異檢測。

黃仁勛說，很高興宣布華大基因已采用Parabricks，通過借助若干GPU服務器，可按其測序儀生成數據的速率來處理基因組。

據他介紹，NVIDIA 今年為CUDA增加5G vRAN和基因組兩個新主流應用，已得到愛立信和華大基因等行業(yè)領導者的支持。

另外，黃仁勛也再次提到此前已公布NVIDIA GPU和Arm的合作，現(xiàn)已支持用CUDA加速Arm服務器，并已公布基于Arm的首個參考架構NVIDIA HPC for ARM，可使用各種基于Arm的HPC服務器進行配置。

TensorFlow現(xiàn)已支持在Arm上加速，借助NVIDIA CUDA on ARM，TensorFlow可實現(xiàn)世界一流的性能和擴展能力。

結語

2019年已經接近尾聲，NVIDIA也在本次大會上，不僅大秀AI、汽車、游戲和HPC能力，也曬出了多個領域的朋友圈。

黃仁勛說，隨著摩爾定律的終結，GPU加速計算將成為未來的發(fā)展方向，這一點現(xiàn)已得到公認。

NVIDIA可實現(xiàn)單線程處理和并行多線程處理的加速，并通過整個軟件堆棧進行優(yōu)化，使得多GPU和多節(jié)點系統(tǒng)實現(xiàn)難以置信的性能。NVIDIA已售出15億塊GPU，每塊GPU都兼容同一個架構CUDA。

作為迄今AI深度學習紅利的最大受益者，NVIDIA以高性能的軟硬件和系統(tǒng)為基礎，持續(xù)豐富其AI和自動駕駛生態(tài)，而找到核心場景加速落地仍是當下的重頭戲。

感謝閱讀。點擊關注上船，帶你浪在科技前沿~

人妻少妇乱子伦精品_日韩人妻潮喷视频网站_日本最新最全无码不卡免费_日韩AV无码中文

黃仁勛推新自動駕駛芯片！性能飆7倍，牽手BAT滴