人妻少妇乱子伦精品_日韩人妻潮喷视频网站_日本最新最全无码不卡免费_日韩AV无码中文

當前位置: 首頁 > 科技新聞 >

黃仁勛推新自動駕駛芯片!性能飆7倍,牽手BAT滴

時間:2019-12-19 15:03來源:網絡整理 瀏覽:
看點:黃教主拋12項硬核更新!聚焦AI、自動駕駛、游戲、HPC四大方向。智東西12月18日蘇州報道,又到了一年一度的NVIDIA GTC C

看點:黃教主拋12項硬核更新!聚焦AI、自動駕駛、游戲、HPC四大方向。

智東西12月18日蘇州報道,又到了一年一度的NVIDIA GTC China大會,這次,NVIDIA創(chuàng)始人兼CEO黃仁勛將焦點放在四大主題:人工智能(AI)、汽車、游戲和HPC。

黃仁勛說,這是迄今為止最大規(guī)模的GTC China,與會人數達到6100,較三年前的2400人增加250%。


黃仁勛宣布一系列NVIDIA新品及合作進展,核心內容如下:

1、百度、阿里使用NVIDIA AI平臺做推薦系統(tǒng);

2、推出第七代推理優(yōu)化軟件TensorRT 7,進一步優(yōu)化實時會話式AI,T4 GPU上推理延遲是CPU的1/10;

3、NVIDIA AI推理平臺在全世界范圍內得到了廣泛的應用;

4、推出軟件定義的AV平臺、新一代自動駕駛和機器人SoC Orin,算力達200TOPS,計劃于2022年開始投產;

5、向交通運輸行業(yè)開源NVIDIA DRIVE自動駕駛汽車深度神經網絡,在NGC上推出NVIDIA DRIVE預訓練模型;

6、滴滴將在數據中心使用NVIDIA GPU訓練機器學習算法,并采用NVIDIA DRIVE為其L4級自動駕駛汽車提供推理能力;

7、推出全新版本NVIDIA ISAAC軟件開發(fā)套件SDK,為機器人提供更新AI感知和仿真功能;

8、宣布六款支持RTX技術的游戲;

9、騰訊與NVIDIA合作推出START云游戲服務,在中國將電腦游戲體驗引入云端;

10、宣布全亞洲最大云渲染平臺瑞云云渲染平臺將配備NVIDIA RTX GPU,首批5000片RTX GPU將在2020年上線;

11、發(fā)布面向建筑行業(yè)(AEC)的Omniverse開放式3D設計協(xié)作平臺;

12、面向基因組測序,黃仁勛發(fā)布CUDA加速的基因組分析工具包NVIDIA Parabricks。

AI:入駐百度阿里推薦系統(tǒng),推出新一代TensorRT軟件

自2012年Alex Krivzhevsky使用NVIDIA Kepler GPU贏得ImageNet競賽以來,NVIDIA在5年內將訓練性能提升300倍。

借助Volta、新Tensor Core GPU、Chip-on-wafer封裝、HBM 3D堆棧存儲器、NVLink和DGX系統(tǒng)組合,NVIDIA正助力更多AI研究。


AI將從云擴展到邊緣,NVIDIA正為以下每種用例分別打造一個平臺:用于訓練的DGX,用于超大規(guī)模云的HGX,用于邊緣的EGX和用于自治系統(tǒng)的AGX。

1、百度、阿里推薦系統(tǒng)采用NVIDIA GPU

黃仁勛說,互聯(lián)網一個最重要的機器學習模型是推薦系統(tǒng)模型。

沒有推薦系統(tǒng),人們就無法從上億次網頁檢索、幾十億淘寶商品、幾十億抖音短視頻、各種網絡新聞、推文和照片中找到自己需要的內容。

深度學習可實現(xiàn)自動特征學習,支持非結構化內容數據,通過加速縮短延遲并提高吞吐率。

總體來看,做推薦系統(tǒng)面臨兩大挑戰(zhàn):海量數據帶來的復雜模型處理任務,以及讓用戶立即看到推薦結果的實時性要求。


針對這一問題,百度提出AI-Box解決方案來訓練高級的大規(guī)模推薦系統(tǒng)。

百度AI-Box是Wide and Deep結構,采用NVIDIA AI平臺,基于NVIDIA GPU訓練TB級數據,速度比CPU更快的同時,訓練成本僅有CPU的1/10,且支持更大規(guī)模的模型訓練。


同樣,阿里做的推薦系統(tǒng)也選用了NVIDIA AI平臺。

今年“雙十一”當日,阿里的銷售額超過了380億美元的商品,電商網站上共列出約20億類商品,有5億用戶在購物,一天銷售額達2684億,每秒幾十億次推薦請求。

如果一位用戶花1秒看1個產品,那么看完所有商品要花32年的時間。

對此,阿里使用NVIDIA T4 GPU來訓練推薦系統(tǒng),這使得每當用戶點擊一個商品,就會看到其他相關推薦商品。

原先使用CPU速度較慢,僅3QPS,而NVIDIA GPU將速度提升至780QPS。

2、推出第七代推理優(yōu)化軟件TensorRT

現(xiàn)場,黃仁勛宣布正式推出第七代推理優(yōu)化編譯器TensorRT 7,支持RNN、Transformer和CNN。


TensorRT是NVIDIA針對神經網絡推理階段提供的加速軟件,它能通過提供優(yōu)化的AI模型來大幅提升性能。

去年在GTC China大會上發(fā)布的TensorRT 5僅支持CNN,只支持30種變換,而TensorRT 7面向Transformer和RNN做了大量優(yōu)化,能以更少內存實現(xiàn)高效運算,并支持1000多種計算變換和優(yōu)化。

TensorRT 7能融合水平和垂直方向的運算,可為開發(fā)者設計的大量RNN配置自動生成代碼,逐點融合LSTM單元,甚至可跨多個時間步長進行融合,并盡可能做自動低精度推理。

此外,NVIDIA在TensorRT 7中引入一個內核生成功能,用任何RNN可生成一個優(yōu)化的內核。


會話式AI是TensorRT 7強大功能的典型代表。

其功能非常復雜,比如一個用戶用英文說了一句話,要把它翻譯成中文,這個過程需要先將英文口語轉化成文字,理解這段文字,然后轉化成想要的語言,再通過語音合成將這段文字轉化成語音。

一套端到端會話式AI的流程可能由二三十種模型組成,用到CNN、RNN、Transformer、自編碼器、NLP等多種模型結構。

推理會話式AI,CPU的推理延遲是3秒,現(xiàn)在使用TensorRT 7在T4 GPU上推理僅0.3s就完成,比CPU快10倍。

3、NVIDIA AI平臺得到廣泛的應用


另外,快手、美團等互聯(lián)網公司也在用NVIDIA AI平臺做深度推薦系統(tǒng),以提高點擊率,并降低延遲和提高吞吐量,更好理解和滿足用戶需求。

例如,美團用戶想找一個餐廳或者是找酒店,都是通過用戶的搜索來實現(xiàn)的。

會話式AI需要可編程性、豐富的軟件推展及低GPU延遲。包含這些模型在內的NVIDIA AI平臺將為智能云提供支持。

NVIDIA EGX是面向邊緣AI應用打造的一體化AI云,專為流式AI應用程序、Kubernetes容器編排、保護動態(tài)數據和靜態(tài)數據安全而打造,已連接到所有物聯(lián)網云。

比如,沃爾瑪使用它進行智能結賬,美國郵政服務在EGX上通過計算機視覺分類郵件,愛立信將在EGX服務器上運行5G vRAN和AI物聯(lián)網。

推出新一代汽車SoC,算力200TOPS

NVIDIA DRIVE是一個端到端AV自動駕駛平臺,該平臺由軟件定義,而非固定功能的芯片,使得大量開發(fā)人員可按照持續(xù)集成、持續(xù)交付的開發(fā)方式進行協(xié)作。

黃仁勛表示,將在NGC容器注冊上,向交通運輸行業(yè)開源NVIDIA DRIVE自動駕駛汽車深度神經網絡。

1、下一代自動駕駛處理器ORIN,算力是Xavier的7倍

NVIDIA發(fā)布NVIDIA DRIVE AGX Orin,它是新一代自動駕駛和機器人處理器SoC,達到了ISO 26262 ASIL-D等系統(tǒng)安全標準,將包含一系列基于單一架構的配置,計劃于2022年開始投產。

Orin凝聚著NVIDIA團隊為期四年的努力,被用于處理多個高速傳感器、感知環(huán)境、創(chuàng)建一個周圍環(huán)境的模型并定義自己、根據特定目標制定合適的行動策略。


它使用了包含8個核心的64位Arm Hercules CPU,有170億個晶體管,再加上全新深度學習和計算機視覺加速器,其性能達到200TOPS,幾乎比上一代的技術(Xavier)提升7倍。

它擁有易編程性,有豐富工具和軟件庫支持,還擁有全新功能安全特性,可使CPU和GPU鎖步運行和提升容錯性。


Orin系列可從L2擴展到L5,與Xavier相兼容,可充分利用原有軟件,因此開發(fā)者能夠在一次性投資后使用跨多代的產品。

其新特性是提高針對OEM的低成本版本,即想用一個單路攝像機做L2級別的AV,同時能利用整個AV產品線中的軟件棧。

除了芯片外,NVIDIA的平臺、軟件等很多技術可應用在汽車中,幫助客戶定制化應用以進一步提升產品的性能。

2、推出NVIDIA DRIVE預訓練模型

黃仁勛還宣布在NGC上推出NVIDIA DRIVE預訓練模型。


一個正常運行的安全自動駕駛技術需要許多AI模型組成,其算法具有多樣性和冗余性。

NVIDIA開發(fā)了先進的感知模型,用于檢測、分類、跟蹤和軌跡預測,還可用于感知、本地化、規(guī)劃和制圖。

這些預訓練模型均可從NGC上注冊下載。

3、滴滴選用NVIDIA自動駕駛和云基礎設施


滴滴出行將使用NVIDIA GPU和其他技術開發(fā)自動駕駛和云計算解決方案。

滴滴將在數據中心使用NVIDIA GPU訓練機器學習算法,并采用NVIDIA DRIVE為其L5級自動駕駛汽車提供推理能力。

今年8月,滴滴將其自動駕駛部門升級為獨立公司,并與產業(yè)鏈合作伙伴開展廣泛合作。

作為滴滴自動駕駛AI處理的一部分,NVIDIA DRIVE借助多個深度神經網絡融合來自各類傳感器(攝像頭、激光雷達、雷達等)的數據,從而實現(xiàn)對汽車周圍環(huán)境360度全方位的理解,并規(guī)劃出安全的行駛路徑。

為了訓練更安全高效的深度神經網絡,滴滴將采用NVIDIA GPU數據中心服務器。

滴滴云將采用新的vGPU許可證模式,旨在為用戶提供體驗更佳、應用場景更豐富、效率更高、更具創(chuàng)新性和靈活的GPU計算云服務。

4、發(fā)布NVIDIA ISAAC機器人SDK


面向機器人領域,黃仁勛宣布推出全新NVIDIA Isaac機器人SDK,大大加快開發(fā)和測試機器人的速度,使機器人能通過仿真獲得由AI驅動的感知和訓練功能,從而可以在各種環(huán)境和情況下對機器人進行測試和驗證,并節(jié)省成本。

Isaac SDK包括Isaac Robotics Engine(提供應用程序框架),Isaac GEM(預先構建的深度神經網絡模型、算法、庫、驅動程序和API),用于室內物流的參考應用程序,并引入Isaac Sim訓練機器人,可將所生成的軟件部署到在現(xiàn)實世界中運行的真實機器人中。

其中,基于攝像頭的感知深度神經網絡有對象檢測、自由空間分割、3D姿態(tài)估計、2D人體姿態(tài)估計等模型。

全新SDK的對象檢測也已通過ResNet深度神經網絡進行了更新,可以使用NVIDIA的遷移學習工具包對其進行訓練,使添加新對象進行檢測和訓練新模型更加容易。

另外,該SDK提供了多機器人仿真,開發(fā)人員可將多個機器人放入仿真環(huán)境中進行測試,各個機器人可在共享的虛擬環(huán)境中移動時,運行獨立版本的Isaac導航軟件堆棧。

全新SDK還集成了對NVIDIA DeepStream軟件的支持,開發(fā)人員可在支持機器人應用程序的邊緣AI,部署DeepStream和NVIDIA GPU,以實現(xiàn)對視頻流的處理。

已開發(fā)了自己代碼的機器人開發(fā)人員,可將自己的軟件堆棧連接到Isaac SDK,通過C API訪問路由的Isaac功能,這樣極大程度地減少編程語言轉換。C-API訪問權限同時支持開發(fā)人員在其他編程語言中使用Isaac SDK。

據黃仁勛介紹,國內大學都采用Isaac來教授和研究機器人技術。

5、NVIDIA的汽車生態(tài)圈

NVIDIA在汽車領域已深耕了超過10年,和合作伙伴做了很多的事情,讓AI的大腦能更好的了解、甚至能夠去“駕駛”車輛。


經過不斷模擬、測試、驗證,確認系統(tǒng)奏效后,NVIDIA與合作伙伴才會將其真正應用于實際道路上。

無論是卡車公司、普通汽車公司還是出租車公司,均可使用這一平臺針對具體車型來定制化自己的軟件。

NVIDIA提供遷移學習工具,允許用戶對模型進行在訓練,并利用TensorRT進行再優(yōu)化。

另外,NVIDIA還開發(fā)了聯(lián)邦學習系統(tǒng),它對看中數據隱私的行業(yè)都尤為受用。

無論是醫(yī)院、實驗室還是汽車公司,在開發(fā)訓練神經網絡后,可以只將訓練處理后的結果上傳到一些全球服務器中,同時將數據保留在本地,保證數據隱私。

游戲:與騰訊合作推出START云游戲服務

《我的世界》是全球最賣座的電子游戲,最近在中國已達到3億注冊用戶,NVIDIA和微軟共同宣布《我的世界》將支持實時光線追蹤(RTX)技術。當前NVIDIA RTX技術已被多個業(yè)界最流行的渲染平臺所支持。

現(xiàn)場,黃仁勛宣布了6款支持RTX的游戲:

(1)《暗影火炬》,由上海鈦核網絡開發(fā);

(2)《Project X》(項目代號),由米哈游開發(fā);

(3)《無限法則》,由騰訊北極光工作室群開發(fā);

(4)《軒轅劍柒》,由大宇資訊開發(fā);

(5)《鈴蘭計劃》,由龍之力科技開發(fā);

(6)《邊境》,由柳葉刀科技開發(fā)。


人們想要更輕便、輕薄的游戲筆記本,對此NVIDIA創(chuàng)造Max-Q設計,將超高GPU能和總體系統(tǒng)優(yōu)化集于一身,使得功能強大的GPU可用于輕薄筆記本。

今年,中國游戲筆記本發(fā)貨量超過500萬臺,五年內增加4倍,其中GeForce RTX Max-Q筆記本電腦是增速最快的游戲平臺。


此外,黃仁勛宣布騰訊與NVIDIA合作推出START云游戲服務,在中國將電腦游戲體驗引入云端。

NVIDIA GPU將為騰訊START云游戲平臺提供支持,騰訊計劃擴展該平臺供數百萬玩家使用,為他們提供和本地游戲主機一致的游戲體驗,即便使用性能不足的終端也無損體驗。


NVIDIA RTX平臺包含40多個面向內容工作者打造的產品,涵蓋從配備GeForce RTX 2060的Max-Q輕薄筆記本,到配備4路SLI Quadro RTX 8000的工作站和配備8路RTX 8000的服務器。

黃仁勛宣布,瑞云云渲染平臺將配備NVIDIA RTX GPU,首批5000片RTX GPU將在2020年上線。

這是全亞洲最大的云渲染平臺,渲染了2019年中國三大熱門電影《戰(zhàn)狼2》、《哪吒和《流浪地球》,超過85%的中國電影工作室都是瑞云的客戶。

黃仁勛還發(fā)布了面向建筑行業(yè)(AEC)的Omniverse開放式3D設計協(xié)作平臺,本地和云端均支持在AEC工作流中增加實時協(xié)作功能,將支持Autodest REVIT、Trimble SketchUP和McNeel Rhino等主流AEC應用。


現(xiàn)場展示了使用OMNIVERSE AEC的Demo,中國華潤大廈由KPF建筑師事務所設計,在配備了8路RTX 8000的服務器上進行實時渲染。

HPC:面向基因組測序推出CUDA加速的基因組分析工具包

NVIDIA在HPC方面的應用也很豐富。比如計劃2030年將人類送上火星的NASA,在NVIDIA GPU上通過FUN3D流體力學軟件運行了數十萬次火星著陸場景模擬,生成150TB 的數據。

面向基因組測序,黃仁勛發(fā)布CUDA加速的基因組分析工具包NVIDIA Parabricks。


Parabricks可與用于發(fā)現(xiàn)變異,并能產生與行業(yè)標準GATK最佳實踐流程一致的結果,可實現(xiàn)30-50倍的加速,并提供DeepVariant工具,利用深度學習技術進行基因變異檢測。

黃仁勛說,很高興宣布華大基因已采用Parabricks,通過借助若干GPU服務器,可按其測序儀生成數據的速率來處理基因組。

據他介紹,NVIDIA 今年為CUDA增加5G vRAN和基因組兩個新主流應用,已得到愛立信和華大基因等行業(yè)領導者的支持。

另外,黃仁勛也再次提到此前已公布NVIDIA GPU和Arm的合作,現(xiàn)已支持用CUDA加速Arm服務器,并已公布基于Arm的首個參考架構NVIDIA HPC for ARM,可使用各種基于Arm的HPC服務器進行配置。

TensorFlow現(xiàn)已支持在Arm上加速,借助NVIDIA CUDA on ARM,TensorFlow可實現(xiàn)世界一流的性能和擴展能力。

結語

2019年已經接近尾聲,NVIDIA也在本次大會上,不僅大秀AI、汽車、游戲和HPC能力,也曬出了多個領域的朋友圈。

黃仁勛說,隨著摩爾定律的終結,GPU加速計算將成為未來的發(fā)展方向,這一點現(xiàn)已得到公認。

NVIDIA可實現(xiàn)單線程處理和并行多線程處理的加速,并通過整個軟件堆棧進行優(yōu)化,使得多GPU和多節(jié)點系統(tǒng)實現(xiàn)難以置信的性能。NVIDIA已售出15億塊GPU,每塊GPU都兼容同一個架構CUDA。

作為迄今AI深度學習紅利的最大受益者,NVIDIA以高性能的軟硬件和系統(tǒng)為基礎,持續(xù)豐富其AI和自動駕駛生態(tài),而找到核心場景加速落地仍是當下的重頭戲。

感謝閱讀。點擊關注上船,帶你浪在科技前沿~

推薦內容