当前位置:首页 >> 中医减肥 >> 芯片两大,都想“干掉”工程师!

芯片两大,都想“干掉”工程师!

发布时间:2024-01-25

该方式上允许每个作法访问完全一致的聚类网络列表超平面图,在所有作法中都(这样一来地)应用于完全一致的超参数。每种作法进行时摆放后(仅限于RePlAce的有权迭代),将宏电条带中都,冻结宏所在位置,并应用于商贸EDA辅助工具摆放标准模组并报告之后结果。

平面图1:搜索引擎借助强化求学造成结果的分析报告指导工作方式上

(;也:搜索引擎)

将搜索引擎的作法与最先进的作法(RePlAce14)以及应用于服务业标准EDA辅助工具的手动摆放透过比较。具体内容比较的测试作法有耗费的时间段、总的覆盖面积、时脉、中央线窄等等,对于该表中都的所有测试作法,越低越好。可以看成,搜索引擎的强化求学作法皆比不上其他两种。

(;也:搜索引擎)

搜索引擎的分析团队透露,随着智能接触到格外多数量和种类的中央处理机,它可以通过不断地培训求学,都会格外慢速格外好地为新中央处理机块转化成最佳化格局,虽然我们主要在搜索引擎更慢速机中央处理机 (TPU) 上转化成最佳化的格局,但我们的作法等同于于任何类型ASIC中央处理机。

英伟达DREAMPlace商贸化绕过有望

在更慢速格局特别,现有的立体化化指导工作主要是应用于分区的硬件CPU。随着中央线程数量的增加,飞行速度在5倍将近就饱和了,而且典型的密度下降2-6%。英伟达的工程的公司探险了借助GPU来更慢速深入分析中心在位置格局。

传统习俗的深入分析格局引擎共同开发必须耗费大量的精力用C++构建整个软件堆栈,因此,由于共同造价的难题,外观设计和正确性新格局迭代的最低标准极为高。于是,英伟达借助广度求学辅助工具包PyTorch,通过少量的编程指导工作,共同开发了一个一新具有GPU更慢速的Linux格局引擎——DREAMPlace,这是一个比较成名的Linux格局机。它通过高效的GPU构建的这两项操作系统的深入分析格局,如导中央线总窄度和表覆盖面积量化等

该开放性是用Python共同开发的,PyTorch应用于最佳化最佳化计算机系统和API, C++ /CUDA应用于都从可用人员。DREAMPlace计算机系统运营在基于Volta指令集的40核Intel E5-2698 v4 @2.20GHz和一个Nvidia Tesla V100 GPU的Linux服务机端上,它通过抛成深入分析格局难题来体能训练建模。

DREAMPlace的软件指令集如平面图a右平面图,整体而言格局点阵平面图如下平面图b右平面图

(平面图源:英伟达)

在与最先进的世界格局迭代后代ePlace/RePlAce的对比中都,DREAMPlace在1]格局和片面特别构建了30倍以上的更慢速,且未理论和钢铁工业标准的密度下降。格外具体内容的来说,它能使100万个模组的外观设计在1分钟内就能进行时。英伟达探险了应用于向前和向后传布的都从可用符的完全一致构建(前向传布来量化目标,后向传布来量化梯度),以格外高整体而言高效率。

上表2和表3分别结果显示了ISPD 2005和钢铁工业标准的HPWL和运营时具体内容内容。表2结果显示,在几乎完全一致的消除方案密度(平皆0.2%的相似之处)下,与RePlAce的40个中央线程相比较,DREAMPlace在GP的两个标准套件上能够构建35倍和43倍的更慢速。

此外,DREAMPlace是过后性可扩大的,可以通过简单地改写高级编程语言(如Python)来原属一新迭代/求解法机和一新目标,其钢铁工业外观设计可达1000万个模组。英伟达计划进一步分析模组膨胀的可路由性和时间段最佳化的自在计量,以及GPU更慢速的详述格局。它还可以扩大到借助多GPU应用软件来进一步更慢速。由于DREAMPlace分离了高级迭代外观设计符号和都从更慢速指导工作,因此它显著降低了共同开发和维护开销。英伟达的这项指导工作将为重新审视经典的EDA难题开辟一新方向。

但是,由于其对中央线窄和表覆盖面积的关注有限,DREAMPlace的格局密度没有与商贸辅助工具相比较,这使得它很难等同于于钢铁工业外观设计方式上。为了消除这一难题,英伟达生物学家近日的一项分析篇甫章中都了一种新作法-DREAM-GAN,这是一种应用于转化成对抗求学绕过 DREAMPlace的格局最佳化开放性。DREAM-GAN的小得多优势在于,它使DREAMPlace能够朝着辅助工具正确性(和最佳化)的方向最佳化最上层所在位置,而无需明确了解法商贸辅助工具的除此以外迭代。DREAMPlace通过最佳化鉴别机的反向,格外高了其商贸化的所在位置。

DREAM-GAN

试验中表明DREAM GAN不仅在摆放前期立即改善了主要的PPA测试作法,而且还事实证明这些改进一直过后到路由后前期,在路由后前期,无中央线总窄度格外高了8.3%,总额定功率格外高了7.4%。

DREAMPlace与DREAM-GAN在各主要PD前期的详述PPA比较结果。在这项指导工作中都,我们应用于Synopsys ICC2制订整个PD,除了1]摆放由DREAMPlace(左列)或DREAM-GAN(右列)制订。在所有商贸和OpenCore标准测试中都,两种作法在1]格局上的运营时相似之处不超过2分钟。

此外,Nvidia生物学家近日在国际生物学外观设计研讨都会上展示了AutoDMP的分析论甫,AutoDMP 是应用于 TILOS AI 分析中心的宏格局标准透过分析报告的,其中都仅限于带有大量宏的CPU和AI更慢速机外观设计。为了透过分析报告,AutoDMP与商贸EDA辅助工具集成在一起,如下平面图右平面图。首先,在NVIDIA DGX系统都会上运营多目标贝叶斯最佳化。该系统都会有4个A100 GPU,每个都搭载了80Gb的HBM甫件系统。转化成16个立体化进程以采样参数并在最佳化其间运营DREAMPlace。然后,从Pareto前端选择的宏所在位置被仅限于给运营在CPU服务机端上的TILOS仅限于的EDA Flow。在大多数外观设计中都,AutoDMP的PPA测试作法结果——中央线窄、额定功率、最差负裕量 (WNS) 和总负裕量 (TNS)——等于或比不上商贸方式上。

AutoDMP的量化方式上

应用的发展是把“双刃剑”。一特别,智能可以通过求学已有的中央处理机外观设计数据库来发现规律,并通过深入分析数据库,仅限于格外较慢、格外可靠的中央处理机外观的设计。同时,智能应用还可以格外高中央处理机外观设计的高效率,缩短共同开发时间段,减缓成本。

但另一特别,随着AI应用的不断发展和成熟,一些未那么有行销的都从、平凡的指导工作可能都会被智能摒弃。正如上甫所述,在中央处理机格局这项指导工作中都,多年来主要是靠人工来进行时,虽然目前为止的AI应用还有一些局限性,但随着应用的不断改进和超越,将或多或少的减缓中央处理机外观设计过程中都对手动特别的需求,虽然这格外高了整体而言高效率,但有可能都会端掉均工程的公司的饭碗。

不过我们也不必焦虑,回看四次钢铁工业革命,每一次钢铁工业革命都有一些指导工作、工人或工程的公司被摒弃,但是也都会创造成新型工程的公司,之后强化了我们的生产力。回归到中央处理机外观设计这一服务业,AI的介入不都会实质上摒弃人工,因为就实际情况而言,服务业仍必须能够在外观设计过程中都可靠正确性和借助 AI 辅助工具和迭代的个人。这一发展对于英才的深远影响是,格外高IC外观设计人员在服务业中都的实用性,使他们腾成格外多的时间段来个人兴趣于格外精细和格外具创造性的外观设计特别,并之后生产成格外好的产品。

借助智能应用来试图外观设计和制造者中央处理机之前带入大势所趋。不仅是搜索引擎和英伟达,EDA软件辅助工具仅限于商Synopsys、西门子和Cadence等的公司也在其最新辅助工具中都应用于了AI应用,将AI应用扩大中央处理机制造者等等。这些AI/ML应用作法的扩大,将为绕过超大规模电子元件格局仅限于一新方向,也将带入摩尔定律再运营几年的潜在途径之一。

参考资料

【1】、《A graph placement methodology for fast chip design》

【2】、《DREAMPlace: Deep Learning Toolkit-Enabled GPU Acceleration for Modern VLSI Placement》

【3】、《DREAM-GAN: Advancing DREAMPlace towards Commercial-Quality using Generative Adversarial Learning》

眼睛酸痛怎么才能快速缓解
类风湿关节疼痛吃什么药管用
蒙脱石散止泻效果好吗
胸腺法新
新必奇蒙脱石散和妈咪爱的作用一样吗
标签:
友情链接: