利来w66娱乐-国际利来利来w66娱乐-国际利来

利来w66官网有限公司
w66利来

英特尔阳光湾建筑是“引人注目”:10纳米具有很大的权力。

    原标题:英特尔阳光湾建筑非常“引人注目”:10纳米加上最近几天的建筑日活动中大量坚固的材料,

    原标题:英特尔阳光湾建筑非常“醒目”:10纳米加上很多材料

    在最近的建筑日上,英特尔公布了未来几年CPU和GPU体系结构的路线图,以及一系列相关技术和战略规划,非常引人注目。其中,新的CPU体系结构是许多人非常关注的焦点。本文收集了一些信息,并尽可能地为您做了一些简单的解释。

    从2019年到2021年的三年里,英特尔每年都会推出新一代的高性能核心架构(它也会是最强大的),从2019年到2023年,英特尔将推出三代低功耗的Atom架构,当然重点放在前者。

    2019年新建的高性能建筑是阳光湾。CPU大幅度升级并集成了第11代核心图形卡。它是由10纳米工艺和桌面处理器代码冰湖制造。这也将是英特尔第一批批批量生产的10纳米产品。

    2020年的Willow Cove(Willow Bay)几乎可以肯定为10nm工艺,但是它应该像14nm和14nm一样被优化和改进,2021年的金湾(Golden Bay)应该被优化和改进。我想知道它是否能用7纳米。

    对于Willow Cove和Golden Cove,英特尔只是简单地提到了一些主要特性,而对于Sunny Cove,它就在眼前,英特尔毫不犹豫地透露了很多建筑细节。

    首先,在新产品发布前N个月,英特尔应该首次慷慨地公布路线图和技术细节。此外,10nm新技术将首次大规模应用。因此,一旦10nm的阳光湾宣布,它将吸引业界甚至普通用户的广泛关注。

    每当宣布新一代CPU体系结构时,理解它的原理和变化就令人兴奋。英特尔提前发布了一系列故事,也值得称赞和品味。

    不幸的是,英特尔目前的信息不完整。主要介绍Sunny Cove体系结构的后端设计细节,不涉及指令调度、指令队列等前端部分。

    Sunny Cove的体系结构更新可以分为两部分,一部分是通用性能改进,另一部分是专用性能改进。

    通用性能的改进是通过体系结构增强来提高大量应用程序的性能和效率。几乎每个人都可以在日常生活中体验它。其实质是改变原IPC的吞吐量(每时钟周期的指令数),或者提高运行频率。

    无论哪个进程节点,只要这两点有所改进,总体性能都会提高,至少在计算方面会直接反映出来。

    频率通常取决于过程和优化。IPC可以来自更宽、更深和更智能的核心,或者专业地说,每个时钟周期执行更多的指令,每个时钟周期运行更多的并行,并通过前端更好地传输数据。

    特定用途的性能改进是扩展特定使用场景和算法的体系结构,包括新的指令集、新的软件编译器/库等。

    这种变化只有在特殊场合才能实现,如英特尔通过新增加的指令集推广Sunny Cove体系结构,这可以将7-Zip软件的压缩和解压缩性能提高75%。这是一个典型的例子。只有用这种软件或其他软件针对相应的指令进行优化,才能实现这种显著的改进。

    虽然专用性能改进的应用范围有限,但只要给它一定的空间,其效果就极其显著,远远超过通用性能改进。

    Sunny Cove在这方面也做了很多改进,包括人工智能/机器学习、加密和解密、压缩/解压缩、通信/网络、通用SIMD(单指令多数据流)/向量处理、专用SIMD/向量处理、多线程和多代理处理等。

    如果您有这些应用程序,Sunny Cove带来的变化将是相当大的。

    首先,有一些大的应用领域。具体地说,每个领域都有更精确的应用程序场景。新指令的引入可以大大加速特定计算任务的执行。通过增加AVX-512指令单元,Sunny Cove将IFMA(Signed Fusion Addition,签名融合添加)添加到大量操作中,这也可以用于加密和解密。

    同时,矢量AES加密(支持AES指令的更多并行执行)、矢量乘法(矢量无载波乘法)、Galois.、SHA/SHA-NI安全算法等都是密码学的基本要素。

    在缓存方面,Sunny Cove后端具有48KB级别的数据缓存,比当前32KB级别高50%。一般来说,缓存的非命中率与容量增加的平方根成反比,也就是说,Sunny Cove主数据缓存的命中错误率将减少22%。

    Sunny Cove的二级缓存也更大,但是具体的容量还没有公开。目前,Core是每个核心一个256KB的二级缓存,最强的是1MB。

    此外,微操作(uOp)缓存比当前的2048条目设计大,尽管目前没有公开具体数目。

    辅助TLB也增加到一个未知数,这有助于机器历史地址转换。通常,当需要维护和存储更多的轮询时,就会进行此操作,这意味着Intel发现在某些应用程序环境中,最新的机器地址在使用之前已被撤回。

    这个图表显示了更多的变化,包括执行端口从8增加到10,这允许调度器一次发布更多的指令。端口4和9连接到循环数据存储、带宽加倍、AGU(地址生成单元)存储容量加倍,并且更大的第一级指令缓存也发挥作用。

    以前Skylake架构存在一个瓶颈。当所有三个AGU尝试存储时,带宽明显不足,只能执行一个时钟周期。

    负载性能保持不变,而宽度调度从4增加到5,这意味着记录缓冲区的分配可以达到每个时钟周期5个指令,但是实际效果仍然有待观察。

    Sunny Cove和Skyake架构的执行端口已经发生了根本的变化。

    如您所见,Intel的核心整数部分配备了更多用于内存寻址计算的LEA(有效地址加载)单元,当需要频繁的内存计算来帮助高性能阵列代码时,这可以通过安全更新或通过常数偏移来减轻性能损失。

    MUL(乘法)单元从Skylake端口5转移到端口1,可能是为了平衡设计,并且添加了iDIV整数除法单元。

    这不是什么大变化。10nmCannon Lake还具有64位IDIV,它可以将64位证书从97个时钟周期(混合指令)降低到18,Sunny Coveke也可以是类似的。

    在INT整数运算方面,Skylake端口5的乘法单元已经变成MulHi单元,但是其在新架构中的具体作用还不清楚。

    在FP浮点计算中,Sunny Cove增加了重排资源,因为Intel收到了客户反馈,希望消除代码中的瓶颈。

    英特尔没有指定核心浮点FMA单元的功能,但我们知道核心中有一个AVX-512指令单元,因此至少一个FMA单元将与其交互。

    加农湖架构只有一个512位FMA单元,这很可能在这里扩展,在最强的意义上有两个。

    为了更清楚地比较Skylake和Sunny Cove的后端执行资源的变化,国外媒体AnandTech也做了一个比较表如下:

    Intel列出的其他核心改进包括分支预测器的改进、有效负载延迟的降低(由于TLB/L1D)等等,但是Intel也承认,这些改进不会使每个人都受益,并且要求在特定代码中使用新算法。

    此外,Sunny Cove还支持更大的内存。主存储器分页以五层设计(以前的四层设计)显示,它支持57位线性寻址空间和52位物理寻址空间。

    这意味着,理论上,在强大的服务器平台上,每个处理器可以匹配多达4TB的内存,而Skyl.-SP架构现在只能扩展到1.5TB,AMD Xiaolong只有2TB。

    事实上,自从AMD在2003年引入x86-64位体系结构以来,Sunny Cove是第一个对x64虚拟内存寻址进行重大改变的体系结构。

    在过去十年中,虽然虚拟存储器寻址已经支持64位,但是实际上只有前48位是有用的,而后16位只是前端的简单副本,这限制了虚拟寻址空间为256TB。

    这些虚拟内存通过分页表映射到物理内存,这限制了物理内存寻址到48位,导致整个系统的最大物理内存不能超过256TB。

    现在,Sunny Cove将有效的虚拟内存寻址扩展到57位,物理寻址扩展到52位。因此,虚拟内存和物理内存可以分别支持128PB和4PB。

    根据英特尔之前的路线图,新一代的冰湖SP系列将在2020年上市,届时存储器的扩展能力将是史无前例的。

    顺便说一下,在安全性方面,Sunny Cove支持多密钥全内存加密和用户模式指令预防。

    至于Sunny Cove前端的变化,我们期待英特尔提供更多信息。

    阳光湾充满了意境:虽然这张照片中的天空不是很晴朗,但是海湾真的很美。

    注:本文中的一些文字和图片是参考国外媒体AnandTech和Artchnica的报道。

欢迎阅读本文章: 雷益群

w66利来官网地址

利来w66官网有限公司