1
1
mirror of https://github.com/foxsen/archbase.git synced 2026-02-11 14:15:54 +08:00

gs464v => la464

GS464v => LA464
This commit is contained in:
Zhang Fuxin
2021-11-02 21:45:06 +08:00
parent 9fae8fe267
commit ae64014380
3 changed files with 6 additions and 6 deletions

View File

@@ -305,15 +305,15 @@ Intel TSXTransactional Synchronization Extensions是Intel公司针对事
### 龙芯3A5000处理器
龙芯3A5000于2020年研制成功是龙芯中科技术股份有限公司研发的首款支持龙芯自主指令集LoongArch的通用多核处理器主要面向桌面计算机和服务器应用。龙芯3A5000片内集成4个64位GS464V高性能处理器核、16MB的分体共享三级Cache、2个DDR4内存控制器支持DDR4-3200、2个16位HTHyperTransport控制器、2个I2C、1个UART、1个SPI、16路GPIO接口等。龙芯3A5000中多个GS464V核及共享三级Cache模块通过AXI互连网络形成一个分布式共享片上末级Cache的多核结构。采用基于目录的Cache一致性协议来维护Cache一致性。另外龙芯3A5000还支持多片扩展将多个芯片的HT总线直接互连就形成更大规模的共享存储系统最多可支持16片互连
龙芯3A5000于2020年研制成功是龙芯中科技术股份有限公司研发的首款支持龙芯自主指令集LoongArch的通用多核处理器主要面向桌面计算机和服务器应用。龙芯3A5000片内集成4个64位LA464高性能处理器核、16MB的分体共享三级Cache、2个DDR4内存控制器支持DDR4-3200、2个16位HTHyperTransport控制器、2个I2C、1个UART、1个SPI、16路GPIO接口等。龙芯3A5000中多个LA464核及共享三级Cache模块通过AXI互连网络形成一个分布式共享片上末级Cache的多核结构。采用基于目录的Cache一致性协议来维护Cache一致性。另外龙芯3A5000还支持多片扩展将多个芯片的HT总线直接互连就形成更大规模的共享存储系统最多可支持16片互连
GS464V是支持Loongarch指令集的四发射64位高性能处理器核具有256位向量部件。GS464V的结构如图\@ref(fig:gs464v-uarch)所示主要特点如下四发射超标量结构具有四个定点、两个向量、两个访存部件支持寄存器重命名、动态调度、转移预测等乱序执行技术每个向量部件宽度为256位可支持8个双32位浮点乘加运算或4个64位浮点运算一级指令Cache和数据Cache大小各为64KB4路组相联牺牲者CacheVictim Cache作为私有二级Cache大小为256KB16路组相连支持非阻塞Non-blocking访问及装入猜测Load Speculation等访存优化技术支持标准的JTAG调试接口方便软硬件调试。
LA464是支持Loongarch指令集的四发射64位高性能处理器核具有256位向量部件。LA464的结构如图\@ref(fig:la464-uarch)所示主要特点如下四发射超标量结构具有四个定点、两个向量、两个访存部件支持寄存器重命名、动态调度、转移预测等乱序执行技术每个向量部件宽度为256位可支持8个双32位浮点乘加运算或4个64位浮点运算一级指令Cache和数据Cache大小各为64KB4路组相联牺牲者CacheVictim Cache作为私有二级Cache大小为256KB16路组相连支持非阻塞Non-blocking访问及装入猜测Load Speculation等访存优化技术支持标准的JTAG调试接口方便软硬件调试。
```{r gs464v-uarch, fig.cap='GS464V处理器核结构', fig.align='center', echo = FALSE, out.width='100%'}
knitr::include_graphics('./images/chapter11/gs464v_uarch.png')
```{r la464-uarch, fig.cap='LA464处理器核结构', fig.align='center', echo = FALSE, out.width='100%'}
knitr::include_graphics('./images/chapter11/la464_uarch.png')
```
龙芯3A5000芯片整体架构基于多级互连实现结构如图\@ref(fig:ls3a5000-arch)所示(图\@ref(fig:ls3a5000-layout)为芯片版图。第一级互连采用5x5的交叉开关用于连接四个GS464V作为主设备、四个共享Cache模块作为从设备、以及一个IO端口连接IO-RING。IO端口使用一个Master和一个Slave。第二级互连采用5x3的交叉开关连接4个共享Cache模块作为主设备两个DDR3/4内存控制器、以及一个IO端口连接IO-RING。IO-RING连接包括4个HT控制器MISC模块SE模块与两级交叉开关。两个HT控制器lo/hi共用16位HT总线作为两个8位的HT总线使用也可以由lo独占16位HT总线。HT控制器内集成一个DMA控制器DMA控制器负责IO的DMA控制并负责片间一致性的维护。上述互连结构都采用读写分离的数据通道数据通道宽度为128bit与处理器核同频用以提供高速的片上数据传输。此外一级交叉开关连接4个处理器核与Scache的读数据通道为256位以提高片内处理器核访问Scache的读带宽。
龙芯3A5000芯片整体架构基于多级互连实现结构如图\@ref(fig:ls3a5000-arch)所示(图\@ref(fig:ls3a5000-layout)为芯片版图。第一级互连采用5x5的交叉开关用于连接四个LA464核作为主设备、四个共享Cache模块作为从设备、以及一个IO端口连接IO-RING。IO端口使用一个Master和一个Slave。第二级互连采用5x3的交叉开关连接4个共享Cache模块作为主设备两个DDR3/4内存控制器、以及一个IO端口连接IO-RING。IO-RING连接包括4个HT控制器MISC模块SE模块与两级交叉开关。两个HT控制器lo/hi共用16位HT总线作为两个8位的HT总线使用也可以由lo独占16位HT总线。HT控制器内集成一个DMA控制器DMA控制器负责IO的DMA控制并负责片间一致性的维护。上述互连结构都采用读写分离的数据通道数据通道宽度为128bit与处理器核同频用以提供高速的片上数据传输。此外一级交叉开关连接4个处理器核与Scache的读数据通道为256位以提高片内处理器核访问Scache的读带宽。
龙芯3A5000主频可达2.5GHz,峰值浮点运算能力达到160GFLOPS。

View File

Before

Width:  |  Height:  |  Size: 258 KiB

After

Width:  |  Height:  |  Size: 258 KiB

View File

@@ -3,7 +3,7 @@
上市时间,2021,2017,2019
工艺,12nm,14nm,14nm
指令集,LoongArch,X86-64,X86-64
微结构型号,GS464V,Zen1,SkyLake
微结构型号,LA464,Zen1,SkyLake
频率,2.5GHz,2.5GHz,2.5GHz
内存类型和频率,DDR4 3200MHz,DDR4 3200MHz,DDR4 2400MHz
Cache层次,"64KB以及ICache
1 厂商 Loongson AMD Intel
3 上市时间 2021 2017 2019
4 工艺 12nm 14nm 14nm
5 指令集 LoongArch X86-64 X86-64
6 微结构型号 GS464V LA464 Zen1 SkyLake
7 频率 2.5GHz 2.5GHz 2.5GHz
8 内存类型和频率 DDR4 3200MHz DDR4 3200MHz DDR4 2400MHz
9 Cache层次 64KB以及ICache 64KB一级DCache 256KB二级Cache 16MB三级Cache 64KB一级ICache 32KB一级DCache 512KB二级Cache 8MB三级Cache 32KB一级ICache 32KB一级DCache 256KB二级Cache 6MB三级Cache