本帖最后由 明月高悬 于 2024-10-21 13:18 编辑 - h9 H& s( T" c: J
3 p3 H' X' {, W8 ~中国内地首获ICCAD最佳论文奖,包揽前端后端两篇最佳,恭喜浙大卓成老师、孙奇老师,恭喜中科院微电子所陈岚老师(附最佳论文介绍)6 Y0 k/ H( T" G# V; k9 t/ F: f
2024年10月19日 12:29 北京
& t) I; i6 m" I) l/ ^4 S: g
: Y$ g" S2 G6 f2 w# g. w[color=rgba(0, 0, 0, 0.9)]为中国内地从事EDA工作的老师、学生以及业界同仁点赞! [color=rgba(0, 0, 0, 0.9)]ICCAD2024最佳论文揭晓,浙江大学和中国科学院微电子研究所包揽了前端和后端两个最佳论文奖。这也是中国内地机构第一次收获ICCAD最佳论文奖。 [color=rgba(0, 0, 0, 0.9)]ICCAD2024前端最佳论文 [color=rgba(0, 0, 0, 0.9)]《An Agile Framework for Efficient LLM Accelerator Development and Model Inference》 [color=rgba(0, 0, 0, 0.9)]一作:陈律丞硕士生 [color=rgba(0, 0, 0, 0.9)]指导老师:卓成教授、孙奇研究员(浙江大学集成电路学院) [color=rgba(0, 0, 0, 0.9)]该研究工作提出了一项用于大语言模型(Large Language Model, LLM)高效推理和加速器开发的设计框架,其包含一个基于RISC-V架构的异构SoC和基于多保真度优化的敏捷设计空间探索方法,以提高LLM的推断效率。LLM在视觉和语言等各个领域都表现出了非凡的性能。然而,其推理依赖大量的存储、带宽和计算资源,导致相关加速器和SoC设计的工作量和时长大幅增加。 * _2 r: U8 _/ J8 k, W
[color=rgba(0, 0, 0, 0.9)]为解决上述挑战,该研究工作提出了一种新兴的二值化LLM阵列加速器,将其用于一个基于RISC-V架构、同时支持二进制和浮点运算的异构SoC中。本工作所提出的二值化LLM阵列加速器可将高位宽、高精度的数据按组转为低位宽、低精度的结果,依靠二进制运算实现对应运算操作,有效缓解了通过LLM推理剖析发现的矩阵/向量乘法运算耗时瓶颈。在框架中,本工作还提出了一种基于多保真度优化的敏捷设计空间探索方法,解决开发EDA工作流中因缺乏准确的后期数据而出现的过拟合问题,简化优化过程并提高建模质量。基于敏捷开发原则,该研究工作所提出的RISC-V框架由Chisel设计语言实现,具有可配置性和可扩展性,适应了LLM加速部署任务的动态需求。实验结果显示,该研究工作所提出的LLM加速框架与现有的各类计算设备相比,在LLaMA-7B、OPT等典型的大语言模型上均取得了可观的推理速度和能耗效率,在加速11.7倍的同时可将能耗效率提升2.19倍,并有效减少了相关SoC设计过程中的开销。 之前,北京大学在ICCAD2022、北京航空航天大学在ICCAD2023 最佳论文提名奖。 ICCAD2024前端最佳论文 《An Agile Framework for Efficient LLM Accelerator Development and Model Inference》 一作:陈律丞硕士生 指导老师:卓成教授、孙奇研究员(浙江大学集成电路学院) 该研究工作提出了一项用于大语言模型(Large Language Model, LLM)高效推理和加速器开发的设计框架,其包含一个基于RISC-V架构的异构SoC和基于多保真度优化的敏捷设计空间探索方法,以提高LLM的推断效率。LLM在视觉和语言等各个领域都表现出了非凡的性能。然而,其推理依赖大量的存储、带宽和计算资源,导致相关加速器和SoC设计的工作量和时长大幅增加。 为解决上述挑战,该研究工作提出了一种新兴的二值化LLM阵列加速器,将其用于一个基于RISC-V架构、同时支持二进制和浮点运算的异构SoC中。本工作所提出的二值化LLM阵列加速器可将高位宽、高精度的数据按组转为低位宽、低精度的结果,依靠二进制运算实现对应运算操作,有效缓解了通过LLM推理剖析发现的矩阵/向量乘法运算耗时瓶颈。在框架中,本工作还提出了一种基于多保真度优化的敏捷设计空间探索方法,解决开发EDA工作流中因缺乏准确的后期数据而出现的过拟合问题,简化优化过程并提高建模质量。基于敏捷开发原则,该研究工作所提出的RISC-V框架由Chisel设计语言实现,具有可配置性和可扩展性,适应了LLM加速部署任务的动态需求。实验结果显示,该研究工作所提出的LLM加速框架与现有的各类计算设备相比,在LLaMA-7B、OPT等典型的大语言模型上均取得了可观的推理速度和能耗效率,在加速11.7倍的同时可将能耗效率提升2.19倍,并有效减少了相关SoC设计过程中的开销。
1 x6 P0 ` ], O9 d
) ~, A# _5 q1 O# M& L( Q R* O基于RISC-V的异构SoC设计架构 浙江大学集成电路智能设计与先进制造自动化(IDEA)实验室专注于集成电路设计、电子设计自动化技术及其在先进制造领域的应用与创新,在ICCAD2024共入选了7篇论文。该实验室在ASP-DAC2023和ASP-DAC2024蝉联最佳论文奖。
) a- `/ u- @- T5 _; ^ICCAD2024后端最佳论文 《A Neural-Ordinary-Differential-Equations Based Generic Approach for Process Modeling in DTCO: A Case Study in Chemical-Mechanical Planarization and Copper Plating》》 一作:钱跃博士生 通讯作者:陈岚研究员(中国科学院微电子研究所) 这是中国科学院微电子研究所首次在ICCAD会议上发表论文。 该研究工作中首次将神经微分方程(Neural ODE)引入工艺建模。 经典半物理模型的较低过拟合风险主要源于其对真实工艺过程的有效模拟。该研究工作基于此,利用常微分方程(ODE)描述芯片形貌在工艺过程中的演变,并通过解初值问题进行模型推断。这种统一的数学表达和推断过程确保了方法的广泛适用性。其次,该研究工作在构建常微分方程时,突破了传统的专家知识模式,认识到基于硅数据的模型校正不仅可以调整待定参数,还能通过机器学习直接构建模型内部的经验关系或核心方程。因此,该研究工作将神经网络整合进常微分方程中,替代原半物理模型中的先验知识部分。最后,为了高效解决这一类异构模型的训练问题,该研究工作利用神经微分方程中的伴随敏感度分析法,采用伴随状态(Adjoint State)将梯度计算转化为常微分方程的初值问题。这一方案不仅减少了内存占用,还实现了与初值问题求解算法的解耦。 基于神经常微分方程的通用工艺建模方法 基于这一通用建模策略,该研究工作搭建了后道化学机械平坦化(CMP)和铜电镀(ECP)模型。 该研究工作提出的基于神经常微分方程的通用工艺建模方法具有多项优势,包括提升模型预测精度、实现自动化部署以及适用于复杂机理的工艺建模等。该方法在 CMP 和 Cu ECP 上的成功应用,进一步表明其在其他工艺中的应用潜力,进而推动 DTCO 工艺建模领域的进一步发展。 - u8 G* p7 O7 R+ m0 V
[color=rgba(0, 0, 0, 0.9)]浙江大学集成电路智能设计与先进制造自动化(IDEA)实验室专注于集成电路设计、电子设计自动化技术及其在先进制造领域的应用与创新,在ICCAD2024共入选了7篇论文。该实验室在ASP-DAC2023和ASP-DAC2024蝉联最佳论文奖。 [color=rgba(0, 0, 0, 0.9)]4 p9 t2 w8 J4 P: \) m6 _
[color=rgba(0, 0, 0, 0.9)]ICCAD2024后端最佳论文 [color=rgba(0, 0, 0, 0.9)]《A Neural-Ordinary-Differential-Equations Based Generic Approach for Process Modeling in DTCO: A Case Study in Chemical-Mechanical Planarization and Copper Plating》》 [color=rgba(0, 0, 0, 0.9)]一作:钱跃博士生 [color=rgba(0, 0, 0, 0.9)]通讯作者:陈岚研究员(中国科学院微电子研究所) [color=rgba(0, 0, 0, 0.9)]这是中国科学院微电子研究所首次在ICCAD会议上发表论文。 [color=rgba(0, 0, 0, 0.9)]该研究工作中首次将神经微分方程(Neural ODE)引入工艺建模。 [color=rgba(0, 0, 0, 0.9)]经典半物理模型的较低过拟合风险主要源于其对真实工艺过程的有效模拟。该研究工作基于此,利用常微分方程(ODE)描述芯片形貌在工艺过程中的演变,并通过解初值问题进行模型推断。这种统一的数学表达和推断过程确保了方法的广泛适用性。其次,该研究工作在构建常微分方程时,突破了传统的专家知识模式,认识到基于硅数据的模型校正不仅可以调整待定参数,还能通过机器学习直接构建模型内部的经验关系或核心方程。因此,该研究工作将神经网络整合进常微分方程中,替代原半物理模型中的先验知识部分。最后,为了高效解决这一类异构模型的训练问题,该研究工作利用神经微分方程中的伴随敏感度分析法,采用伴随状态(Adjoint State)将梯度计算转化为常微分方程的初值问题。这一方案不仅减少了内存占用,还实现了与初值问题求解算法的解耦。 [color=rgba(0, 0, 0, 0.9)]基于这一通用建模策略,该研究工作搭建了后道化学机械平坦化(CMP)和铜电镀(ECP)模型。 [color=rgba(0, 0, 0, 0.9)]该研究工作提出的基于神经常微分方程的通用工艺建模方法具有多项优势,包括提升模型预测精度、实现自动化部署以及适用于复杂机理的工艺建模等。该方法在 CMP 和 Cu ECP 上的成功应用,进一步表明其在其他工艺中的应用潜力,进而推动 DTCO 工艺建模领域的进一步发展。
% e. H2 r$ U+ p3 K& }/ ]3 ~
& X/ [; _ S5 D3 e0 v6 F' Y& \
/ ~4 i4 K2 b I6 e: K$ D3 m( q8 J I2 w7 R8 ?. _
|