|
发表于 2024-8-30 21:11:23
|
显示全部楼层
& @3 w) ?5 u" S) T3 B有型号了,未来潜力还是巨大的, G1 h) s) r( s
目前算力不具备商业竞争力
( w9 y0 @' B5 s2 {: Z3 w# }
; K" |! C% x; ^一张RTX 4090 在不同精度下的理论计算性能如下:
8 ?8 I l# U0 [* ]
' Y: ]4 L( N( @& P1 T9 G" i' z0 zFP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。
, s; p) f; |2 B: c! Q( e
1 U. V/ d9 Q8 hFP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。. |$ U3 w% g( a( o; a$ G2 G
; ?+ D" U; c( ^- }0 eF8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
6 p# }$ @, T8 q* _" ?
: |5 p! m: \! o; D8 a# ^新闻稿没讲FP精度,FP8的可能性比较大
1 l& Z, d% @! t也即单机柜算力很可能比490高一点
) N' V* F( m: o4 m
9 t. |1 `+ `; W目前还是小学六年级小朋友,不能和博士比
) {* N4 t3 Q2 r: p! D- \不在现在,在于全自主,未来可期! |
|