|
|
发表于 2024-8-30 21:11:23
|
显示全部楼层
7 ?7 ^' `3 \# R" A! i3 t
有型号了,未来潜力还是巨大的
: J/ i0 I% P: ?) u目前算力不具备商业竞争力' O3 q/ h& B" x8 h: O9 d/ L. D/ h
+ K% e6 q$ x+ q& e- `2 G( ~
一张RTX 4090 在不同精度下的理论计算性能如下:7 q' n% R' t4 g8 H' Q! |( W2 e6 h
7 R G( U7 w* B0 jFP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。
9 s- N! k, u& K
/ p3 J. b' a4 c3 ]7 xFP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。0 D4 W) a# Z: G3 y/ P! B: w2 a
7 O, N& N% p* K2 ~F8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
3 X( t) D& X* Y7 h1 M) }7 k* B# t0 s/ k/ K' Y0 a, E
新闻稿没讲FP精度,FP8的可能性比较大% q% A6 p$ u( `9 q& [
也即单机柜算力很可能比490高一点3 h5 C- Y1 a: l' E
) p# y3 c% J7 T& e3 p# Q3 d4 q
目前还是小学六年级小朋友,不能和博士比. y: H9 W# Q3 k, V! B( T
不在现在,在于全自主,未来可期! |
|