|
|
发表于 2024-8-30 21:11:23
|
显示全部楼层
J) H3 B! `- y有型号了,未来潜力还是巨大的
, R; t5 b, ]9 _目前算力不具备商业竞争力$ O) O& n( `/ K: X M2 L1 O4 l! B
# u! ^- a" g' v0 `
一张RTX 4090 在不同精度下的理论计算性能如下:
- K% i% s4 v6 S: G
3 \) G7 p/ N5 \4 f5 ^1 WFP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。/ a6 i, D! g* Z$ K: ?/ t
' A: l& c4 _' W* [& ]9 N4 y2 H
FP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。
) ?) w0 H7 J) _, V' V3 W' v
8 T7 O% b( u3 lF8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。1 ^$ f3 [/ h( n0 ~4 n7 q. c0 C* P+ T
3 J/ i3 ?- t& k* s- s+ b c
新闻稿没讲FP精度,FP8的可能性比较大
( y' P/ j$ d) Y, Q也即单机柜算力很可能比490高一点
" D' Q1 [) w! y/ @
5 l- K% [( s0 m2 ^# u目前还是小学六年级小朋友,不能和博士比 E7 H" E' x3 J9 ^
不在现在,在于全自主,未来可期! |
|