|
发表于 2024-8-30 21:11:23
|
显示全部楼层
( `) V. `' J. B8 n6 v! D有型号了,未来潜力还是巨大的
8 p9 O% L% o0 a2 f目前算力不具备商业竞争力1 F7 @, i- Q) O( V. H
- |) ], R9 T! D# v ]7 A/ L一张RTX 4090 在不同精度下的理论计算性能如下:+ L4 P' Y: `/ [- E7 t
" _/ G" J! r3 v: v7 }: c
FP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。
) m& z$ I% m% \2 Q0 z
# W r6 U) g2 ]0 V! `# HFP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。3 \& Q) m2 B' F$ N
( O2 Y+ G1 w& P. D9 R. N0 x
F8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
9 ^* `! U2 ]. D# N6 c: o6 _! z0 b( h- N3 x6 h4 i- x
新闻稿没讲FP精度,FP8的可能性比较大% W8 d1 S8 R, `) v0 A2 q% P
也即单机柜算力很可能比490高一点- t$ q+ U( [& D, F& p
4 v, I3 X- D3 Q9 `0 L# m# @# \& d0 {) A; U3 t目前还是小学六年级小朋友,不能和博士比
/ l, O! v1 c% A, W* }不在现在,在于全自主,未来可期! |
|