|
|
发表于 2024-8-30 21:11:23
|
显示全部楼层
* A# Q6 B8 n6 L% N3 ^有型号了,未来潜力还是巨大的; f5 n, S5 Y8 \" `* ?; ^$ ^
目前算力不具备商业竞争力
" h* n4 z/ Y0 t1 p' w
( Z+ t/ O( U, @( X! k9 E9 p一张RTX 4090 在不同精度下的理论计算性能如下:
9 {8 A( K6 Y- l' K/ m g i3 W- i- T( _) y7 c* O5 ^) D
FP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。0 Q( A: f i" f/ P
/ [: Z2 u6 ]9 G" L, ]/ K, I2 `$ T! J
FP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。
- E; R, B) g0 c: l. F9 A5 M1 m( b- A- z
F8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。! s& Y# P. [% L
: P$ z8 C! ~; O7 ^- z新闻稿没讲FP精度,FP8的可能性比较大
% m! x( A; T/ e( i也即单机柜算力很可能比490高一点+ Z9 a" [+ s5 b/ M4 [
3 c0 ]6 B* u7 ^6 @
目前还是小学六年级小朋友,不能和博士比( `4 j% N) y( K `+ V6 y
不在现在,在于全自主,未来可期! |
|