FPU ima jednu jako lepu i prilično neobičnu primenu za integer poslove. Ako se radi sa velikim nizovima cifara u osnovi 256 (jedna cifra == 1 znak) FPU omogućava jako brzo množenje takva 2 velika broja (n log(n) mesto n^2 kad bi se radilo kao što se množi ručno), a posledično i brzo deljenje i recipročan koren Njutnovom iteracijom. Ovo su već sve osnovne aritmetičke operacije koje su dovoljne da se sa njima pravi sve ostalo, npr. ostatak pri deljenju. Nisam se bavio kriptografijom, ali RSA algoritam se baš zasniva na ogromnim brojevima kod kojih su sve cifre bitne, za razliku od FP aritmetike.
Takođe, FP programi generalno imaju veći stepen paralelizma od integer programa (spec fp vs spec int od prve do zadnje verzije) i prirodno je da se tu ulože resursi (vektorski dizajn, fused mul-add, parallel mul-add) jer su tu dobici najveći na 3 načina (najveće moguće ubrzanje, fp aritmetika sporija od int aritmetike i složena fp aritmetika je zastupljenija od složene int aritmetike). Posledica toga je da je na današnjim procesorima (a čak i praistorijskim tipa R5000), fp množenje brže od int množenja samo zato što je upotrebljen brži sklop (ali sa dosta više gejtova). Kriptografija je verovatno jedina primena kojoj treba rad sa ogromnim celim brojevima i onda su ljudi videli da im je bolje da iskoriste postojeće fp resurse za to nego da sve ide iznova.
Na serverima fp možda jeste trošenje resursa, ali sa povećanjem prisutnosti multimedijalnih baza i to će se promeniti jer pretraživanje slike, videa i zvuka dosta koristi fp aritmetiku. Nešto od toga moguće je uraditi i sa integerima (fixed point) ali zahteva mnogo više pažnje, dok se fp brojevi "brinu sami o sebi".
Što se tiče visoke cene superračunara ona potiče od nekoliko faktora:
1) visoka cena razvoja po primerku (koliko bi koštali x86 da se prodaju u hiljadama a ne desetinama milona primeraka)
2) visoka cena razvoja softvera (isti razlog)
3) cena razvoja custom memorijskih sistema (crossbar ASICi, interkonekcije i slično)
4) visoka cena same memorije (Cray C90 je imao komplet memoriju od SRAMa koja je se merila u GB, X1 stotine banki RAMBUSam, NEC SX5 16K banki SDRAMa)
U stvari, nije brzina računanja ono što superračunar čini superračunarom već je to brzina memorije. To nije samo količina podataka već i broj nezavisnih adresa koje memorija može da prihvati i to je nešto što je najteže i najskuplje povećati sa DRAM memorijom. Ovo vrlo je bitna stvar za adresiranje slabo popunjenih matrica koje se često pojavljuju u primenama (i gde način pristupa memoriji nema mnogo veze sa onim kako to radi Linpack).
One word, one instruction, one cycle. RISC.