AMD ødelegger Nvidia ved Bitcoin-gruvedrift, kan gapet noen gang overbygges?

Nvidia-logo

Hvis du vanligvis følger GPU-ytelse som det er relatert til spill, men har blitt nysgjerrig på Bitcoin-gruvedrift, har du sannsynligvis lagt merke til og blitt overrasket over det faktum at AMD-GPUer er de ubestridte ytelsesledere i markedet. Dette er i sterk kontrast til PC-grafikkbransjen, der AMDs HD 7000-serie har spilt et defensivt spill mot Nvidias GK104 / GeForce 600-familie av produkter. I Bitcoin-gruvedrift er situasjonen nesten helt omvendt - Radeon 7970 er i stand til 550MHash / sekund, mens GTX 680 er omtrent 1/5 så rask.

Det er en artikkel på Bitcoin Wiki som forsøk på å forklare forskjellen, men originalstykket ble skrevet i 2010-2011 og har ikke blitt oppdatert siden. Det refererer til Fermi og AMDs VLIW-arkitekturer og antyder at AMDs bedre ytelse skyldes at de har langt flere skyggekjerner enn de tilsvarende Nvidia-kortene. Dette er ikke helt nøyaktig, og det forklarer ikke hvorfor GTX 680 er faktisk tregere enn GTX 580 ved BTC-gruvedrift, til tross for å ha langt flere kjerner. Denne artikkelen kommer til å forklare forskjellen, ta for seg om bedre CUDA-gruvearbeidere dramatisk vil forandre ytelsesdeltaet mellom AMD og Nvidia, og berøre om Nvidias GPGPU-ytelse generelt er sammenlignbar med AMDs i disse dager.



Temaer ikke diskutert her inkluderer:



  • Bobler
  • Investeringsmulighet
  • Enten ASIC-er når de ankommer neste måned, denne sommeren, vil i fremtiden ødelegge GPU gruvedrift markedet.

Dette er viktige spørsmål, men de er ikke fokuset i denne artikkelen. Vi vil diskutere energieffektivitet og Mhash / watt til en viss grad, fordi disse faktorene har innvirkning på å sammenligne gruveytelsen til AMD vs. Nvidia.

Mekanikken til gruvedrift

Bitcoin mining er en spesifikk implementering av SHA2-256-algoritmen. En av grunnene til at AMD-kort utmerker seg ved gruvedrift, er at selskapets GPU-er har en rekke funksjoner som forbedrer heltallets ytelse. Dette er faktisk noe merkelig; GPU-arbeidsbelastninger har historisk vært tunge i flytende punkt fordi teksturer lagres i halv (FP16) eller full (FP32) presisjon.



Problemet blir mer forvirrende av det faktum at da Nvidia begynte å presse CUDA, la det vekt på passordsprekking som en viktig styrke i kortene. Det er sant at GeForce GPUer, som starter med G80, tilbød betydelig høyere kryptografisk ytelse enn CPUer - men AMDs maskinvare blåser nå Nvidias opp av vannet.

Den første grunnen til at AMD-kort overgår Nvidia-kolleger i BTC-gruvedrift (og den gjeldende Bitcoin-oppføringen gjør det dekke dette ) skyldes at SHA-256-algoritmen benytter en 32-biters helroteringsoperasjon. Dette betyr at heltallverdien forskyves ( forklaring her ), men de manglende bitene festes deretter til verdien. I en høyre rotasjon festes biter som faller av til høyre igjen til venstre. AMD GPUer kan utføre denne operasjonen i et enkelt trinn. Før lanseringen av GTX Titan krevde Nvidia GPUer tre trinn - to skift og et tillegg.

Vi sier 'før Titan', fordi en av funksjonene Nvidia introduserte med Compute Capability 3.5 (støttes bare på GTX Titan og Tesla K20 / K20X) er en traktskifter. Traktskifteren kan kombinere operasjoner og krympe 3-syklusstraffen Nvidia betydelig. Vi vil se på hvor mye ytelse forbedres et øyeblikk, fordi dette ikke er GK110s eneste forbedring i forhold til GK104. GK110 er også i stand til opptil 64 32-biters heltallskift per SMX (Titan har 14 SMX-er). GK104, derimot, kunne bare håndtere 32 heltallskift per SMX, og hadde bare åtte SMX-blokker.



Kepler instruksjonsevne

Vi har markert forskjellen på 32-biters heltallskift mellom CC 3.0 og CC 3.5.

AMD spiller ting nær brystet når det gjelder Graphics Core Next (GCN) 32-biters heltallsmuligheter, men selskapet har bekreftet at GCN utfører INT32-kode i samme hastighet som flytende punkt med dobbelt presisjon. Dette innebærer en teoretisk topp int32-utsendelseshastighet på 64 per klokke per CU - dobbelt GK104s basishastighet. AMDs andre fordel er imidlertid det store antallet beregningsenheter (CUer) som utgjør en GPU. Titan, som vi har sagt, har 14 SMX-er, sammenlignet med HD 7970s 32 CU-er. Compute Unit / SMX’er kan være langt viktigere enn det totale antallet kjerner i disse sammenhengene.

Copyright © Alle Rettigheter Reservert | 2007es.com