Tesla™ C2050 / C2070

Nowa generacja architektury CUDA, karty NVIDIA Tesla™ C2050 i C2070, oznaczone nazwą kodową „Fermi”, to najbardziej zaawansowana architektura dedykowana obliczeniom na GPU, jaka kiedykolwiek powstała. Dzięki ponad trzem miliardom tranzystorów oraz aż do 448 rdzeniom przetwarzania CUDA, zapewnia ona możliwości i wydajność superkomputerów opartych o 4 rdzeniowe układy CPU, przy 1/10 ceny oraz 1/20 zapotrzebowania na energię tradycyjnych serwerów korzystających wyłącznie z układów CPU.

Karta TESLA C2050 / 2070

Architektura FERMI dostarcza wiele od dawna oczekiwanych cech technicznych:

- wsparcie dla C + +,

- obsługę pamięci ECC dla bezkompromisowej dokładności i skalowalności

- 7 krotny wzrost wydajności dla obliczeń podwójnej precyzji w porównaniu z kartami TESLA serii 10xx

Cechy produktu:

448 CUDA Cores Delivers up to 515 Gigaflops of double-precision peak performance in each GPU, enabling a single workstation to deliver a Teraflop or more of performance. Single precision peak performance is over a Teraflop per GPU.
ECC Memory Meets a critical requirement for computing accuracy and reliability for workstations. Offers protection of data in memory to enhance data integrity and reliability for applications. Register files, L1/L2 caches, shared memory, and DRAM all are ECC protected.
Desktop Cluster Performance Solves large-scale problems faster than a small server cluster on a single workstation with multiple GPUs.
Up to 6GB of GDDR5 memory per GPU Maximizes performance and reduces data transfers by keeping larger data sets in local memory that is attached directly to the GPU.
NVIDIA Parallel DataCache™ Accelerates algorithms such as physics solvers, ray-tracing, and sparse matrix multiplication where data addresses are not known beforehand. This includes a configurable L1 cache per Streaming Multiprocessor block and a unified L2 cache for all of the processor cores.
NVIDIA GigaThread™ Engine Maximizes the throughput by faster context switching that is 10X faster than previous architecture, concurrent kernel execution, and improved thread block scheduling.
Asynchronous Transfer Turbocharges system performance by transferring data over the PCIe bus while the computing cores are crunching other data. Even applications with heavy data-transfer requirements, such as seismic processing, can maximize the computing efficiency by transferring data to local memory before it is needed.
CUDA programming environment with broad support of programming languages and APIs Choose C, C++, OpenCL, DirectCompute, or Fortran to express application parallelism and take advantage of the “Fermi” GPU’s innovative architecture. NVIDIA Parallel Nsight™ tool is available for Microsoft Visual Studio developers.
High Speed , PCIe Gen 2.0 Data Transfer Maximizes bandwidth between the host system and the Tesla processors. Enables Tesla systems to work with virtually any PCIe-compliant host system with an open PCIe x16 slot.

Specyfikacja techniczna:

Form Factor 9.75″ PCIe x16 form factor
# of Tesla GPUs 1
# of CUDA Core 448
Frequency of CUDA Cores 1.15 GHz
Double Precision floating point performance (peak) 515 Gflops
Single Precision floating point performance (peak) 1.03 Tflops
Total Dedicated Memory*

Tesla C2050
Tesla C2070
3GB GDDR5
6GB GDDR5
Memory Speed 1.55 GHz
Memory Interface 384-bit
Memory Bandwidth 148 GB/sec
Power Consumption 225W TDP
System Interface PCIe x16 Gen2
Thermal Solution Active Fansink
Software Development Tools CUDA C/C++/Fortran, OpenCL, DirectCompute Toolkits. NVIDIA Parallel Nsight™ for Visual Studio

Poniżej orientacyjne ceny kart w nowej architekturze dostępnych od połowy 2010 roku:

Tesla C2050 Board 3GB ECC GDDR5, do 0.52 TFlops (Double Precision)

Sugerowana cena netto: 2050,00 EURO / (1Euro=4PLN) = 8’200,00 PLN (w przypadku instytucji naukowych atrakcyjne upusty)

Tesla C2070 Board 6GB ECC GDDR5, do 0.52 TFlops (Double Precision)

Sugerowana cena netto: 3070,00 EURO / (1Euro=4PLN) = 12’280,00 PLN (w przypadku instytucji naukowych atrakcyjne upusty)

Tesla serii 20 została zaprojektowana całkowicie do obliczeń wysokiej wydajności. Bazuje na nowej generacji NVIDIA CUDA™ GPU architekturze “Fermi”. Dzięki pamięci ECC jest to rozwiązanie o niesamowitej dokładności i skalowalności, ze wsparciem dla C++ i nawet 8X wydajniejszych obliczeniach podwójnej precyzji w porównaniu do Tesla serii 10 GPU. Gdy porównano najnowszy quad-core CPU oraz procesor obliczeniowy Tesla serii 20 otrzymano ekwiwalent osiągów 1/20 poboru mocy oraz 1/10 kosztów. Przewidywane wprowadzenie produktu na rynek to drugi kwartał 2010.

SC09 – start nowej serii Tesla

http://blogs.nvidia.com/ntersect/SC09/

Rozwiązania dla stacji roboczych:

http://www.nvidia.de/content/PDF/Tesla_product_literature/NV_DS_Tesla_C2050_C2070_Final_lowres.pdf

Rozwiązania dla Data Centers:

http://www.nvidia.de/content/PDF/Tesla_product_literature/NV_DS_Tesla_S2050_S2070_final_lowres.pdf

The World ’s First Mass Mar ket
Parallel Processors
Tesla™ S2050 / s2070
The Tesla S2050/S2070 1U Computing Systems are
designed from the ground up for high performance
computing. Based on the next generation NVIDIA
CUDA™ GPU architecture codenamed “Fermi”, it
supports many “must have” features for technical
and enterprise computing. These include ECC
memory for uncompromised accuracy and scalability,
support for C++ and 8X the double precision
performance compared Tesla 10-series GPU
computing products. When compared to the latest
quad-core CPU, Tesla 20-series GPU computing
systems deliver equivalent performance at 1/20th
the power consumption and 1/10th the cost.
Designed with four latest-generation Tesla
computing processors in a standard 1U chassis,
the Tesla S2050/S2070 computing systems scales
to solve the world’s most important computing
challenges – more quickly and accurately.