- INFO
- FERMI
- CUDA
- Tesla
- Developers
- CUDA Toolkit 3.0 już dostępny do pobrania!
- GPU Acceleration of Molecular Modeling Applications
- GPU Benchmark
- NVIDIA® OptiX™ ray tracing engine
- Obliczenia równoległe w MATLAB
- Program certyfikacji dla deweloperów CUDA i przetwarzania równoległego.
- Beta Test GPUs with MathWorks Products
- PGI Release 2010 Includes Support for GPUs
- Wydarzenia
- GPU Technology Conference 14-14 października 2011
- Internetowe seminaria CUDA: marzec – kwiecień 2011
- Konferencja Bio IT World 5-7.10.2010 Hannover
- Konferencja GPU Technology Conference (GTC), 20-23 września 2010, San Jose, USA
- Konferencja ISC 2010 Hamburg, 30.05-03.06.2010
- TOP 500 superkomputerów a TESLA
- Webseminaria NVIDIA GPU – luty/marzec 2010.
- Webseminaria NVIDIA GPU: CUDA C, DirectCompute, OpenCL, MAGMA, CULA, Fortran – lipiec 2010.
- SC 09 – 18.11.09 Prezentacje
- Europejska trasa CUDA/HMPP 2009 – pierwsza edycja
- Download
- Kontakt
Tesla™ C2050 / C2070
Nowa generacja architektury CUDA, karty NVIDIA Tesla™ C2050 i C2070, oznaczone nazwą kodową „Fermi”, to najbardziej zaawansowana architektura dedykowana obliczeniom na GPU, jaka kiedykolwiek powstała. Dzięki ponad trzem miliardom tranzystorów oraz aż do 448 rdzeniom przetwarzania CUDA, zapewnia ona możliwości i wydajność superkomputerów opartych o 4 rdzeniowe układy CPU, przy 1/10 ceny oraz 1/20 zapotrzebowania na energię tradycyjnych serwerów korzystających wyłącznie z układów CPU.

Architektura FERMI dostarcza wiele od dawna oczekiwanych cech technicznych:
- wsparcie dla C + +,
- obsługę pamięci ECC dla bezkompromisowej dokładności i skalowalności
- 7 krotny wzrost wydajności dla obliczeń podwójnej precyzji w porównaniu z kartami TESLA serii 10xx
Cechy produktu:
| 448 CUDA Cores | Delivers up to 515 Gigaflops of double-precision peak performance in each GPU, enabling a single workstation to deliver a Teraflop or more of performance. Single precision peak performance is over a Teraflop per GPU. |
| ECC Memory | Meets a critical requirement for computing accuracy and reliability for workstations. Offers protection of data in memory to enhance data integrity and reliability for applications. Register files, L1/L2 caches, shared memory, and DRAM all are ECC protected. |
| Desktop Cluster Performance | Solves large-scale problems faster than a small server cluster on a single workstation with multiple GPUs. |
| Up to 6GB of GDDR5 memory per GPU | Maximizes performance and reduces data transfers by keeping larger data sets in local memory that is attached directly to the GPU. |
| NVIDIA Parallel DataCache™ | Accelerates algorithms such as physics solvers, ray-tracing, and sparse matrix multiplication where data addresses are not known beforehand. This includes a configurable L1 cache per Streaming Multiprocessor block and a unified L2 cache for all of the processor cores. |
| NVIDIA GigaThread™ Engine | Maximizes the throughput by faster context switching that is 10X faster than previous architecture, concurrent kernel execution, and improved thread block scheduling. |
| Asynchronous Transfer | Turbocharges system performance by transferring data over the PCIe bus while the computing cores are crunching other data. Even applications with heavy data-transfer requirements, such as seismic processing, can maximize the computing efficiency by transferring data to local memory before it is needed. |
| CUDA programming environment with broad support of programming languages and APIs | Choose C, C++, OpenCL, DirectCompute, or Fortran to express application parallelism and take advantage of the “Fermi” GPU’s innovative architecture. NVIDIA Parallel Nsight™ tool is available for Microsoft Visual Studio developers. |
| High Speed , PCIe Gen 2.0 Data Transfer | Maximizes bandwidth between the host system and the Tesla processors. Enables Tesla systems to work with virtually any PCIe-compliant host system with an open PCIe x16 slot. |
Specyfikacja techniczna:
| Form Factor | 9.75″ PCIe x16 form factor |
| # of Tesla GPUs | 1 |
| # of CUDA Core | 448 |
| Frequency of CUDA Cores | 1.15 GHz |
| Double Precision floating point performance (peak) | 515 Gflops |
| Single Precision floating point performance (peak) | 1.03 Tflops |
| Total Dedicated Memory*
Tesla C2050
Tesla C2070 |
3GB GDDR5 6GB GDDR5 |
| Memory Speed | 1.55 GHz |
| Memory Interface | 384-bit |
| Memory Bandwidth | 148 GB/sec |
| Power Consumption | 225W TDP |
| System Interface | PCIe x16 Gen2 |
| Thermal Solution | Active Fansink |
| Software Development Tools | CUDA C/C++/Fortran, OpenCL, DirectCompute Toolkits. NVIDIA Parallel Nsight™ for Visual Studio |
Poniżej orientacyjne ceny kart w nowej architekturze dostępnych od połowy 2010 roku:
Tesla C2050 Board 3GB ECC GDDR5, do 0.52 TFlops (Double Precision)
Sugerowana cena netto: 2050,00 EURO / (1Euro=4PLN) = 8’200,00 PLN (w przypadku instytucji naukowych atrakcyjne upusty)
Tesla C2070 Board 6GB ECC GDDR5, do 0.52 TFlops (Double Precision)
Sugerowana cena netto: 3070,00 EURO / (1Euro=4PLN) = 12’280,00 PLN (w przypadku instytucji naukowych atrakcyjne upusty)
Tesla serii 20 została zaprojektowana całkowicie do obliczeń wysokiej wydajności. Bazuje na nowej generacji NVIDIA CUDA™ GPU architekturze “Fermi”. Dzięki pamięci ECC jest to rozwiązanie o niesamowitej dokładności i skalowalności, ze wsparciem dla C++ i nawet 8X wydajniejszych obliczeniach podwójnej precyzji w porównaniu do Tesla serii 10 GPU. Gdy porównano najnowszy quad-core CPU oraz procesor obliczeniowy Tesla serii 20 otrzymano ekwiwalent osiągów 1/20 poboru mocy oraz 1/10 kosztów. Przewidywane wprowadzenie produktu na rynek to drugi kwartał 2010.
SC09 – start nowej serii Tesla
http://blogs.nvidia.com/ntersect/SC09/
Rozwiązania dla stacji roboczych:
http://www.nvidia.de/content/PDF/Tesla_product_literature/NV_DS_Tesla_C2050_C2070_Final_lowres.pdf
Rozwiązania dla Data Centers:
http://www.nvidia.de/content/PDF/Tesla_product_literature/NV_DS_Tesla_S2050_S2070_final_lowres.pdf
Parallel Processors
Tesla™ S2050 / s2070
The Tesla S2050/S2070 1U Computing Systems are
designed from the ground up for high performance
computing. Based on the next generation NVIDIA
CUDA™ GPU architecture codenamed “Fermi”, it
supports many “must have” features for technical
and enterprise computing. These include ECC
memory for uncompromised accuracy and scalability,
support for C++ and 8X the double precision
performance compared Tesla 10-series GPU
computing products. When compared to the latest
quad-core CPU, Tesla 20-series GPU computing
systems deliver equivalent performance at 1/20th
the power consumption and 1/10th the cost.
Designed with four latest-generation Tesla
computing processors in a standard 1U chassis,
the Tesla S2050/S2070 computing systems scales
to solve the world’s most important computing
challenges – more quickly and accurately.
