AMD создает суперкомпьютер на рабочем столе за 199 долл!!!

ATI Radeon HD 4850 – эту видеокарту AMD представила  как первую в мире имеющую производительность 1 Терафлоп (триллион операций с плавающей запятой в секунду). Ниже вы видите спецификации на ATI Radeon HD 4850 и HD 4870 (1.2 Терафлопа):

Видеокарта ATI Radeon

HD 4850

HD 4870

Частота GPU

625 МГц

750 МГц

Частота памяти

993 МГц

900 МГц

Число потоковых процессоров (АЛУ)

800

800

Число текстурных блоков

40

40

Число блоков растровых операций (ROP)

16

16

Контроллер памяти

256 битов (8 каналов по 32 бита)

256 битов (8 каналов по 32 бита)

Тип памяти

GDDR3

GDDR5

 

       Оба чипа содержат по 160 потоковых процессоров (по 5 АЛУ в каждом – 800 потоков), составляющих их вычислительную мощь. Отметим, что это достаточно самостоятельные и универсальные процессоры, благодаря чему их вычислительна мощь может быть использована для решения различных прикладных задач, требовательных к вычислительным ресурсам. Конечно, эти процессорные ядра имеют довольно простую архитектуру, ориентированную на SIMD-вычисления (5-ти канальные блоки VLIW), но в терафлопных чипах появились новшества, позволяющие реально использовать аппаратную часть видеочипа для выполнения сторонних задач. Так, наличие области памяти размером 16 кб Local Data Share, которую может использовать программист посредством инструкций CUDA, дает возможность отдельным потокам обмениваться данными (аналогично Shared Memory у конкурента). А 16 кб область Global Data Share предназначена для обмена данными между SIMD-массивами, чего пока нет у конкурентов. Таким образом организована простая архитектура для выполнения многопотоковых вычислений со взаимодействующими потоками. Она должна быть эффективной, по крайней мере, для слабовзаимодействующих потоков.

В реальных задачах практически не бывает совсем не взаимодействующих потоков, поэтому без возможности обмена данными, как внутри вычислительного блока, так и между ними, использование вычислительных ресурсов видеокарт прикладными задачами очень проблематично. Поэтому нам представляется, что новшества, позволяющие всему массиву вычислителей обмениваться данными между собой через память, гораздо большее преимущество, чем формальное пересечения отметки в 1 Тфлоп, поскольку благодаря взаимодействию вычислителей получается уже суперкомпьютер на рабочем столе. Конечно, мы отдаем себе отчет в том, что должно пройти достаточно времени, прежде чем появятся реальные приложения, использующие эти возможности. Но при этом напомним, что набор инструкций CUDA, предназначенный для использования видеопроцессоров в прикладных вычислениях появился весьма заблаговременно и на данный момент уже даже есть неплохой список решенных с его помощью стандартных задач, часто возникающих в прикладных приложениях. Кроме того, к этому времени уже накоплен большой опыт решения ресурсоемких задач на суперкомпьютерных системах и этот опыт может быть с успехом использован в суперсистемах на чипе, т.е. в новых видеокартах AMD.

Наконец, чтобы читателю не казалось, что в его реальной жизни, нигде, кроме как в играх, такая суперкомпьютерность не будет нужна, приведем несколько реальных примеров, где это будет использоваться. Например, как вам архивирование гигабайтных файлов за считанные секунды в 800 потоков силами видеочипа? А представьте, сколько времени нужно самому современному процессору чтобы на забитом доверху 200 Гб разделе жесткого диска найти файл с нужным словом (фразой)? А если большинство файлов еще и заархивировано? Можете смело оставлять компьютер на ночь без надежды утром увидеть результат. Та же самая задача решаемая в 800 потоков видеочипом уменьшит временные затраты на два порядка. Сюда же относятся и новые видеоэффекты при воспроизведении видео и расчет физики в играх силами видеокарты, а не процессора. А дефрагментация и оптимизация жесткого диска вообще сможет выполняться видеокартой прямо на лету, между кликами мышкой. Список можно продолжать еще долго.

Интересно, однако, что все Интернет-ресурсы отметили преодоление барьера в 1 Терафлоп (потому как об этом усиленно кричала сама AMD), и никто не обратил внимания к чему ведут архитектурные новшества, а ведь это фактическое появление нового качества - настольного суперкомпьютера и всего за 199 у.е.!

О производительности AMD Fusion