Привет друзья!

Буквально на днях компания NVIDIA, без каких-либо предварительных анонсов или утечек, представила уже третью модель своей линейки вычислительных блоков — Titan V. А если принять во внимание что коллекционных Titan Xp вышло аж сразу две разновидности (те самые Galactic Empire и Jedi Order), то титанов вышло уже аж целых пять!

Планета Железяка: NVIDIA TITAN V - инструмент с поразительным возможностями
Планета Железяка: NVIDIA TITAN V - инструмент с поразительным возможностями
Планета Железяка: NVIDIA TITAN V - инструмент с поразительным возможностями
Планета Железяка: NVIDIA TITAN V - инструмент с поразительным возможностями
Планета Железяка: NVIDIA TITAN V - инструмент с поразительным возможностями

Более всего в Titan V примечательно не столько что он пятый, сколько что он основан на технологии NVIDIA Volta.
Все разновидности недавних Titan Xp были основаны на технологии Pascal, что фактически приравнивает инженерные титаны к игровым Geforce и возводит конкуренцию между GTX##80Ti и любым из Titan X. И конкуренция эта сохраняется не только в стане игроков, но и среди инженеров. Многие инженерные решения, как ни странно, построены на основе видеокарт ##80Ti, а не на титанах, как следовало бы.

Технология NVIDIA Volta заявлена как инженерная. Она буквально нашпигована разными очень вкусными для инженеров компонентами — тут у нас и сверхбыстрая память HBM2 (аж 12Gb), и ширина пропускания в 3072 бит, и более 5 тысяч ядер CUDA. Однако, самым вкусным и самым важным компонентом технологии Volta является так называемое Тензорное ядро.
Планета Железяка: NVIDIA TITAN V - инструмент с поразительным возможностями

Заявленная пиковая производительность Titan V может достигать 125 TFLOPS. И давайте на этой цифре остановимся подольше. Как можно пощупать ~125 000 000 000 000 вычислительных операций в секунду над числами с плавающей точкой (FLoating-point Operations Per Second — FLOPS)?

Все мы помним выдающегося шахматиста Гарри Каспарова, ну правда же помним? И у многих людей сразу возникнет ассоциация имени Гарри с машиной Deep Blue — суперкомпьютером, созданным IBM и наделенным программой для игры в шахматы с человеком.
Планета Железяка: NVIDIA TITAN V - инструмент с поразительным возможностями
Так вот, пиковая производительность Deep Blue составляет всего 11.38 GFLOPS. Titan V более чем в десять тысяч раз производительнее чем Deep Blue.
Но Deep Blue ведь старикан, создан был аж 1997 году и уже давно не используется даже в инженерии.

Давайте немного прогуляемся по современной истории суперкомпьютеров, ведь по своей сути Titan V является именно суперкомпьютером.

В 2004 году компанией Cray Inc был создан супер компьютер с пиковой производительностью 50 TFLOPS, что всего в два с небольшим раза меньше производительности Titan V.
Планета Железяка: NVIDIA TITAN V - инструмент с поразительным возможностями

Достичь устойчивой производительности в 1 PFLOPS (что в 10 раз больше чем может Titan V) удалось только к 2010 году. Современные суперкомпьютеры имеют производительность от 10 PFLOPS.

Ну хорошо, супер компьютеры это супер и всё такое, а что там с более земными умными коробочками? Не каждый ведь человек имел случай прикоснуться к супермощной громадине размером с небольшой концертный зал.
Как насчет того, чтобы посчитать производительность Титана в попугаях? Точнее, в XBox-ах и PlayStation-ах.

Итак, Sony PlayStation 4 Pro, согласно источникам, может достигать производительности 4.2 TFLOPS в пике.
Другая консоль, XBox One X, согласно своим спецификациям, способна на пиковые 6 TFLOPS.

Выходит, что всего один Titan V — это примерно 30 Sony PlayStation 4 Pro или примерно 20 XBox One X.
А если из SPS4P и XBOX сделать сандвич, то всего на одну Titan V будет приходиться около 11 таких сандвичей.

Думаю, после таких вандальских сравнений мощь Titan V станет ощутимее. :)

На самом деле, все эти сравнения и замеры количества операций в секунду малопродуктивны. Volta это инженерная технология, а архитектуры PlayStation и XBox — технологии игровые (даже не смотря на прецедент с созданием суперкомпьютера из полутора тысяч SPS3). На самом деле даже при выборе между XBox и PlayStation нельзя основываться на показателях вычислительной производительности, т.к. она не влияет на конечные ощущения от плавности игры или качества графики.

NVIDIA Titan V считается самым мощным, на текущий момент, вычислительным блоком для ПК. Это устройство будет полезно в машинном обучении, в обработке больших данных, в разработке новых алгоритмов компьютерного зрения и настоящего искусственного интеллекта. В таких задачах Titan V сможет раскрыть свой потенциал и стать очень полезным.
Кто-то уже жаждит заполучить титан в свои лапы для экспериментов над криптовалютами, однако это настроение не носит массового характера.

В итоге можно сказать так. NVIDIA выпустила еще одну очень дорогую и очень нежную громадину с удивительными характеристиками и не менее удивительными потребностями в питании и охлаждении. В Titan V удивляет просто все.

Напоследок оставляю видео официальной презентации.

Автор:

Разработчик игр с более чем десятилетним опытом в геймдеве.
Работал над всем, от казуальных и мобильных игр, до настоящих ММО и AAA проектов.
Сейчас работаю в области AAA, участвую в проектах сессионных игр.
Взращиваю собственный движок (C++, собирается на 5 платформ) и создаю его более развитого преемника ради проверки навыков.

8
  • Спасибо за вашу оценку!
    Узнайте, на что она влияет.

14 комментариев

avatar
Спасибо за интересную статью, было очень интересно почитать. Думаю что сейчас Каспаров точно проиграл бы..))
  • +1
avatar
В начале статьи есть небольшая неточность:
Все разновидности Titan X были основаны на технологии Pascal
Официальная спецификация непосредственно Titan X, с вами категорически не согласна:
Powered by NVIDIA Maxwell architecture, these graphics cards delivers incredible performance, unmatched power efficiency, and cutting-edge features.
Соответственно 980Ti, которая является «отбракованным чипом» Titan X, так же никак не может вписаться в ряд ##80Ti (не говоря уже о том что по глупости туда можно и 780Ti подставить), и это странное обобщение в контексте Titan Xp (который и есть тот самый Pascal) можно заменить одной конкретной видеокартой — 1080Ti.

Ну и, читая про мощу этого Titan'a, я уже превдкушаю появление 1180Ti(2080Ti?) и надеюсь что наконец-то увижу 4k@60fps, на одной видеокарте без компромиссов в настройках. Но касательно конкуренции замечу, что если будущая ##80Ti (на той же Volta) будет делаться по текущим лекалам (т.е из отбракованных чипов), то новый Титан будет править на рынке, ровно до ее появления. А вот если они у игровой Ti-версии отрежут/заблокируют все научные приблуды (как например были сделаны первые Титаны, во времена 7хх-серии, которые могли проводить 64х-битные расчеты, если я не ошибаюсь), то тогда да, он не останется уделом энтузиастов.
  • +1
avatar
Так же с количеством Titan'ов в истории NVIDIA тоже получается не все гладко.
Потому что до Titan X, во времена 7хх-серии существовал «прототитан» Titan, его модификация Titan Black (где удвоили память) и «эволюция» (добавление еще одного такого же ядра, если быть точным) в лице Titan Z. Итого всего Титанов было 8.
Но если говорить о серии Xp, то с учетом поправки выше их было всего 3 (т.к Titan V, это уже новое поколение и вписывать его в прошлое тоже странно).
Комментарий отредактирован 2017-12-10 20:22:10 пользователем Dead_Knight
  • 0
avatar
Карта крутая, спору нет. Но давайте не будем сравнивать её с суперкомпьютерами — такие сравнения некоректны чуть более чем, полностью…
  • 0
avatar
А почему такие сравнения некорректны?
  • +1
avatar
По тем же причинам по которым вы упомянули вычислительные мощности консолей, а потом отбросили их как «игрушки».
Титан это офигенно мощная видеокарта для энтузиастов и не более того, или вы считаете что в NVIDIA работают идиоты которые подобным «дешманом» (понятное дело относительным) будут убивать свой рынок Тесл и прочих Квадр или вот этого «инструмента для исследования глубинного обучения»?

Если бы ваши сравнения были корректны, то выход еще первого титана (в 2013м году) поставил бы крест на вышеупомянутых Теслах, и думаю хорошо бы пошатнул рынок суперкомпьютеров. Но ничего этого не произошло, NVIDIA как разрабатывала и выпускала специализированные решения, так и разрабатывает и выпускает. И суперкомпьютеры почему-то на титаны менять никто не спешит.
Потому что правильно вы заметили: игрушки к игрушкам, а серьезные вещи это совершенно другое. И Titan V это не что иное как очередная инкарнация «дорогой игрушки».
Комментарий отредактирован 2017-12-11 01:56:12 пользователем Dead_Knight
  • 0
avatar
Вот ещё в догонку. Вы Сравниваете некоторые FLOPS'ы, при этом в Вашей статье как минимум три вида разных FLOPS'ов — в случае суперкомпьютеров это FP64 FLOPS(операции над числами двойной точности), в случае с приставками, скорее всего, FP16 FLOPS(операции над числами половинной точности, чтобы получить FP64 надо проводить отдельные замеры — там коэффициент может быть от 1/4 до 1/256, всё сильно зависит от архитектуры), в случае же нового Титана — некоторые непонятные операции с матрицами на тензорном модуле(я бегло погуглим — там зашита операция умножения 4x4 матриц). В действительности производительность нового Титана составляет — ~30 FP16 TFLOPS, ~15 FP32 TFLOPS, ~6,7 FP64 TFLOPS(по этому параметру он и топовый — самое лучшее соотношение между картами в FP64FLOPS/$), что делает его не в два раза мощнее, чем суперкомпьютер из 2004, а в примерно 8 раз слабее(что тем не менее очень круто!). При этом не стоит забывать, что архитектура видеопроцессоров весьма отличается от архитектуры процессоров общего назначения, из-за чего у нас и нету до сих пор настольного компьютера на GPU без CPU.
В дополнительный пример можно привести ASIC майнеры битков — они выдают сотни терахешей(видеокарты единицы мегахешей), при этом неспособны делать что-то ещё. В случае решения задачи майнинга битков они хороши — в остальном не очень.
  • +2
avatar
в случае с приставками, скорее всего, FP16 FLOPS
Общедоступное описание Sony PlayStation 4 Pro
К сожалению, детальную техдокументацию NDA распространять не позволяет.
It is an upgraded version of the PlayStation 4 with improved hardware to enable 4K rendering and improved PlayStation VR performance, including an upgraded GPU with 4.2 teraflops of processing power and hardware support for checkerboard rendering,[194] and a higher CPU clock.
А что это за GPU с производительностью в 4.2 TFLOPS?
Это стандартное семейство AMD Radeon. Выходит, консоль построена на стандартных решениях, что очень практично.
Замеры половинной точности для GPGPU не имеют никакого смысла, т.к. GPGPU создаются для работы с одинарной и двойной точностью.

FLOPS всегда одинаковый. Работа с двойной точностью обычно достигается удвоением операционного ресурса, что приводит к падению производительности не более чем в два раза.

Вспомни, что такое «ядро общего назначения» на самом деле и какая его часть отвечает за операции с плавающей точкой.

В действительности все немного иначе.
Рекомендую.
  • +1
avatar
Тут интересные замеры, которые показывают странные соотношения между FP32 и FP64.
Кроме того, не стоит забывать, что, в отличие от CPU, GPU не очень умеют делить и проводить битовые операции… Ну и рекомендую.
  • 0
avatar
Да, замеры и правда интересные.
— The values don’t come from a benchmark tool, it’s just a compilation from articles / reviews.
— So basically theoretical peak performance instead of actual peak performance
Иными словами, сарафанное радио.

Как человеку, рекомендовавшему довольно хорошую книгу (которая уже доступна в 6-м издании) тебе должно быть известно, что пиковая производительность не определяется общими инструментами. Все эти замеры интересны тем, что в них просто что-то написано. Максимум — это возможная бытовая производительность. В худшем случае — фантазии.
  • +1
avatar
Иными словами, сарафанное радио.
К сожалению да, но тем не менее они показывают примерное состояние вещей — реально у GPU была проблема с FP64(в потребительском сегменте), и сейчас её начали решать, и у NVIDIA это неплохо получается. Ждём специализированных карт — они должны быть ещё «вкуснее».

Но, возвращаясь к теме сравнения GPU и суперкомпьютеров опираясь на непонятные FLOPS'ы — надеюсь Вы всё таки согласитесь, что Ваше сравнение некорректно?
  • 0
avatar
взять пару тысяч таких, и будет вполне себе суперкомпьютер. правда ужасно неэффективный, что является одним из основных критериев предмета. А так, если вы хотите попробовать машинное обучение и пошуршать по общедоступным базам — такое решение именно то что надо.
Комментарий отредактирован 2017-12-10 23:36:54 пользователем memzm
  • 0
avatar
правда ужасно неэффективный
Хорошо, а чем он будет неэффективен? По каким критериям?
  • 0
avatar
энергопотреблению и тепловыделению.
Комментарий отредактирован 2017-12-11 00:15:14 пользователем memzm
  • 0
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.