Рабочая нагрузка гп видеокарта или вычислить amd что лучше

05.02.202429.06.2023 admin 0 Comments

Но для начала немного предыстории от куда вообще появилось это разделение работы видеокарт на два режима работы.

В уже далеком 2017 году (по меркам майнинг индустрии) новейшие на тот момент видеокарты AMD Radeon RX470/RX480 и RX570/RX580 стали постепенно с каждой новой эпохой в майнинге Ethereum терять свою производительность, т.е. хешрейт падал с каждой новой эпохой и общее падение производительности видеокарт Polaris в майнинге Ethereum на тот момент оценивалось в 30%. Эпоха тогда, кстати, была под номером 130, сейчас же 352. То же самое с ростом DAG файла (эпохи) происходило и с видеокартами AMD предыдущих поколений HD 7000, R9 200, R9 300, причем это падение для этих видеокарт началось на год раньше. Этот печальный факт так бы и оставался не замеченным самой AMD если бы не бум криптовалют в 2017 году и Ethereum в частности, когда на рынок оборудования для майнеров обратили свое внимание не только производители видеокарт, но и вообще весь мир.

Что бы не проигрывать конкурентную борьбу за рынок майнинг оборудования своему сопернику Nvidia, которая как раз выпустила очень удачную в плане майнинга 1000 серию своих видеокарт, компания AMD взялась за решение проблемы падения хешрейта своих видеокарт с увеличением DAG файла криптовалюты Ethereum. И первым таким шагом стал выпуск специальных драйверов называемых Blockchain Compute, которые решали проблему падения производительности видеокарт AMD на эпохах выше 130, но только для видеокарт серий RX400 и RX500 и новее. Эти специализированные для майнинга драйвера имели статус Beta и дальнейшего развития не получили, т.к. разработанный функционал был внедрен в обычные «игровые» драйвера, но при этом пользователю необходимо самостоятельно выбирать в каком режиме будет работать его видеокарта: Вычислитель или Графика.

Кому интересен более подробный экскурс в историю, могут почитать следующие материалы:

Включение режима Вычислить или Compute Mode в драйверах AMD Software Radeon Adrenalin. Инструкция.

Данное руководство используйте только если у Вас видеокарты AMD и операционная система Windows. В специальных для майнинга операционных системах на базе Linux в таких действиях нет необходимости.

1. Запустить приложение Driver AMD Adrenalin

Если такого значка в меню Windows Вы не нашли, значит у Вас не установлено приложение AMD Adrenalin. Скачать актуальную версию драйверов для своей операционной системы можно на сайте AMD.com

2. В окне программы управления видеокартами Radeon перейдите в меню ИГРЫ

3. Далее ОБЩИЕ НАСТРОЙКИ

4. В настройках найдите пункт РАБОЧАЯ НАГРУЗКА ГП и выберите ВЫЧИСЛИТЬ вместо ГРАФИКА. Повторить для всех видеокарт AMD в системе (верхнее меню в этом же окне)

5. Перезагрузить компьютер

После изменения режима работы видеокарт AMD Radeon в Compute Mode, производительность (хешрейт) Ваших видеокарт увеличиться на 10-100% в зависимости от алгоритма майнинга. Наибольшее увеличение хешрейта до двух раз будет на алгоритмах Ethash, ProgPow, KawPow, которые в своих расчетах интенсивно используют видеопамять.

Вывод: Всегда, когда используете видеокарты AMD для майнинга криптовалют, переключайте в драйверах режим работы с Видеокарта на Вычислить, что бы максимально эффективно использовать свое оборудование. Для примера популярная видеокарта Radeon RX580 без включения режима Compute Mode выдает 14-16 MH/s при добыче Ethereum, а с включенным режимом Compute Mode 25-33 MH/s в зависимости от разгона GPU и памяти GDDR5.

Подпишись на наш Telegram канал @cryptoage и Вконтакте, узнавай новости про криптовалюты первым.

Общайся с криптоэнтузиастами и майнерами в Telegram чате @CryptoChat

Лучшие биржи для покупки и обмена криптовалют, токенов:

Самая крупная и известная крипто биржа в мире. Надежность и функционал на самом высшем уровне.

Лучшая биржа для торговли крипто фьючерсами. Проводит торги акциями крупных компаний (Apple, Tesla. )

Источник

Рабочая нагрузка гп видеокарта или вычислить amd что лучше

Вообще, должен отметить (из своего опыта), что видеокарты AMD одни из лучших в плане ускорения и повышения количества FPS за счет тонкой настройки параметров электропитания и 3-D графики. Возможно поэтому, я до сих пор не равнодушен к AMD.

С чего начать? С драйверов!

Поэтому простой совет, прежде чем начинать настраивать видеокарту — обновите драйвера (ссылка приведена выше): возможно появились новые функции и параметры, которые помогут оптимизировать работу вашего железа.

Кстати, лет 15 назад, была у меня видеокарта ATI Radeon (точную модель сейчас не назову). Суть в том, что кроме официальных драйверов, были драйвера «не официальные» — Omega Drivers (кстати, отличный пакет драйверов).

Так вот, установив эти драйвера и включив максимальную производительность (в их настройках) — можно было существенно увеличить производительность видеокарты!

Не мог никак пройти один уровень в игре, т.к. он жутко «тормозил» (FPS: 27-30). После установки Omega Drivers и их настройки, FPS поднялся до 36-40. Не много, но уровень пройти это позволило.

Прим. : сейчас устанавливать Omega Drivers — нет смысла (это была не реклама, просто показательный пример).

Настройка графики в AMD Catalyst Control центре // для повышения производительности

Рис. 1. Два способа, как можно открыть настройки AMD Radeon видеокарты / кликабельно

После чего, для включения максимальной производительности видеокарты, нужно указать следующее (см. рис. 2, некоторые меню могут отличаться, но основное все будет совпадать ):

Рис. 2. Настройки Radeon — глобальные параметры / Кликабельно

Настройки видеокарты AMD (еще одна версия панели управления AMD Radeon)

Примечание : опция может отсутствовать в некоторых версиях драйверов.

Рис. 3.1. AMD Radeon — оптимизировать качество или производительность

Переключение графики, параметры //встроенная и дискретная видеокарты

Когда вы запускаете какую-нибудь игру — должна начать свою работу дискретная, но иногда этого не происходит. В результате вы играете «на интегрированной видеокарте» — поэтому-то игра и тормозит. Чтобы ускорить работу видеокарты AMD, для начала, нужно чтобы она хотя бы была задействована и работала.

В нем нужно задать следующие параметры:

Рис. 4. Глобальные параметры переключаемой графики

Рис. 5. Параметры приложений переключаемой графики

Осталось только сохранить введенные настройки и попробовать снова запустить игру.

В этом гайде мы расскажем о загрузке видеокарты. Многих волнует вопрос, какая же нагрузка должна быть у видеокарты в играх. Нормально ли, что видеокарта загружена на 100% или, например, всего на 60%?

Как проверить, на сколько загружена видеокарта и процессор

Чтобы вообще понять суть проблемы, нужно сначала узнать, какая загрузка у вашей видеокарты в конкретной игре. Для этого воспользуйтесь бесплатной программой MSI Afterburner. Мы уже подробно рассказывали о ней в гайде «Как настроить мониторинг MSI Afterburner в играх», поэтому здесь повторяться не будем.

Видеокарта загружена на 100%

Если в играх ваша видеокарта загружена на 100%, то это абсолютно нормально. Она работает на полную мощность и каких-либо проблем с железом нет. Но если FPS при этом низкий, значит ваша карточка просто не справляется с игрой.

Если же видеокарта остается под нагрузкой даже в простое (когда вы ничего не запускали) или при выполнении несложных задач, то это плохой признак. Вероятно, в системе засел вирус-майнер. При помощи диспетчера задач выявите процесс, который грузит видеокарту и завершите его. Далее, нужно будет почистить систему. Подробнее можно прочитать в нашем гайде о перегревах видеокарты.

Видеокарта загружена не на 100% (недогружена). Нормально ли это?

Если видеокарта недогружена, то все гораздо сложнее. Само по себе это еще ни о чем не говорит, но нужно разбираться. Происходит это потому, что на видеокарту нет нагрузки. Такое часто происходит в нетребовательных играх или при низких настройках графики, когда приложение не может создать серьезной нагрузки на железо. Но если игра требовательная и современная, то могут быть несколько причин.

Первое, на что нужно смотреть — частота кадров. Если у вас стоит ограничение, например, на 60 кадров и видеокарта их выдает, то беспокоиться не о чем. Попробуйте поднять качество графики или убрать ограничение, чтобы повысить загрузку. Если же видеокарта недогружена и FPS при этом низкий, игра тормозит, то это непорядок.

Как заставить видеокарту работать на 100%

Если видеокарта недогружена и это проблемный случай, то нужно выяснять, почему так происходит. Самые распространенные причины: слабый процессор или плохая оптимизация игры. О них мы поговорим подробнее.

Слабый процессор. Есть такое понятие «раскрытие видеокарты процессором». Кто-то считает, что это миф, а кто-то принимает за чистую монету. На самом деле проблема несоответствия процессора и видеокарты имеет место, но она гораздо сложнее. Дело в том, что один и тот же процессор может как «раскрыть», так и не «раскрыть» видеокарту. К примеру, в разрешении 1080p видеокарта недогружена, но стоит перейти в 4К и загрузка увеличивается. Вот и все раскрытие.

Но важно вот что: если процессор не может обеспечить комфортный FPS, то и видеокарта будет простаивать. Она хоть и может выдать больше кадров, но процессор нет. Поэтому вместо плавного геймплея получите слайд-шоу. В таком случае нужно обновить процессор или разогнать его. В последнем случае чудес ждать не стоит. Если процессор совсем устарел, разгон не поможет.

Кроме того, не лишним будет проверить и температуру процессора. Как это сделать, мы рассказывали в подробном гайде. Вполне возможно, что CPU перегревается и начинает троттлить (пропускать такты и снижать производительность) поэтому и не вывозит игры. Позаботьтесь о достойном охлаждении.

Плохая оптимизация. Если игра плохо оптимизирована, то она будет тормозить, независимо от вашего железа. Типичная картина плохой оптимизации была на запуске Mafia 3. Разработчики установили лок на 30 FPS, что в итоге привело к недогрузу видеокарты и консольному фреймрейту.

Если у вас проблемы такого рода, то попробуйте обновить или переустановить драйвера, систему Windows или саму игру (если на нее есть патчи). Однако когда причина в кривом коде, никакие переустановки драйверов не помогут, пока проблему не исправят.

Прочие проблемы. Могут быть и другие причины. Так, сама видеокарта может быть неисправна. В этом случае стоит проверить ее с другим железом или протестировать в стресс-тестах типа Furmark. Кроме того, узким местом в системе могут быть и другие комплектующие. Производительность может зависеть от оперативной памяти. К примеру, в ноутбуках часто ставят только одну планку памяти и работает она в одноканальном режиме.

Также стоит проверить режимы энергосбережения и другие настройки видеокарты и Windows для игр. Подробнее об этом читайте в гайдах «Как настроить Windows 10 для игр» и «Как настроить видеокарту NVIDIA для игр».

Как заработать на майнинге видеокарт AMD в два раза больше? Как увеличить хэшрейт в два раза?

Просто включите «режим вычислений» в настройках драйвера AMD Radeon — это переключит вашу карту в режим оптимальный для майнинга криптовалют.

Не нужно устанавливать дополнительные программы или блокчейн драйвера. Всё делается в настройках драйвера Radeon.
Рассказываем как!

Как включить режим вычислений?

Если у вас Windows 10 или Windows 8

Зайдите в настройки драйвера и включите режим вычислений для каждой видеокарты.

Некоторые модели Radeon автоматически переключаются на нужный режим.
В таком случае вы не найдёте настройки «режима вычислений» в драйверах AMD.

Нажмите правой кнопкой мыши по рабочему столу и откройте «Настройки Radeon».

Откроется окно драйвера. Нажмите на шестерёнку в правом верхнем углу.

Перейдите во вкладку «Видеокарта».

Пролистайте вниз и нажмите «Дополнительно».

В выпавшем меню переключите пункт «Рабочая нагрузка ГП» в режим «Вычислить».

Драйвер предложит перезапуститься, после чего ваша видеокарта будет готова майнить!

Если у вас несколько видеокарт, повторите процедуру для каждой карты, переключая их во вкладке «Видеокарта».

А если у меня Windows 7?

Почему-то AMD не добавила настройку режима вычислений на Windows 7. Поэтому просто установите Блокчейн-драйвер от AMD.

В этих драйверах режим вычислений включён по умолчанию. Помните, что этот драйвер оптимизирует видеокарту для вычислений, поэтому играть или работать с графикой лучше на обычных драйверах.

Теперь пора зарабатывать!

— Криптекс выбирает самый доходный алгоритм для вашей системы. — Киви, Яндекс.Деньги, ВебМани, банковские карты, Биткоин, Эфир. — для майнеров которым нужен полный контроль.

Ну а если включить режим вычислений так и не получилось…

Попросите совета в телеграм чате Криптекса — мы и наши опытные пользователи помогут во всём разобраться 💪🏻

Любой компьютер нуждается в регулярном обслуживании, но игровой компьютер нуждается в нём вдвойне: оно должно быть не только более частое, но и более тщательное. Помните знаменитый «синий экран смерти», вылетавший в разгаре особо ожесточённых баталий? И в большинстве случаев проблема на самом деле заключалась в перегреве комплектующих, которые выходили на нештатные режимы работы, приводящие к ошибкам.

Влияет ли температура на производительность? Если она находится в пределах рабочего диапазона, то нет. Так что дополнительно охлаждать микросхемы, функционирующие в штатном режиме, не имеет никакого смысла.

В этой статье мы поговорим о том, в чём могут заключаться причины перегрева центрального и графического процессоров, как отслеживать их температуру и какая температура является нормальной для компьютера, нагруженного современными играми. Статья адресована в первую очередь не самым продвинутым пользователям, но надеемся, что и эксперты смогут почерпнуть в ней полезную информацию.

Диапазон допустимых температур для современных центральных и графических процессоров стал немного ниже, чем в прошлом, что связано с более сложными технологиями и более тонкими техпроцессами. При этом пороговые величины у разных моделей и разных производителей отличаются, поэтому невозможно дать какое-то одно универсальное значение и назвать его «идеальной игровой температурой». Давайте разбираться.

Центральные процессоры

Сегодня для сборки игровых компьютеров используются процессоры двух семейств Intel Core и AMD Ryzen. Производители указывают в документации максимальные рабочие температуры в 100 и 95 градусов Цельсия для чипов Core и Ryzen соответственно, но вы вряд ли сможете разогреть их до таких температур, если только не будете заниматься экстремальным разгоном при недостаточном охлаждении. При обычной тяжёлой нагрузке температура может лишь слегка переходить за 85 градусов при условии, что вы используете штатный кулер, а процессор работает на штатных частотах. Если температура выше, то что-то здесь не так, но об этом чуть позже.

Графические процессоры

Здесь выбор между продукцией двух производителей, AMD и Nvidia, однако, в отличие от центральных процессоров, эти компании редко самостоятельно выпускают готовые видеокарты — этим занимаются производители-партнёры, которые устанавливают на карты различные системы охлаждения.

Существует два основных типа штатно устанавливаемых активных систем охлаждения видеокарт: открытые вентиляторы и центробежный кулер в закрытом коробе. Первый — самый распространённый вариант охлаждения, который применяется в видеокартах любого класса. Один, два или три вентилятора прогоняют воздух через установленный на карте радиатор. В этом случае качественному охлаждению видеокарты способствуют правильно установленные корпусные вентиляторы.

Второй тип систем охлаждения устанавливается на высокопроизводительные видеокарты, при этом единственный турбовентилятор засасывает холодный воздух, прогоняет его через радиатор и выдувает горячий воздух через решётки в задней части корпуса. Температура таких карт значительно меньше зависит от потоков, организованных корпусными вентиляторами, и они обычно работают на более высоких температурах.

Практически во всех современных видеокартах реализована адаптивная система регулировки оборотов вентиляторов. Это значит, что до достижения определённой температуры, обычно около 30-40 °C, вентиляторы либо вообще не вращаются, либо вращаются на минимальных оборотах. Это сделано как для снижения энергопотребления, так и для снижения уровня шума системы в простое. Однако при этом незагруженная карта может нагреваться больше, чем могла бы при работающих вентиляторах.

Как отслеживать температуру ЦП и ГП

За счет многочисленных датчиков, встроенных как в сами процессоры и видеокарты, так и в материнские платы, мы можем точно определить температуру любого компонента. Но для этого требуется соответствующее программное обеспечение.

Способ, не требующий установки никаких дополнительных программ, заключается в том, чтобы посмотреть температуру в BIOS материнской платы. Но для этого придётся специально перезагружать компьютер, так что имеет смысл лишь периодически проводить такие проверки для оценки состояния системы. Многие материнские платы комплектуются фирменным софтом, который позволяет просматривать те же самые данные из среды Windows.

Утилиты производителей

Компании AMD, Intel и Nvidia выпускают специальные утилиты для мониторинга и настройки (разгона) своих центральных и графических процессоров.

Источник

Рабочая нагрузка гп видеокарта или вычислить amd что лучше

Включение режима Compute Mode в драйверах AMD Software Radeon Adrenalin — решает большинство проблем с низким хешрейтом видеокарт Radeon. Инструкция

Информация о материале Опубликовано: 31.07.2020, 05:31

Видеокарты AMD Radeon заслуженно пользуются большой популярностью для майнинга криптовалют, т.к. предлагают лучшее соотношение цены к производительности, чем конкурирующие решения от компании Nvidia. Но при этом, что бы получить максимум хешрейта с видеокарт AMD нужно потратить гораздо большей усилий и знаний, по сравнению с Nvidia, т.е. принципом «включил и работай» компания AMD предпочитает не руководствоваться. Одной из таких «фишек» компании AMD, которую следует знать всем кто увлекается майнингом криптовалют — это возможность работы драйверов видеокарт AMD Radeon в двух различных режимах: Compute (Вычислитель) и Graphics (Графика). Причем по умолчанию включен именно режим Graphics, в котором видеокарты AMD выдают хешрейт при майнинге криптовалют ниже на 20-50%, чем в режиме Compute. Если Вы еще не знали про такую возможность в драйверах AMD Software Radeon Adrenalin, то этот материал для Вас, в котором мы расскажем как переключить работу ваших видеокарт AMD из режима Графика в Вычислитель.

Кому интересен более подробный экскурс в историю, могут почитать следующие материалы:

1. Запустить приложение Driver AMD Adrenalin

2. В окне программы управления видеокартами Radeon перейдите в меню ИГРЫ

3. Далее ОБЩИЕ НАСТРОЙКИ

4. В настройках найдите пункт РАБОЧАЯ НАГРУЗКА ГП и выберите ВЫЧИСЛИТЬ вместо ГРАФИКА. Повторить для всех видеокарт AMD в системе (верхнее меню в этом же окне)

5. Перезагрузить компьютер

Переключение между графическими и вычислительными рабочими нагрузками графического процессора в настройках AMD Radeon™

Тип материала Установка и настройка

Идентификатор статьи 000028819

Последняя редакция 30.01.2020

Настройки AMD Radeon теперь позволяют оптимизировать графический процессор для графики или вычислительных рабочих нагрузок. Переключение на рабочую нагрузку для вычислений должно обеспечить более высокую производительность благодаря Блокчейн вычислительных приложений. Дополнительную информацию о технологии Блокчейн COMPUTE можно найти в Интернете.

Биржа	Преимущества	Бонусы при регистрации
Binance

Примечание

Этот вариант доступен на поддерживаемых графических адаптерах, использующих AMD Radeon Crimson Live Edition 17.10.2 и более поздних версий. Информация о поддерживаемых графических процессорах представлена в примечаниях к версии драйвера.

В следующих шагах объясняется, как получить доступ к параметрам рабочей нагрузки GPU.

* Корпорация Intel предложите вам материалы на сторонних веб-сайтах для вашего удобства и может предоставить ссылки на дополнительные сайты сторонних компаний. Предоставление такого контента и/или ссылок означает только предложения и не должно считаться одобрением или рекомендацией для выполнения каких-либо конкретных действий. Выполнение действий, рекомендованных сторонними поставщиками, может привести к неправильной работе, повреждению системной платы или процессора или сокращению срока службы продукции. Корпорация Intel не несет никакой ответственности в отношении использования вами сторонних компаний или материалов, а также отказывается от прямых или косвенных гарантий, связанных с сайтами или материалами сторонних компаний. Корпорация Intel не контролирует и не проверяет сторонние материалы или веб-сайты сторонних компаний, упоминаемые на веб-сайтах других компаний. Вы должны посетить веб-сайт, на котором есть ссылка, и подтвердить точность данных, указанных в ссылке.

Вычисления на GPU – зачем, когда и как. Плюс немного тестов

Всем давно известно, что на видеокартах можно не только в игрушки играть, но и выполнять вещи, никак не связанные с играми, например, нейронную сеть обучить, криптовалюту помайнить или же научные расчеты выполнить. Как так получилось, можно прочитать тут, а я хотел затронуть тему того, почему GPU может быть вообще интересен рядовому программисту (не связанному с GameDev), как подступиться к разработке на GPU, не тратя на это много времени, принять решение, нужно ли вообще в эту сторону смотреть, и «прикинуть на пальцах», какой профит можно получить.

Статья написана по мотивам моего выступления на HighLoad++. В ней рассматриваются в основном технологии, предлагаемые компанией NVIDIA. У меня нет цели рекламировать какие-либо продукты, я лишь привожу их в качестве примера, и наверняка что-то похожее можно найти у конкурирующих производителей.

Два процессора можно сравнить по разным критериям, наверное, самые популярные — это частота и количество ядер, размер кэшей и прочее, но в конечном счете, нас интересует, сколько операций процессор может выполнить за единицу времени, что это за операции вопрос отдельный, но наиболее распространенной метрикой является количество операций с плавающей запятой в секунду — flops. И когда мы хотим сравнить теплое с мягким, а в нашем случае GPU с CPU, эта метрика приходится как нельзя кстати.

Ниже на графике изображены рост этих самых флопсов с течением времени для процессоров и для видеокарт.

(Данные собраны из открытых источников, нет данных за 2019-20 годы, т.к. там не все так красиво, но GPU все-таки выигрывают)

Что ж, заманчиво, не правда ли? Перекладываем все вычисления с CPU на GPU и получаем в восемь раз лучшую производительность!

Но, конечно же, не все так просто. Нельзя просто так взять и переложить все на GPU, о том почему, мы поговорим дальше.

Привожу многим знакомую картинку с архитектурой CPU и основными элементами:

Что здесь особенного? Одно ядро и куча вспомогательных блоков.

А теперь давайте посмотрим на архитектуру GPU:

У видеокарты множество вычислительных ядер, обычно несколько тысяч, но они объединены в блоки, для видеокарт NVIDIA обычно по 32, и имеют общие элементы, в т.ч. и регистры. Архитектура ядра GPU и логических элементов существенно проще, чем на CPU, а именно, нет префетчеров, бранч-предикторов и много чего еще.

Что же, это ключевые моменты отличия в архитектуре CPU и GPU, и, собственно, они и накладывают ограничения или, наоборот, открывают возможности к тому, что мы можем эффективно считать на GPU.

Я не упомянул еще один важный момент, обычно, видеокарта и процессор не «шарят» память между собой и записать данные на видеокарту и считать результат обратно — это отдельные операции и могут оказаться «бутылочным горлышком» в вашей системе, график зависимости времени перекачки от размера данных приведен далее в статье.

Ограничения и возможности при работе с GPU

Какие ограничения накладывает такая архитектура на выполняемые алгоритмы:

Какие возможности открывает:

Трансформация

У нас есть два массива, A и B, и мы хотим к каждому элементу массива A добавить элемент из массива B. Ниже приведен пример на C, хотя, надеюсь, он будет понятен и тем, кто не владеет этим языком:

(не забываем, что пример нужно компилировать компилятором от NVIDIA)

Как видите, thrust::sort очень похож на аналогичный алгоритм из STL. Эта библиотека скрывает много сложностей, в особенности разработку подпрограммы (точнее ядра), которая будет выполняться на видеокарте, но при этом лишает гибкости. Например, если мы хотим отсортировать несколько гигабайт данных, логично было бы отправить кусок данных на карту запустить сортировку, и пока выполняется сортировка, дослать еще данные на карту. Такой подход называется latency hiding и позволяет более эффективно использовать ресурсы серверной карты, но, к сожалению, когда мы используем высокоуровневые библиотеки, такие возможности остаются скрытыми. Но для прототипирования и замера производительности как раз таки подходят, в особенности с thrust можно замерить, какой оверхед дает пересылка данных.

Я написал небольшой бенчмарк с использованием этой библиотеки, который выполняет несколько популярных алгоритмов с разным объемом данных на GPU, давайте посмотрим, какие результаты получились.

Для тестирования GPU я взял инстанс в AWS с видеокартой Tesla k80, это далеко не самая мощная серверная карта на сегодняшний день (самая мощная Tesla v100), но наиболее доступная и имеет на борту:

И для тестов на CPU я взял инстанс с процессором Intel Xeon CPU E5-2686 v4 @ 2.30GHz

Трансформация

Время выполнения трансформации на GPU и CPU в мс

Как видите, обычная трансформация элементов массива выполняется по времени примерно одинаково, как на GPU, так и на CPU. А все почему? Потому что оверхед на пересылку данных на карту и обратно съедает весь performance boost (про оверхед мы поговорим отдельно), да и вычислений на карте выполняется относительно немного. К тому же не стоит забывать, что процессоры также поддерживают SIMD инструкции, и компиляторы в простых случаях могут эффективно их задействовать.

Давайте теперь посмотрим, насколько эффективно выполняется агрегация на GPU.

Агрегация

Время выполнения агрегации на GPU и CPU в мс

В примере с агрегацией мы уже видим существенный прирост производительности с увеличением объема данных. Стоит также обратить внимание на то, что в память карты мы перекачиваем большой объем данных, а назад забираем только одно агрегированное значение, т.е. оверхед на пересылку данных из карты в RAM минимален.

Перейдем к самому интересному примеру — сортировке.

Сортировка

Время выполнения сортировки на GPU и CPU в мс

Несмотря на то, что мы пересылаем на видеокарту и обратно весь массив данных, сортировка на GPU 800 MB данных выполняется примерно в 25 раз быстрее, чем на процессоре.

Как видно из примера с трансформацией, не всегда очевидно, будет ли GPU эффективен даже в тех задачах, которые хорошо параллелятся. Причиной тому — оверхед на пересылку данных из оперативной памяти компьютера в память видеокарты (в игровых консолях, кстати, память расшарена между CPU и GPU, и нет необходимости пересылать данные). Одна из характеристик видеокарты это — memory bandwidth или пропускная способность памяти, которая определяет теоретическую пропускную способность карты. Для Tesla k80 это 480 GB/s, для Tesla v100 это уже 900 GB/s. Также на пропускную способность будет влиять версия PCI Express и имплементация того, как вы будете передавать данные на карту, например, это можно делать в несколько параллельных потоков.

Давайте посмотрим на практические результаты, которые удалось получить для видеокарты Tesla k80 в облаке Amazon:

Время пересылки данных на GPU, сортировки и пересылки данных обратно в RAM в мс

HtoD — передаем данные на видеокарту

GPU Execution — сортировка на видеокарте

DtoH — копирование данных из видеокарты в оперативную память

Первое, что можно отметить — считывать данные из видеокарты получается быстрее, чем записывать их туда.

Второе — при работе с видеокартой можно получить latency от 350 микросекунд, а этого уже может хватить для некоторых low latency приложений.

Ниже на графике приведен оверхед для большего объема данных:

Время пересылки данных на GPU, сортировки и пересылки данных обратно в RAM в мс

Наиболее частый вопрос — чем отличается игровая видеокарта от серверной? По характеристикам они очень похожи, а цены отличаются в разы.

Основные отличия серверной (NVIDIA) и игровой карты:

Это, пожалуй, основные важные отличия, которые я нашел.

Многопоточность

После того как мы разобрались, как запустить простейший алгоритм на видеокарте и каких результатов можно ожидать, следующий логичный вопрос, а как будет себя вести видеокарта при обработке нескольких параллельных запросов. В качестве ответа у меня есть два графика выполнения вычислений на GPU и процессоре с 4-мя и 32-мя ядрами:

Время выполнения математических расчетов на GPU и CPU c матрицами размером 1000 x 60 в мс

На этом графике выполняются расчеты с матрицами размером 1000 x 60 элементов. Запускаются вычисления из нескольких программных потоков, для GPU дополнительно создается отдельный stream для каждого CPU-потока (используется тот самый Hyper-Q).

Как видно, процессор справляется с такой нагрузкой очень хорошо, при этом latency для одного запроса на GPU существенно растет с увеличением числа параллельных запросов.

Время выполнения математических расчетов на GPU и CPU c матрицами 10 000 x 60 в мс

На втором графике те же самые вычисления, но с матрицами в 10 раз больше, и GPU под такой нагрузкой ведет себя существенно лучше. Эти графики очень показательны, и можно сделать вывод: поведение под нагрузкой зависит от характера самой нагрузки. Процессор может также довольно эффективно справляться с матричными вычислениями, но до определенных пределов. Для видеокарты характерно то, что для небольшой вычислительной нагрузки производительность падает примерно линейно. С увеличением нагрузки и количества параллельных потоков видеокарта справляется уже лучше.

Сложно строить гипотезы, как будет себя вести GPU в различных ситуациях, но, как видите, при определенных условиях серверная карта может достаточно эффективно обрабатывать запросы из нескольких параллельных потоков.

Обсудим еще несколько вопросов, которые могут возникнуть у вас, если вы все-таки решили использовать GPU в своих проектах.

Ограничение ресурсов

Как мы уже говорили, два основных ресурса видеокарты — это вычислительные ядра и память.

К примеру, у нас несколько процессов или контейнеров, использующих видеокарту, и хотелось бы иметь возможность поделить видеокарту между ними. К сожалению, простого API для этого нет. NVIDIA предлагает технологию vGPU, но карту Tesla k80 я не нашел в списке поддерживаемых, и насколько мне удалось понять из описания, технология больше заточена на виртуальные дисплеи, чем на вычисления. Возможно, AMD предлагает что-то более подходящее.

Поэтому, если планируете использовать GPU в своих проектах, стоит рассчитывать на то, что приложение будет использовать видеокарту монопольно, либо вы будете программно контролировать объем выделяемой памяти и количество ядер, используемых для вычислений.

Контейнеры и GPU

Если с ограничением ресурсов вы разобрались, то следующий логичный вопрос: а если в сервере несколько видеокарт?

Опять же, можно на уровне приложения решать, какой GPU оно будет использовать.

Другой более удобный способ — это Docker-контейнеры. Можно использовать и обычные контейнеры, но NVIDIA предлагает свои контейнеры NGC, с оптимизированными версиями различного софта, библиотек и драйверов. Для одного контейнера можно ограничить количество используемых GPU и их видимость для контейнера. Оверхед на использования контейнера около 3%.

Работа в кластере

Другой вопрос, что делать, если вы хотите выполнять одну задачу на нескольких GPU в рамках одного сервера или кластера?

Если вы выбрали библиотеку на подобии thrust или более низкоуровневое решение, то задачу придется решать вручную. Высокоуровневые фреймворки, например, для машинного обучения или нейронных сетей, обычно поддерживают возможность использования нескольких карт из коробки.

Дополнительно хотелось бы отметить то, что, например, NVIDIA предлагает интерфейс прямого обмена данными между картами — NV, который существенно быстрее чем PCI Express. И есть технология прямого доступа к памяти карты из других PCI Express устройств — GPUDirect RDMA, в т.ч. и сетевых.

Если вы размышляете об использовании GPU в своих проектах, то GPU, скорее всего, вам подойдет если:

Заранее также стоит задаться вопросами:

На этом все, надеюсь, материал будет вам полезен и поможет принять верное решение!

Бенчмарк и результаты на github — https://github.com/tishden/gpu_benchmark/tree/master/cuda

В дополнение к теме запись доклада «Базы данных на GPU — архитектура, производительность и перспективы использования»

Источник

Обучающий портал info.frozen-yogurt.ru

Рабочая нагрузка гп видеокарта или вычислить amd что лучше

Включение режима Вычислить или Compute Mode в драйверах AMD Software Radeon Adrenalin. Инструкция.

Рабочая нагрузка гп видеокарта или вычислить amd что лучше

С чего начать? С драйверов!

Настройка графики в AMD Catalyst Control центре // для повышения производительности

Переключение графики, параметры //встроенная и дискретная видеокарты

Как проверить, на сколько загружена видеокарта и процессор

Видеокарта загружена на 100%

Видеокарта загружена не на 100% (недогружена). Нормально ли это?

Как заставить видеокарту работать на 100%

Как включить режим вычислений?

Если у вас Windows 10 или Windows 8

А если у меня Windows 7?

Теперь пора зарабатывать!

Ну а если включить режим вычислений так и не получилось…

Центральные процессоры

Графические процессоры

Как отслеживать температуру ЦП и ГП

Утилиты производителей

Рабочая нагрузка гп видеокарта или вычислить amd что лучше

Включение режима Compute Mode в драйверах AMD Software Radeon Adrenalin — решает большинство проблем с низким хешрейтом видеокарт Radeon. Инструкция

Переключение между графическими и вычислительными рабочими нагрузками графического процессора в настройках AMD Radeon™

Вычисления на GPU – зачем, когда и как. Плюс немного тестов

Ограничения и возможности при работе с GPU

Трансформация

Трансформация

Агрегация

Сортировка

Многопоточность

Ограничение ресурсов

Контейнеры и GPU

Работа в кластере

Добавить комментарий

Включение режима Вычислить или Compute Mode в драйверах AMD Software Radeon Adrenalin. Инструкция.

Рабочая нагрузка гп видеокарта или вычислить amd что лучше

С чего начать? С драйверов!

Настройка графики в AMD Catalyst Control центре // для повышения производительности

Переключение графики, параметры //встроенная и дискретная видеокарты

Как проверить, на сколько загружена видеокарта и процессор

Видеокарта загружена на 100%

Видеокарта загружена не на 100% (недогружена). Нормально ли это?

Как заставить видеокарту работать на 100%

Как включить режим вычислений?

Если у вас Windows 10 или Windows 8

А если у меня Windows 7?

Теперь пора зарабатывать!

Ну а если включить режим вычислений так и не получилось…

Центральные процессоры

Графические процессоры

Как отслеживать температуру ЦП и ГП

Утилиты производителей

Рабочая нагрузка гп видеокарта или вычислить amd что лучше

Включение режима Compute Mode в драйверах AMD Software Radeon Adrenalin — решает большинство проблем с низким хешрейтом видеокарт Radeon. Инструкция

Переключение между графическими и вычислительными рабочими нагрузками графического процессора в настройках AMD Radeon™

Вычисления на GPU – зачем, когда и как. Плюс немного тестов

Ограничения и возможности при работе с GPU

Трансформация

Трансформация

Агрегация

Сортировка

Многопоточность

Ограничение ресурсов

Контейнеры и GPU

Работа в кластере

Вам также понравится

С антибиотиками для микрофлоры взрослым что

актриса хилькевич биография и личная жизнь

Ремонт в новой квартире с чего начинать пошагово

Добавить комментарий