PROC_291219.png
PROC_110120.png
PRICE_15_02_20.png
PRICE_19_05_2020.png
Код: Выделить всё
Test summary
-----------------------
Date: 2020-01-12T00:29:47
CPU: Intel Core i7-9700K @3600 MHz [8 threads]
GPU: NVIDIA GeForce GTX 1070 [ver.N/A]
Mode: FHD + CPU [12 threads]
Comment: 4600 MHz All Cores
Overall scores
-----------------------
Synthetic CPU: MC5754
Real-life: FC4062
Details: synthetic
-----------------------
CPU: compose (single-threaded): 946
CPU: compose (multi-threaded): 6748
CPU: search (single-threaded): 751
CPU: search (multi-threaded): 5016
Details: real-life /FHD
-----------------------
decode video: 37.58x (902.0 fps)
48 fps - vectors search: 3.39x (162.9 fps)
60 fps - frame composition: 3.26x (195.5 fps)
48 fps - [SVP] fastest: 10.29x (494.0 fps)
48 fps - [SVP] simple 1: 7.53x (361.7 fps)
60 fps - [SVP] good: 3.62x (217.3 fps)
60 fps - [SVP] high: 2.16x (129.4 fps)
60 fps - [SVP] highest: 1.18x (70.9 fps)
72 fps - [SVP] simple 2: 6.28x (452.3 fps)
Код: Выделить всё
Date: 2019-10-05T22:23:56
CPU: Intel Core i7-4790K @4000 MHz [8 threads]
GPU: Intel HD Graphics 4600 [ver.10.18.14.5067]
Mode: FHD + GPU [17 threads]
Comment: 4400 MHz All Cores
Overall scores
-----------------------
Synthetic CPU: MC2708
Synthetic GPU: MG4758
Real-life: N/A
Details: synthetic
-----------------------
CPU: compose (single-threaded): 799
CPU: compose (multi-threaded): 3143
CPU: search (single-threaded): 609
CPU: search (multi-threaded): 2379
GPU: system -> GPU transfer: 2704
GPU: GPU -> system transfer: 1584
GPU: calculations: 507
GPU: total score: 3634
Date: 2019-10-05T22:31:42
CPU: Intel Core i7-4790K @4000 MHz [8 threads]
GPU: Intel HD Graphics 4600 [ver.10.18.14.5067]
Mode: FHD + CPU [12 threads]
Overall scores
-----------------------
Real-life: FC2284
Details: real-life /FHD
-----------------------
decode video: 17.96x (431.0 fps)
48 fps - vectors search: 1.78x (85.2 fps)
60 fps - frame composition: 1.81x (108.7 fps)
48 fps - [SVP] fastest: 7.57x (363.4 fps)
48 fps - [SVP] simple 1: 4.00x (192.0 fps)
60 fps - [SVP] good: 1.82x (109.3 fps)
60 fps - [SVP] high: 1.17x (70.4 fps)
60 fps - [SVP] highest: 0.64x (38.7 fps)
72 fps - [SVP] simple 2: 3.40x (245.0 fps)
Видео карта действительно сильна в SIMD-операциях, это когда одна операция (небольшой набор инструкций - шейдер) применяется одновременно к большому массиву несвязанных данных - к каждому пикселю на экране.
Поясню - в задачах, где требуется запустить простой алгоритм над миллионами несвязанных данных, видео карта будет значительно выигрывать, т.к. производительность линейно зависит от количества параллельно обрабатываемых данных, а как известно шейдерных блоков в видео карте тысячи, а не десятки как ядер в процессоре. И именно эту производительность можно наращивать линейно, увеличивая кол-во шейдерных блоков, об этом и вещает Хуанг.
Только проблема в том, о чем Хуанг скромно умолчал, что это ограниченный круг задач и везде где можно было использовать видео карты для расчетов, их иже используют.
Основная масса задач, которые как раз и тормозят, это либо последовательные (не распараллеливаемые) задачи - привет процессорный однопоток, либо результаты надо синхронизировать и синхронизация съедает весь выигрыш - опять привет процессорный однопоток, либо вычисления слишком сложные для шейдера - привет процессорный многопоток.
На счет последнего, почему вообще нужен процессорный многопоток, раз есть замечательные видео карты - дело в том что шейдерные блоки это такие себе мини-мини-процессорные ядра и потому они очень-очень-ущербные в сравнении с ядрами в центральном процессоре. А если сделать и шейдерные блоки такими же мощными, то их резко станет не тысячи, а десятки. Так что выходит заколдованный круг.
Короче для каждой задачи нужен подходящий инструмент! Не случайно даже супер компьютеры не состоят из одних только видео карт. А уж в персональных компьютерах и подавно для видео карт есть, как правило, только их родные задачи - расчет сцен и их отображение.
Понимаешь Андрей, тут лишь вопрос программирования. На самом деле видеокарты можно использовать для любых вычислений, но с оговоркой - в паре с центральным процессором. То есть роль центрального процессора - высокоуровневые управляющие процессы, а роль видеокарты - мощь перемалывания тонн вычислений. Вот в такой связке оно и должно работать. Для этого нужно просто изменить привычки программирования.Только проблема в том, о чем Хуанг скромно умолчал, что это ограниченный круг задач