?

Log in

No account? Create an account

Компьютерная лингвистика

Новостная лента www.solarix.ru

Previous Entry Share Next Entry
Сравнение i7-4790K + NVidia GTX 980 vs i7-9700K + NVidia GTX 1080 Ti на нейросетевой задаче
kelijah
В отличие от тестов на userbenchmark.com сравнивнение сделано на реальной практической задаче nn_wordcopy3.py. Предметная область - NLP. Данные для обучения одинаковые.

Программное окружение в обоих случаях практически идентично - Ubuntu, Python 2, текущие версии tensorflow, CUDA 9.0. В обоих случаях видно, что все ядра CPU загружены, хотя и не полностью. Формально оба CPU держат 8 потоков, но у i7-9700 это 8 реальных ядер, а у i7-4790 4 ядра с гипертредингом. Но основная нагрузка лежит на GPU.

Машина №1 i7-4790K, 32 Гб памяти DDR3, NVidia GTX 980, материнская плата MSI H97 GAMING.
Детальная инфа (выдача sudo lshw и nvidia-smi):

    product: MS-7918 (To be filled by O.E.M.)
    vendor: MSI
    version: 1.0
    serial: To be filled by O.E.M.
    width: 64 bits
    capabilities: smbios-2.8 dmi-2.7 vsyscall32
    configuration: administrator_password=disabled boot=normal chassis=desktop family=To be filled by O.E.M. frontpanel_password=disabled keyboard_password=disabled power-on_password=disabled sku=To be filled by O.E.M. uuid=00000000-0000-0000-0000-D8CB8A6FE07A
  *-core
       description: Motherboard
       product: H97 GAMING 3 (MS-7918)
       vendor: MSI
       physical id: 0
       version: 1.0
       serial: To be filled by O.E.M.
       slot: To be filled by O.E.M.
     *-firmware
          description: BIOS
          vendor: American Megatrends Inc.
          physical id: 0
          version: V1.7
          date: 12/24/2014
          size: 64KiB
          capacity: 15MiB
          capabilities: pci upgrade shadowing cdboot bootselect socketedrom edd int13floppy1200 int13floppy720 int13floppy2880 int5printscreen int9keyboard int14serial int17printer acpi usb biosbootspecification uefi
     *-cpu
          description: CPU
          product: Intel(R) Core(TM) i7-4790K CPU @ 4.00GHz
          vendor: Intel Corp.
          physical id: 3d
          bus info: cpu@0
          version: Intel(R) Core(TM) i7-4790K CPU @ 4.00GHz
          slot: SOCKET 0
          size: 4155MHz
          capacity: 4400MHz
          width: 64 bits
          clock: 100MHz
          capabilities: x86-64 fpu fpu_exception wp vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 sdbg fma cx16 xtpr pdcm pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm cpuid_fault invpcid_single pti ssbd ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid fsgsbase tsc_adjust bmi1 avx2 smep bmi2 erms invpcid xsaveopt dtherm ida arat pln pts flush_l1d cpufreq
          configuration: cores=4 enabledcores=4 threads=8
        *-cache:0
             description: L1 cache
             physical id: 3e
             slot: CPU Internal L1
             size: 256KiB
             capacity: 256KiB
             capabilities: synchronous internal write-back
             configuration: level=1
        *-cache:1
             description: L2 cache
             physical id: 3f
             slot: CPU Internal L2
             size: 1MiB
             capacity: 1MiB
             capabilities: synchronous internal write-back unified
             configuration: level=2
        *-cache:2
             description: L3 cache
             physical id: 40
             slot: CPU Internal L3
             size: 8MiB
             capacity: 8MiB
             capabilities: synchronous internal write-back unified
             configuration: level=3
     *-memory
          description: System Memory
          physical id: 42
          slot: System board or motherboard
          size: 32GiB
        *-bank:0
             description: DIMM DDR3 Synchronous 1600 MHz (0,6 ns)
             product: DDR3 1600 2OZ
             vendor: Fujitsu
             physical id: 0
             serial: 0000C437
             slot: ChannelA-DIMM0
             size: 8GiB
             width: 64 bits
             clock: 1600MHz (0.6ns)
        *-bank:1
             description: DIMM DDR3 Synchronous 1600 MHz (0,6 ns)
             product: DDR3 1600 2OZ
             vendor: Fujitsu
             physical id: 1
             serial: 0000C447
             slot: ChannelA-DIMM1
             size: 8GiB
             width: 64 bits
             clock: 1600MHz (0.6ns)
        *-bank:2
             description: DIMM DDR3 Synchronous 1600 MHz (0,6 ns)
             product: DDR3 1600G 2OZ
             vendor: Fujitsu
             physical id: 2
             serial: 00002C4E
             slot: ChannelB-DIMM0
             size: 8GiB
             width: 64 bits
             clock: 1600MHz (0.6ns)
        *-bank:3
             description: DIMM DDR3 Synchronous 1600 MHz (0,6 ns)
             product: DDR3 1600G 2OZ
             vendor: Fujitsu
             physical id: 3
             serial: 00002C7C
             slot: ChannelB-DIMM1
             size: 8GiB
             width: 64 bits
             clock: 1600MHz (0.6ns)


+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.130                Driver Version: 384.130                   |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 980     Off  | 00000000:01:00.0 Off |                  N/A |
| 34%   61C    P2    82W / 195W |   3869MiB /  4038MiB |     89%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1235      G   /usr/lib/xorg/Xorg                           105MiB |
|    0      1683      G   compiz                                        37MiB |
|    0      2437      C   python                                      3713MiB |
+-----------------------------------------------------------------------------+





Машина №2 i7-9700K, 64 Гб памяти DDR4, NVidia GTX 1080 Ti, материнская плата MSI Z390 CARBON GAMING
Выдача sudo lshw и nvidia-smi:

    продукт: MS-7B17 (Default string)
    производитель: Micro-Star International Co., Ltd.
    версия: 1.0
    серийный №: Default string
    разрядность: 64 bits
    возможности: smbios-2.8 dmi-2.8 smp vsyscall32
    конфигурация: boot=normal chassis=desktop family=Default string sku=Default string uuid=00000000-0000-0000-0000-00D8611296B4
  *-core
       описание: Материнская плата
       продукт: MPG Z390 GAMING PRO CARBON (MS-7B17)
       производитель: Micro-Star International Co., Ltd.
       физический ID: 0
       версия: 1.0
       серийный №: IA16401559
       слот: Default string
     *-firmware
          описание: BIOS
          производитель: American Megatrends Inc.
          физический ID: 0
          версия: 1.00
          date: 09/03/2018
          размер: 64KiB
          capacity: 15MiB
          возможности: pci upgrade shadowing cdboot bootselect socketedrom edd int13floppy1200 int13floppy720 int13floppy2880 int5printscreen int9keyboard int14serial int17printer acpi usb biosbootspecification uefi
     *-memory
          описание: Системная память
          физический ID: 39
          слот: Системная плата или материнская плата
          размер: 64GiB
        *-bank:0
             описание: DIMM DDR4 Синхронная 2133 MHz (0,5 ns)
             продукт: CMU64GX4M4C3000C15
             производитель: AMI
             физический ID: 0
             серийный №: 00000000
             слот: ChannelA-DIMM0
             размер: 16GiB
             разрядность: 64 bits
             частота: 2133MHz (0.5ns)
        *-bank:1
             описание: DIMM DDR4 Синхронная 2133 MHz (0,5 ns)
             продукт: CMU64GX4M4C3000C15
             производитель: AMI
             физический ID: 1
             серийный №: 00000000
             слот: ChannelA-DIMM1
             размер: 16GiB
             разрядность: 64 bits
             частота: 2133MHz (0.5ns)
        *-bank:2
             описание: DIMM DDR4 Синхронная 2133 MHz (0,5 ns)
             продукт: CMU64GX4M4C3000C15
             производитель: AMI
             физический ID: 2
             серийный №: 00000000
             слот: ChannelB-DIMM0
             размер: 16GiB
             разрядность: 64 bits
             частота: 2133MHz (0.5ns)
        *-bank:3
             описание: DIMM DDR4 Синхронная 2133 MHz (0,5 ns)
             продукт: CMU64GX4M4C3000C15
             производитель: AMI
             физический ID: 3
             серийный №: 00000000
             слот: ChannelB-DIMM1
             размер: 16GiB
             разрядность: 64 bits
             частота: 2133MHz (0.5ns)
     *-cache:0
          описание: L1 кэш
          физический ID: 43
          слот: L1 Cache
          размер: 512KiB
          capacity: 512KiB
          возможности: synchronous internal write-back unified
          конфигурация: level=1
     *-cache:1
          описание: L2 кэш
          физический ID: 44
          слот: L2 Cache
          размер: 2MiB
          capacity: 2MiB
          возможности: synchronous internal write-back unified
          конфигурация: level=2
     *-cache:2
          описание: L3 кэш
          физический ID: 45
          слот: L3 Cache
          размер: 12MiB
          capacity: 12MiB
          возможности: synchronous internal write-back unified
          конфигурация: level=3
     *-cpu
          описание: ЦПУ
          продукт: Intel(R) Core(TM) i7-9700K CPU @ 3.60GHz
          производитель: Intel Corp.
          физический ID: 46
          сведения о шине: cpu@0
          версия: Intel(R) Core(TM) i7-9700K CPU @ 3.60GHz
          серийный №: To Be Filled By O.E.M.
          слот: U3E1
          размер: 4600MHz
          capacity: 4900MHz
          разрядность: 64 bits
          частота: 100MHz
          возможности: x86-64 fpu fpu_exception wp vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp constant_tsc art arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf tsc_known_freq pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 sdbg fma cx16 xtpr pdcm pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm 3dnowprefetch cpuid_fault invpcid_single ssbd ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid fsgsbase tsc_adjust bmi1 hle avx2 smep bmi2 erms invpcid rtm mpx rdseed adx smap clflushopt intel_pt xsaveopt xsavec xgetbv1 xsaves dtherm ida arat pln pts hwp hwp_notify hwp_act_window hwp_epp flush_l1d arch_capabilities cpufreq
          конфигурация: cores=8 enabledcores=8 threads=8


GPU:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 390.87                 Driver Version: 390.87                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 108...  Off  | 00000000:01:00.0 Off |                  N/A |
| 34%   63C    P2   128W / 280W |  10806MiB / 11178MiB |     79%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1865      G   /usr/lib/xorg/Xorg                           226MiB |
|    0      2078      G   /usr/bin/gnome-shell                         196MiB |
|    0      2435      G   /proc/self/exe                                70MiB |
|    0      3013      G   /opt/teamviewer/tv_bin/TeamViewer             24MiB |
|    0      3641      G   /usr/lib/firefox/firefox                       2MiB |
|    0      8516      C   python                                     10281MiB |
+-----------------------------------------------------------------------------+








В итоге, на первой машине одна эпоха обучения занимает ~27 секунд. На второй машине ~7 секунд. То есть вторая машина почти в 4 раза быстрее.