Проблема с установкой пакетов

bor_and

New member
Сообщения
5
#1
Коллеги, добрый день.
Проблема следующего рода, может кто сталкивался с похожим поведением..
Есть АРМ в составе домена ALD. При попытке установить пакеты с зависимостями, процесс установки убивается (снимок экрана прилагаю).
При этом в лог попадает следующее..
Feb 1 13:38:40 n2 kernel: [3594058.038313] BUG: unable to handle kernel paging request at 000064b5efe070c0
Feb 1 13:38:40 n2 kernel: [3594058.038326] IP: dfd2core+0x2e/0x200 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038327] PGD 800000fe6f211067 P4D 800000fe6f211067 PUD fe6934e067 PMD fe6f0dd067 PTE 800000fdf588d865
Feb 1 13:38:40 n2 kernel: [3594058.038331] Oops: 0001 [#23] SMP PTI
Feb 1 13:38:40 n2 kernel: [3594058.038334] Modules linked in: bluetooth(E) ecdh_generic(E) dm_round_robin(E) intel_rapl(E) skx_edac(E) x86_pkg_temp_thermal(E) intel_powerclamp(E) coretemp(
E) kvm_intel(E) kvm(E) irqbypass(E) crct10dif_pclmul(E) crc32_pclmul(E) ghash_clmulni_intel(E) pcbc(E) ipmi_ssif(E) aesni_intel(E) aes_x86_64(E) crypto_simd(E) glue_helper(E) cryptd(E) nls_
cp1251(E) nls_cp866(E) intel_cstate(E) input_leds(E) mei_me(E) intel_rapl_perf(E) sobol(OE) ioatdma(E) mei(E) lpc_ich(E) shpchp(E) ipmi_si(E) ipmi_devintf(E) ipmi_msghandler(E) acpi_pad(E)
acpi_power_meter(E) mac_hid(E) dm_multipath(E) scsi_dh_rdac(E) scsi_dh_emc(E) scsi_dh_alua(E) parport_pc(E) ppdev(E) lp(E) parport(E) auth_rpcgss(E) sunrpc(E) ip_tables(E) x_tables(E) autof
s4(E) hid_generic(E) ast(E) ttm(E) qla2xxx(E) drm_kms_helper(E) syscopyarea(E) nvme_fc(E)
Feb 1 13:38:40 n2 kernel: [3594058.038371] sysfillrect(E) igb(E) nvme_fabrics(E) sysimgblt(E) dca(E) fb_sys_fops(E) i2c_algo_bit(E) nvme_core(E) ptp(E) bnxt_en(E) devlink(E) megaraid_sas(
E) scsi_transport_fc(E) pps_core(E) drm(E) usbhid(E) hid(E) wmi(E) parsec(OE) digsig_verif(OE)
Feb 1 13:38:40 n2 kernel: [3594058.038384] CPU: 13 PID: 19925 Comm: apt Tainted: G D OE 4.15.3-1-generic #astra21
Feb 1 13:38:40 n2 kernel: [3594058.038386] Hardware name: Kraftway Corporation PLC RS720-E9-RS8/Z11PP-D24 Series, BIOS 6102 12/05/2019
Feb 1 13:38:40 n2 kernel: [3594058.038389] RIP: 0010:dfd2core+0x2e/0x200 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038390] RSP: 0018:ffffb674302af908 EFLAGS: 00010246
Feb 1 13:38:40 n2 kernel: [3594058.038391] RAX: 0000000000000000 RBX: 00000000c0000007 RCX: ffffb674302afc00
Feb 1 13:38:40 n2 kernel: [3594058.038392] RDX: 0000000000000001 RSI: ffffb674302afa58 RDI: 000064b5efe070c0
Feb 1 13:38:40 n2 kernel: [3594058.038394] RBP: ffffb674302af950 R08: ffffffffc03882f0 R09: 000064b5efe336f0
Feb 1 13:38:40 n2 kernel: [3594058.038395] R10: ffffb674302afbc0 R11: ffff9737948b8ff0 R12: ffffb674302afa58
Feb 1 13:38:40 n2 kernel: [3594058.038396] R13: ffffb674302afa58 R14: 0000000000000001 R15: 000064b5efe070c0
Feb 1 13:38:40 n2 kernel: [3594058.038397] FS: 0000766a7fdad100(0000) GS:ffff9737ff040000(0000) knlGS:0000000000000000
Feb 1 13:38:40 n2 kernel: [3594058.038398] CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Feb 1 13:38:40 n2 kernel: [3594058.038399] CR2: 000064b5efe070c0 CR3: 000000fe6f17c004 CR4: 00000000007606e0
Feb 1 13:38:40 n2 kernel: [3594058.038401] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
Feb 1 13:38:40 n2 kernel: [3594058.038402] DR3: 0000000000000000 DR6: 00000000fffe0ff0 DR7: 0000000000000400
Feb 1 13:38:40 n2 kernel: [3594058.038403] PKRU: 55555554
Feb 1 13:38:40 n2 kernel: [3594058.038403] Call Trace:
Feb 1 13:38:40 n2 kernel: [3594058.038409] kernel2core+0x159/0x7a0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038411] ? parsec_log_write+0x299/0x3e0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038418] ? __ext4_ext_dirty+0x6c/0x80
Feb 1 13:38:40 n2 kernel: [3594058.038420] ? crypto_shash_update+0x47/0x130
Feb 1 13:38:40 n2 kernel: [3594058.038423] handler_fn+0xf6/0x3d0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038426] ? i_audit_get+0x76/0xc0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038429] ? file_audit_check+0x34/0x1b0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038431] ? do_file_audit+0x51/0xa0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038434] do_audit+0x5f/0xc0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038436] ? kernel2core+0x7a0/0x7a0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038438] ? do_audit+0x5f/0xc0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038441] do_kernel_audit+0x7c/0xa0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038444] parsec_fn_post+0x13a8/0x2c90 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038449] ? kzfree+0x2d/0x40
Feb 1 13:38:40 n2 kernel: [3594058.038451] ? kzfree+0x2d/0x40
Feb 1 13:38:40 n2 kernel: [3594058.038453] ? file_audit_inherit_default_audit+0x25/0xf0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038458] ? vfs_symlink+0xb9/0x120
Feb 1 13:38:40 n2 kernel: [3594058.038461] ? modname+0x1e0/0x1e0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038462] ? vfs_symlink+0xb9/0x120
Feb 1 13:38:40 n2 kernel: [3594058.038464] ? list_lru_add+0x5a/0x130
Feb 1 13:38:40 n2 kernel: [3594058.038468] ? _cond_resched+0x1a/0x50
Feb 1 13:38:40 n2 kernel: [3594058.038472] ? dput+0x34/0x1f0
Feb 1 13:38:40 n2 kernel: [3594058.038474] ? putname+0x54/0x60
Feb 1 13:38:40 n2 kernel: [3594058.038476] sys_symlinkat+0xba/0x120
Feb 1 13:38:40 n2 kernel: [3594058.038478] ? modname+0x1e0/0x1e0 [parsec]
Feb 1 13:38:40 n2 kernel: [3594058.038480] ? sys_symlinkat+0xba/0x120
Feb 1 13:38:40 n2 kernel: [3594058.038482] SyS_symlink+0x16/0x20
Feb 1 13:38:40 n2 kernel: [3594058.038486] do_syscall_64+0x73/0x130
Feb 1 13:38:40 n2 kernel: [3594058.038490] entry_SYSCALL_64_after_hwframe+0x3d/0xa2
Feb 1 13:38:40 n2 kernel: [3594058.038491] RIP: 0033:0x766a7ed42de7
Feb 1 13:38:40 n2 kernel: [3594058.038492] RSP: 002b:00007ffdc6b08ed8 EFLAGS: 00000202 ORIG_RAX: 0000000000000058
Feb 1 13:38:40 n2 kernel: [3594058.038494] RAX: ffffffffffffffda RBX: 000064b5efe7e100 RCX: 0000766a7ed42de7
Feb 1 13:38:40 n2 kernel: [3594058.038495] RDX: 0000766a7f595c58 RSI: 000064b5efe336f0 RDI: 000064b5efe070c0
Feb 1 13:38:40 n2 kernel: [3594058.038496] RBP: 00007ffdc6b09450 R08: 000064b5efe7dee0 R09: 0000000000000050
Feb 1 13:38:40 n2 kernel: [3594058.038497] R10: 0000000000000000 R11: 0000000000000202 R12: 00007ffdc6b09250
Feb 1 13:38:40 n2 kernel: [3594058.038498] R13: 0000000000000000 R14: 0000000000000000 R15: 000064b5efdbb8d0
Feb 1 13:38:40 n2 kernel: [3594058.038499] Code: 00 00 55 48 89 e5 41 57 41 56 41 55 41 54 49 89 ff 53 49 89 f5 41 89 d6 48 83 ec 20 65 48 8b 04 25 28 00 00 00 48 89 45 d0 31 c0 <83> 3f 9c
0f 84 1f 01 00 00 85 d2 48 c7 06 00 00 00 00 0f 85 3b
Feb 1 13:38:40 n2 kernel: [3594058.038519] RIP: dfd2core+0x2e/0x200 [parsec] RSP: ffffb674302af908
Feb 1 13:38:40 n2 kernel: [3594058.038520] CR2: 000064b5efe070c0
Feb 1 13:38:40 n2 kernel: [3594058.038522] ---[ end trace ff48d288aa101e41 ]---
В какую сторону копать? Может есть у кого идеи?
apt install pacemaker.JPG
 

djastroid

New member
Сообщения
17
#2
А какие репозитории подключены? Какое обновление? С установкой любых пакетов такое вываливается?
 

bor_and

New member
Сообщения
5
#3
Машина обновлена до update 4 (в сети есть еще машины c update4, на которых таких проблем не наблюдается), собственно репозитории подключены астровские SE (репозиторий установочного диска, средств разработки, update4 и update4-dev). Ради эксперимента попробовал поставить пакеты htop и iotop, пакеты установились без проблем. Еще интересный момент.. если машину вывести из состава домена ALD, перегрузить, то эта проблема исчезает, пакеты без проблем ставятся. Как только заново ввожу машину в домен, то проблема опять вылезает.
 

PashaGold

New member
Сообщения
36
#4
Машина обновлена до update 4 (в сети есть еще машины c update4, на которых таких проблем не наблюдается), собственно репозитории подключены астровские SE (репозиторий установочного диска, средств разработки, update4 и update4-dev). Ради эксперимента попробовал поставить пакеты htop и iotop, пакеты установились без проблем. Еще интересный момент.. если машину вывести из состава домена ALD, перегрузить, то эта проблема исчезает, пакеты без проблем ставятся. Как только заново ввожу машину в домен, то проблема опять вылезает.
как вариант можно попробовать с параметром -f
или еще попробовать подняться в рут
 

oko

New member
Сообщения
1 257
#5
to bor_and
А если вывести из ALD, инсталлировать указанное, а затем ввести обратно - машина в составе ALD будет корректно функционировать? Так-то есть вероятность конфликта приведенных средств кластеризации с заложенным функционалом ALD. Корректнее было бы предварительно узнать в техподдержке РусБИТеха принципиальную возможность интеграции pacemaker'а в конфигурацию ALSE в составе ALD...
 

bor_and

New member
Сообщения
5
#6
Была такая проблема. По моему тоже на Update 4.. Такое поведение отмечалось только на доменных машинах в составе ALD и подключенных к сети.
Вывести из домена и поставить пакеты - помогает. Отключить от сети, ребутнуться, поставить пакеты (главное чтобы машина не достучалась до контроллера) - тоже помогает. Причем из всего набора машин и серверов не все так себя вели. Техподдержка явной причины найти не смогла. В итоге помогло обновление систем до актуального на тот момент апдейта (Update 9). Выводить из домена проблемные машины и обновлять по сети, либо отключать от сети, ребутить и обновлять локально.