Собственно, ситуация: имеется выделенный сервер под управлением ubuntu 12.04 64-bit, там стоит сервер 1С. Начинали, кажется, с 8.3.7, потом 8.3.8, сейчас 8.3.9-2033 и postgresql 9.4.2, всё по инструкции, без самодеятельности. Железо работает нормально, а вот процессы rphost (и иногда rmngr) регулярно падают, выкидывая из системы пользователей и извлекая из начальства громы и молнии. Параметры настроек кластера и сервера крутили - не помогает, периодичность падений как-то изменяется, но непонятно как именно. К регламентным заданиям привязаться вроде тоже не выходит, как мне сообщили наши 1С-ники.
Железо - Supermicro, память 64G с ECC, с температурой порядок, пользователей пока в пределах 30 чел, баз много разных - зуп, ка, еще что-то. Но падает иногда даже когда ни одного активного человека нету. В логе postgresql сыпались по некоторым базам ошибки типа "autovacuum: found orphan temp table" - выгрузили подозрительные базы конфигуратором, перезалили - ошибки ушли, падения - нет.
Анализ корок, которые кидает rphost, говорит, что в большинстве случаев происходит падение в sem_wait, вроде бы после выхода из syscall:
Program terminated with signal 11, Segmentation fault.
#0 0x00007f0303b40fd0 in sem_wait ()
0x00007f0303b40fce <+46>: syscall
=> 0x00007f0303b40fd0 <+48>: mov %rax,%rcx
Написал в техподдержку, отправил туда около гига корок - молчат.
Может, присоветует кто, в каком направлении рыть?