Восстановление работоспособности logical drive Raid5 после замены дисков.

Дата: Март 4, 2016 - 5:57 дп Нет комментариев

На одном сервере был собран рейд из 16 дисков (один из них Spare)
Было создано 3 логических диска – два уровня 50 под данные и один уровня 5 для бэкапов.

Случилось так, что получается что одновременно вылетело 2 диска, в результате чего ld 3 (бэкап) естественно перешел в Fail. 
После того как два вылетевших диска заменили, естественно, ld3 был потерян,но он нужен нам, для того чтобы размещать на нем файлы. Как вернуть его к жизни?

Читать далее »

VirtualHost: main] (28)No space left on device: mod_python: Failed to create global mutex

Дата: Октябрь 4, 2015 - 11:42 пп Нет комментариев

Однажды у нас упал вебсервер ohs12 и при запуске в логах выдавал ошибку:

user: oracle] [VirtualHost: main] (28)No space left on device: mod_python: Failed to create global mutex 1 of 8 (/tmp/mpmtx148631).

Читать далее »

Ошибка Cannot open exchanger control device

Дата: Сентябрь 24, 2015 - 1:15 дп Нет комментариев

По работе имею дело с следующей связкой HP DL сервера в кластере + ленточка подклченная по SAS к однмоу из серверов. На сервере с подключенной библиотекой стоит HP Data Protector, на котором настроены политики бэкапа файловых систем и СУБД Oracle. В один прекрасный момент бэкапы перестали работать.

По работе встретил такую ошибку при бэкапе:

 bash |  copy code |? 
01
Normal] From: BSM@khbr.ctn "oracle_archivelog"  Time: 23.09.15 16:39:24
02
      Backup session 2015/09/23-16 started.
03
 
04
[Normal] From: BMA@khbr.ctn "HP:Ultrium 5-SCSI_1_khbr"  Time: 23.09.15 16:39:25
05
      STARTING Media Agent "HP:Ultrium 5-SCSI_1_khbr" 
06
 
07
[Critical] From: UMA@khbr.ctn "HP:MSL G3 Series_khbr"  Time: 23.09.15 16:49:15
08
[90:59]     khbr.ctn : /dev/sg9
09
      Cannot open exchanger control device ([2] No such file or directory)
10
 
11
[Normal] From: BMA@khbr.ctn "HP:Ultrium 5-SCSI_1_khbr"  Time: 23.09.15 16:49:15
12
      ABORTED Media Agent "HP:Ultrium 5-SCSI_1_khbr" 
13
 
14
[Critical] From: BSM@khbr.ctn "oracle_archivelog"  Time: 23.09.15 16:49:15
15
      None of the Disk Agents completed successfully.
16
      Session has failed.
17
 
18
[Normal] From: BSM@khbr.ctn ""  Time: 23.09.15 16:49:15

Все бэкапы на ленточку перестали отрабатывать!!! Ахтунг.

Читать далее »

Новый сайт поиска по содержанию книжек www.tlibrary.ru

Дата: Июнь 1, 2015 - 1:17 дп Нет комментариев

Доброе, сетевые жители

Предлагаю посмотреть на новый сайт, который сейчас разрабатывается – www.tlibrary.ru

Главная суть сайта – сделать возможность поиска по содержанию книжек. Да, вы скажете таких сайтов полно, но изюминка этого в том что на сайте постепенно появляется информация о книжках, в которых картинки автоматически распознаются.  То есть те книги, которых находятся в сканах проганяются через программы распознания (пока только часть книги) и полученое распознанное содержимое может быть использовано для поиска.

Пока конечно все сыро, и в распознанном контенте много ошибок, но такова цена бюджетности. Если сайт будет пользоваться популярностью, то многое можно исправить.

Умер системный диск в одном из серверов PROXMOX-кластера.

Дата: Май 15, 2015 - 2:51 дп Нет комментариев

Умер системный диск в одном из серверов PROXMOX-кластера.

Беда… потому что на этом узле у меня был MFSMASTER и MFSCHUNK и куча виртуальных машин. Да здравствует БЭКАП. Слава Богу, что у меня были бэкапы всех важных машин (одну машину я все же потерял, т.к. она была большая и у меня небыло места для ее бэкапа. Читать далее »

Как посмотреть потерянные файлы в MFS

Дата: Май 8, 2015 - 8:41 дп Нет комментариев

К сожалению в следствии каких либо ошибок в MFS могут быть потеряны файлы, даже с дублированием хранения.

Чтобы посмотреть какие файлы потерялись  нужно выполнить такую команду:

 

mfscli -H 192.168.0.7 -SIN -p |grep tbc |egrep -e tbc.* -o

DBMS_REDEFINISHEN

Дата: Март 26, 2015 - 4:38 дп Нет комментариев

Доброе оракловоды.

По службе мне нужно было переопределить вживую несколько столбцов таблицы и, конечно же, для этого я воспользовался фичей оралка dbms_redifinition, но случилось то, что начало редифинишена после недолгого задумывания вываливалось с ошибокй ORA-600 с оргументами 17182  и 17183.

Как удалось это победить обходным путем – далее под катом.

Читать далее »

Использование moosefs. обновление 1

Дата: Март 26, 2015 - 4:27 дп Нет комментариев

Доброе.

За время использования вот еще что “нарисовалось”.

С большой долей вероятности при подходу заполннености кластера к 100% – возможно падение демонов moosefs. У меня было так несколько раз, пока не добавил еще дисковых ресурсов в кластер.

Однако это надо еще проверять, но нет желания.

Кстати, чанксервера разных версий вродедаже не плоху живут вместе .

 bash |  copy code |? 
1
192.168.0.7:9421   23T   23T  165G 100% /mnt/mfs

вот страница дисков:

moosedisksОбновление 1:

Встерился с такой ситуацией, что 2 из 3х сереверов заполнились на 100%, а на третем сервере осталось еще 500ГБ, однако кластер не перераспределяет с 2х заполненных сервов данные на 3ий и поэтому записывая в кластер данные с goal=2 кластер не может обеспечить необходимое дублирование чанков. :(