Не бойтесь ошибаться

Как вы относитесь к тому, что ошибаетесь? Это основной вопрос о довольно простой эмоции, и есть особый вид сетевой неправильности, который, я думаю, заслуживает дальнейшего изучения. Поразительная часть писем, которые я получаю каждый месяц от читателей этой колонки, в целом посвящена теме ошибок и тому, как это влияет на способность корреспондента сделать что-нибудь полезное для решения своей проблемы. Лично я очень мало боюсь ошибиться, потому что провожу очень много времени в слишком сложном мире сетей, где вечная правота — несбыточная мечта.

Сегодня вы можете столкнуться с полдюжиной различных сетевых структур, каждая из которых обладает набором атрибутов, которые можно пересчитать только на пальцах одной руки. Это делает число перестановок настолько огромным, что вечная правильность недостижима. Подумайте об этом немного. Для кабелей существует как минимум семь атрибутов (скорость, дуплекс, топология, оптоволокно/медь, внутренний/внешний, экранированный/неэкранированный, купленный/самодельный), и протоколы TCP/IP добавляют примерно то же самое (адрес, маска сети, CIDR да/нет, IPV6 да/нет, количество переходов, MAC, ARP). И достаточно легко составить список аналогичного размера для большинства других структур, необходимых для хорошей работы вашей локальной сети: разрешение имен, управление трафиком, стандарты, требования к платформе. Все они имеют более двух, но менее десяти фундаментальных параметров, которые вы можете установить.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Я считаю, что при решении проблем такого масштаба сложности люди лучше всего справляются, когда сначала думают о них как о команде, а затем проводят групповое обсуждение. Сети в целом могут выиграть от «отладки посредством диалога» — почти в тот момент, когда вы открываете рот, чтобы описать какую-то проблему, которую не можете решить, вам приходит в голову нужное решение, но если бы вы молчали, это решение, вероятно, никогда бы не появилось. пришли на ум. Судя по всему, этот эффект хорошо понимают ученые-когнитивисты, и различные академические и технические организации (одна из которых, как я слышал, конкретно — BBC) сегодня инструктируют свои технические команды, что принятие такой техники является официально санкционированным подходом к решению проблем.

Сейчас во многих компаниях лицом, ответственным за ИТ, является финансовый директор, и чаще всего ему подчиняется какой-нибудь ботаник (будь то штатный сотрудник или «аутсорсинг»). Финансы — это совсем другой вид дисциплины, чем ИТ, поскольку в количественных показателях не так уж много неопределенности, а диагностические процессы не часто требуются, когда вы балансируете счета или устанавливаете бюджет — цифры остаются цифрами. . Очень часто я наблюдаю, как забитые технари отчаянно пытаются включиться в процесс диагностики путем обсуждения со своим финансовым директором, чей подход ко всему этому делу будет, мягко говоря, несколько антагонистическим. «Я думал, ты должен был знать все эти вещи…», — рявкнет он или она, — «…нет, тебе больше не помогут – это то, за что мы тебе платим». Неудивительно, что в такой среде у людей развивается массовое нежелание, чтобы их считали неправыми (или даже считали, что они просят о помощи).

Я уже намекал на эту проблему несколько статей назад, когда описывал свои приключения с интеллектуальным стековым коммутатором Netgear FS728TS Netgear и бойко упоминал несколько систем, которые я видел, администраторы которых были весьма обеспокоены перспективой расширения их сети за пределы одной 24-точечной сети. -портовый переключатель, потому что они не знали, как соединить коммутаторы последовательно. Как всегда, мой почтовый ящик раздувался из-за самых, казалось бы, незначительных мелочей, и этот сработал отлично.
Некоторые из вас написали, чтобы описать некоторые варианты такой сетевой топологии, наиболее распространенным решением, по-видимому, является установка в сервер нескольких сетевых карт, при этом каждая карта обслуживает отдельный физический коммутатор, а сервер является единственным соединением между различными коммутаторами. и сегменты. Теперь такая схема будет работать, и в сети с одним сервером, где пользователи никогда не перемещаются и не печатают на принтерах друг друга, она, вероятно, никогда не привлечет особого внимания, потому что файлы могут быть общими, и работа может быть выполнена. без особых препятствий. Однако как только вы попробуете что-нибудь хоть немного умное, например, балансировку нагрузки, группирование, маршрутизацию трафика на другой сервер или с него, удаленный доступ или даже прохождение через КПК для синхронизации с Интернетом, все это свалится в кучу. В качестве долгосрочного решения использование одной серверной сетевой карты на коммутатор является зоной катастрофы.

Один парень оказался в еще более тяжелом положении, чем можно было бы предположить. Он очень хорошо справлялся со своим единственным сервером, главным образом потому, что поддерживал пакет, соответствующий отраслевым стандартам, который значительно повышает ценность его бизнеса – тот, который каждый сотрудник использует с той минуты, как садится за столик утром, и до финальный свисток – и потому, что его финансовый директор, хотя и обладает явно вспыльчивым и обвинительным темпераментом, который я только что описал, также совершенно ясно понимает, насколько важна сеть для бизнеса. Эта четкая связь между прибылью компании и ее инвестициями в ИТ в сочетании с топологией «без коммутации» и конфигурацией «только один сервер» означала, что для этого парня возникла довольно болезненная и уникальная критическая точка.

Его сервер, теперь набитый дисками емкостью 144 ГБ, заполнил свой единственный ленточный накопитель, и он хотел добавить второй накопитель. Единственная проблема заключалась в том, что если бы он подключил его к той же карте SCSI, что и существующее устройство, ночное резервное копирование не завершилось бы вовремя, чтобы позволить его людям вернуться в эту чрезвычайно важную базу данных в начале игры на следующее утро. Что еще хуже, эта маленькая, но дорогостоящая компания была особенно уязвима перед одним из самых ужасных последствий Второго закона термодинамики, малозаметного следствия из закона Подлости, который утверждает, что чем полезнее продукт, тем менее оно должно быть гибким, терпимым или надежным.

В случае с моим человеком ему пришлось выполнить четыре полных восстановления базы данных в течение предыдущего года из-за сбоев клиентского ПК, унесших часть структуры центральной базы данных. С одной стороны, это была хорошая новость, потому что, по крайней мере, он знал, что выбранное им сочетание программного обеспечения и оборудования для резервного копирования выполняет свою работу. С другой стороны, это были плохие новости, потому что причина, по которой ему пришлось делать это восстановление, в первую очередь не поддавалась «отключению» с помощью системных улучшений – разработчик пакета базы данных просто не собирался исправлять ошибку. поскольку у него были другие приоритеты. Поэтому я пошел посмотреть на его ситуацию лично.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Его сервер действительно был переполнен, и в каждом доступном слоте PCI была установлена ​​карта SCSI, RAID или Ethernet. Он использовал частную подсеть 10.xxx, где каждая отдельная карта Ethernet имела свой основной сетевой номер: первая карта — 10.0.1.x, вторая — 10.0.2.x и так далее. Набор концентраторов и коммутаторов, подключенных к этим картам, как и сами карты, был весьма разным. Один представлял собой оптоволоконный канал с удаленным зданием, два — крупные 24-портовые коммутаторы на разных этажах, а третий — небольшой восьмипортовый концентратор на этаже «режиссерской комнаты» (который он хотел бы обновить, но секретарь председателя буквально имел ключ от этого помещения и очень редко впускал его…)
О быстрых исправлениях, таких как добавление многопортовой карты Ethernet, такой как Intel PRO/1000 GT (см. www.pcpro.co.uk/links/networks145a), не могло быть и речи, как и об установке центрального коммутатора. Устройства, которые могли бы обрабатывать широкий спектр типов подключений, которые он использовал, можно купить сравнительно легко, но процесс преобразования каждого соединения в пуловую настройку, а затем запуск одного интерфейса Ethernet либо для многодомной каждой из подсетей, либо для маршрутизации трафика в способ имитации макета с несколькими картами был долгосрочным проектом, который лучше всего подходил для выходных в праздничные дни – и это было слишком долго, чтобы ждать, чтобы сделать резервную копию. Я знаю, что переназначить IP-адреса рабочих станций, чтобы выйти из этой конфигурации с несколькими подсетями, должно было быть несложно, но он не использовал DHCP, и обход всего объекта (включая заблокированный этаж руководителя) занял более одного часа. полный рабочий день.

Это оставило нам два краткосрочных решения: запустить резервное копирование D2D2T (с диска на диск на ленту), усилив одну рабочую станцию ​​и переместив на нее ленточные накопители, или попытаться выжать больше возможностей SCSI из резервной копии. заполненный сервер. Беглый осмотр всех рабочих станций-кандидатов исключил вариант D2D2T: хотя на сервер были потрачены деньги, рабочие станции представляли собой дешевые машины, их дешевые жестяные корпуса в основном были заполнены горячими, липкими комочками пыли, а слоты PCI на шатких райзер-картах . Их встроенные Ethernet-интерфейсы были странными, медленными и плохо согласовывались с коммутаторами – уж точно не подходили для непрерывного принудительного питания дорогостоящего стримера всю ночь. Обновление коммутаторов было бы таким же болезненным занятием, как и перенастройка сервера, поэтому мы вернулись назад, и именно тогда удача наконец оказалась на нашей стороне.

Сервер представлял собой сарай Compaq, двустороннюю башню на толстых колесиках с достаточной мощностью и несколькими отсеками для дисков. Эти рабочие лошадки являются основой сетевого бизнеса, и, несмотря на то, что сейчас они продаются на Ebay по цене 200 фунтов стерлингов за штуку при загрузке 12 поддонов, я все еще думаю, что у них есть разумные приложения, если вы игнорируете их рейтинг процессора и сосредоточенность. вместо этого от количества дисков, в которые они могут поместиться, и от того, насколько хорошо они питают, охлаждают и получают доступ к этим дискам. Самая большая проблема всей линейки ProLiant заключалась в том, что, казалось бы, тривиальные опции могли существенно повлиять на работу всего сервера. Я уже упоминал здесь, как часто я обнаруживаю, что ProLiants с двумя или четырьмя возможностями работают только с одним процессором, недостаточным объемом памяти или с ничтожной парой SCSI-дисков емкостью 9,1 ГБ только потому, что первоначальный покупатель понятия не имел, какие прелести ждут его. в разделе опций каталога.

Мой человек проделал некоторый путь к сбору нужных битов для обслуживания своего ненасытного приложения базы данных: на сервере были отдельные карты SCSI RAID для обслуживания каждого отсека для дисков, и все три слота, доступные для дисков, были заполнены. Он рационально использовал количество устройств хранения данных, доступных в этой конфигурации, и разумно распределил свои тома между устройствами. Однако, когда дело дошло до эксплуатации ленточных накопителей, он стал жертвой близорукости каталога опций, усугубляемой изворотливой отраслевой мудростью относительно неправильного поведения ленточных накопителей. Как и все осторожные администраторы локальных сетей, он устанавливал свои ленточные накопители на отдельные карты SCSI от RAID-массивов, несмотря на то, что каждая RAID-карта имела внешний разъем сзади. Он устоял перед искушением использовать их и вместо этого подключил ленточное устройство через Adaptec 29160, оставив два встроенных чипсета Symbios Logic со встроенным SCSI и не-RAID совершенно неработающими.
Эти микросхемы включены в материнскую плату ProLiant и выглядят как простые 68-контактные разъемы, спрятанные близко к краям платы рядом с отсеками для дисков. Почти все их игнорируют, потому что «правильное» решение с этими отсеками для накопителей — подключить их к кэширующему RAID-контроллеру и игнорировать простой встроенный набор микросхем: однако они почти всегда остаются работоспособными. Стандартная задняя панель ProLiant включает небольшие перфорированные слоты, расположенные в стороне от отсека для карт расширения, которые можно открыть, а затем использовать с правильным ленточным кабелем и монтажной пластиной для размещения разъема SCSI на задней панели машины – в данном случае ленточный разъем даже присутствовал, но не был подключен. Мы подключили его, когда сервер все еще работал – несмотря на его нервы – и даже сумели заставить Backup Exec увидеть второй стример после разумной остановки и запуска соответствующих служб, без даже перезагрузка сервера.

Теперь он заказал еще один из этих маленьких ленточных адаптеров для внешнего представления (примерно за 30 долларов США у компании по продаже запасных частей в США), который освободит еще один слот PCI и, хотя это может не привести его сеть в оптимальное состояние, которого она могла бы достичь с помощью еще немного реинжиниринга, по крайней мере, на данный момент давление спало.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *