یادداشت ویراستار: این مطلب در مهر ۹۹ توسط کارشناسان سرور و شبکه فالنیک، بررسی و تایید شده است.
فروش سرور معمولا با خدماتی مانند پشتیبانی نیز همراه است اما بهتر است سرویس های دوره ای و چک لیست نگهداری سرور را انجام دهید. نگهداری و مانیتورینگ ساده میتواند از خرابی سرور و منتهی شدن به فاجعه جلوگیری کند. مثلا اگر RAID سرور خراب شده باشد و یا مدتی است که گرفتن بکاپ متوقف شده و یا ظرفیت هاردها کاملا پر شده منتظر خرابی و Fail شدن سرورتان باشید.
اگر از سرویس های مدیریتی استفاده میکنید نگران این چیزها نباشید اما اگر به صورت شخصی سرورتان را مدیریت میکنید باید به چک لیست نگهداری سرور کاملا پایبند باشید.
چک لیست نگهداری سرور
در چک لیست نگهداری سرور که در ادامه میخوانید ۱۴ نکته بیان شده که باعث میشود درک بهتری از آنچه برای نگهداری روتین سرور لازم است پیدا کنید. نگهداری مداوم باعث به حداقل رسیدن مشکلات سروری میشود. بسیاری از این مشکلات قابل پیش بینی و پیشگیری است.
پادکست با موضوع چک لیست نگهداری سرور
۱- اخبار تکنولوژی
انتشار IOS 13.7 برای دستگاههای اپل، دادن فرصت دوباره به توسعه دهندگانی که زمانی قوانین مربوط به اپل و پلتفرم اپ استور را زیرپا گذاشته بودن، تبدیل کاغذ به تبلت و راه اندازی خطوط تولیدی سامسونگ در پاکستان، تنها بخشی از خبرهای تکنولوژی این پادکست است.
۲- پرونده ویژه:
- داشتن استراتژی بکاپگیری
- بررسی مصرف هارد و منابع سرور و شبکه
- آپدیت برنامه ها و نرم افزارها و سیستم عامل
- جنرال سرویس سخت افزارهای سرور
۳- مناسبتهای ماه:
در این شماره از پادکست، به سراغ یکی دیگر از مناسبت های شهریور ماه، روز جهانی برنامهنویسان رفتیم و درباره تاریخچه برنامه نویسی و حوزه های مختلف آن صحبت کردیم. در ادامه بشنوید.
در این پادکست به همراه بخش تخصصی، اخبار تکنولوژی و مناسبتهای ماه را هم میتوانید پیگیری کنید؛ این نسخه پادکست ۳۱ مگابایت حجم و ۳۴ دقیقه زمان دارد. زمانبندی این پادکست در جدول زیر آمده است:
محدوده زمانی | موضوع بحث پادکست |
---|---|
دقیقه ۰۲:۱۶ تا ۰۷:۳۰ | خبرهای ۳۰ روز گذشته دنیای تکنولوژی |
دقیقه ۰۸:۵۳ تا ۲۳:۵۴ | چک لیست نگهداری سرور |
دقیقه ۲۴:۵۰ تا ۳۰:۵۷ | تقویم روز: روز جهانی برنامهنویسان |
دانلود
بخش پرونده ویژه ۲۵ مگابایت حجم و ۱۸ دقیقه زمان دارد.
دانلود
۱. داشتن استراتژی بکاپگیری
داشتن استراتژی خوب در بکاپگیری نکته مهمی است که باید به آن توجه کرد. بهتر است بکاپ داشته باشید و به آنها احتیاج نداشته باشید نه اینکه به بکاپ نیاز داشته باشید اما بکاپی نداشته باشید. هر روز یا هر هفته زمانی را برای بکاپگیری اختصاص دهید.
بررسی کنید آیا بکاپگیری به درستی کار میکند یا نه. قبل از اعمال هر تغییری در سیستم مطمئن شوید که بکاپ هایتان به درستی کار میکند حتی چند تست ریکاوری هم انجام دهید. از بکاپگیری مهمتر محل نگهداری بکاپ هاست که باید استانداردهای مربوط به آن را رعایت کنید.
خواندن مطلب “بهترین روش های بک آپ گیری از سرور و شبکه” را توصیه میکنیم.
اصولا Raid در سرورها پیاده سازی و اجرا میشود که طی آن چندین هارد به صورت یک هارد دیده میشوند. برخی انواع RAID ها برای افزایش کارایی و برخی برای افزونگی هستند. اگر از ابزار مدیریتی Raid استفاده کنید میتوانید به سادگی از احتمال خرابی هارد درایو مطلع شوید در نتیجه فرصت کافی برای جایگزینی و ریبیلد کردن رید را دارید و در نهایت زمان Downtime کم میشود.
ممکن است سالانه تنها یک درصد خرابی رید رخ دهد. اگرچه که به ظاهر عدد کوچکی است اما خرابی کامل سرور و دان بودن چندین ساعته سیستم را باعث میشود.
۲. بررسی مصرف هارد
به صورت دوره ای میزان مصرف هارد درایو های سرور را بررسی کنید. سرورها لاگ های زیاد، ایمیلهای قدیمی و پک های نرم افزاری منقضی دارند. از سیستم خود به عنوان سیستم آرشیو استفاده نکنید و لاگ ها و ایمیل ها و نسخه های نرم افزاری که دیگر استفاده نمیکنید را پاک کنید. دیتای کمتر، ریکاوری را هم سریعتر میکند.
اگر نگهداری لاگهای قدیمی برایتان مهم است آنها را روی استوریج اکسترنال ذخیره و آرشیو کنید. ایمیل های قدیمی را یا پاک کنید یا آرشیو. در برخی برنامه ها پس از آپدیت، فایل های قدیمی پاک نمیشود و باید از برنامه های Package Manager که دارای پروتکل های Cleanup هستند استفاده کنید. استفاده از برنامه های مدیریت فایلهای قدیمی نرم افزاری هم کمک کننده است.
هارد درایوها نه تنها برای ذخیره سازی استفاده میشوند بلکه از آنها به صورت Swap File هم استفاده میکنیم که همانند حافظه فیزیکی کار میکند یعنی در صورت پر شدن رم از این قسمت از هارد استفاده میشود. اگر مصرف هارد به بیش از ۹۰ درصد برسد، با Swap File تداخل پیدا میکند و کارایی به شدت کاهش مییابد.
همچنین در صورت استفاده بیش از ۹۰ درصد از ظرفیت هارد باید یا مصرف را کم کنید یا فضای ذخیره سازی را افزایش دهید. اگر مصرف پارتیشن به ۱۰۰ درصد برسد سرور دیگر پاسخ نمیدهد، جداول دیتابیس خراب میشود و دیتا از دست خواهد رفت.
۳. بررسی مصرف منابع سرور
علاوه بر بررسی مصرف هارد باید میزان مصرف دیگر منابع سرور را بررسی کنید. مصرف حافظه و پردازنده نشانگر این است که سرور تا چه حد سنگین کار میکند. اگر مصرف سی پی یو و رم مرتبا به صددرصد میرسد، نشانگر Overtax شدن سرور است یعنی بار روی آن بیش از حد مجاز است. باید بار را از سخت افزارتان بردارید پس یا سرور را آپگرید کنید یا سرور جدیدی اضافه کنید. خواندن مطلب “۶ دلیل برای جایگزینی سرور قدیمی با سرور جدید؛ پادکست” را از دست ندهید.
۴. آپدیت کنترل پنل
اگر از کنترل پنل سروری یا هاستینگ استفاده میکنید باید آن را آپدیت کنید. نرم افزار کنترل پنل مثل cPanle سی پنل و WHM، باید به صورت دستی آپدیت شود. وقتی سی پنل را آپدیت میکنید فقط کنترل پنل آپدیت میشود و باید برنامه هایی که سی پنل مدیریت میکند مانند Apache و PHP را هم آپدیت کنید.
۵. آپدیت برنامه ها و نرم افزارها
رعایت این نکته به خصوص برای برنامه های مبتنی بر وب مهم است مثل برنامه محبوب وردپرس.
طبیعی است که بسته به نوع پیکربندی سرورتان از نرم افزارهای مختلفی استفاده کنید. برخی سیستم ها دارای Package Manager هستند و به صورت خودکار نرم افزار را آپدیت میکنند اما آنهایی که این کار را نمیکنند باید بررسی شوند و زمانبندی بررسی آپدیت های جدید را برای آنها در نظر گرفت.
توجه داشته باشید که برخی سیستم عامل ها به نسخه های قدیمی برنامه نیاز دارند مثلا پایتون ۲ برای CentOS7. در چنین مواردی باید مراقب باشید که چنین برنامه هایی را در شبکه استفاده نکنید.
۶. بررسی ابزارهای مدیریت از راه دور
ابزارهای مدیریت ریموت شامل ریموت کنسول، ریموت ریبوت و Rescue Mode است که سه ابزار اصلی برای مدیریت از راه دور سرور است. وجود آنها هنگامی که قصد اجرای سرور مجازی مبتنی بر کلود را دارید و یا سرورتان را از راه دور مدیریت میکنید، ضروری است. به صورت دوره ای درست کار کردن آنها را بررسی کنید.
ریبوت کردن میتواند بسیاری مشکلات را حل کند، ریموت کنسول امکان لاگین کردن به سرور بدون حضور فیزیکی را فراهم میکند. Rescue Mode راهکار Redhat است و اغلب سیستم عامل های سروری دارای حالت مدیریتی یا Safe هستند که با آن به صورت ریموت تعمیرات را انجام میدهند.
گفتگوی تک تاک: نکات مهم در نگهداری سرورها
در این بررسی به موارد زیر میپردازیم:
- استفاده از UPS مناسب و بررسی دورهای باتری آن
- نگهداری سرور در مکان و شرایط مطلوب
- بررسی منظم باتری سرور
- استفاده از کولینگ مناسب
۷. بررسی مصرف شبکه
مانند بررسی مصرف رم و CPU باید مصرف و ظرفیت شبکه را بررسی کنید. اگر سرور به سمت حداکثر ظرفیت سخت افزار شبکه پیش میرود، باید آن را آپدیت کنید. استفاده از ابزارهای مانیتورینگ شبکه هم توصیه میشود. این ابزارها ترافیک شبکه را برای استفاده غیرمعمول و دارای مشکل بررسی میکنند.
مانیتورینگ الگوهای ترافیک میتواند ترافیک وب را بهینه کند مثلا ممکن است منابعی که مکررا استفاده میشوند را به سرور سریعتری منتقل کنید. بررسی رفتار غیرعادی برای تشخیص رخنه ها و اتک ها مفید است و مدیریت آنها را راحتتر میکند.
۸. آپدیت سیستم عامل
آپدیت سیستم عامل پروسه مهمی است چون پچ ها و آپدیت ها میتواند مشکلات امنیتی را رفع کند و کارایی را افزایش دهد. هکرها اغلب به پچ های سیستم عاملی نگاه میکنند و به ضعیف ها حمله میکنند آن هم قبل از اینکه بتوانید پچ جدید را نصب کنید. پس زمان های خاصی را برای آپدیت سیستم عامل در نظر بگیرید.
۹. تمیز کردن سخت افزارهای سرور
باید به صورت دوره ای سخت افزار سرور را تمیز کنید. این کار از خرابی سخت افزار پیشگیری میکند و گردوغبار را از سخت افزار و فن ها دور میکند.
گردوغبار در بالا رفتن دما تاثیر دارد در واقع گرما دشمن کارایی سرور است. در این زمینه توسعه شبکه آداکسرویس جنرال سرویس را به شما ارایه میدهد. برای استفاده از آن روی لینک “خدمات جنرال سرویس در فالنیک” بزنید.
۱۰. بررسی خطاهای سخت افزاری
سیستم عامل های مدرن سروری دارای لاگ های خطاهای سخت افزاری هستند. ارور سخت افزاری میتواند خطای SMART و خرابی هارد (مانند خطای خواندن) و خطای درایور و خطای حافظه باشد. مطلب “SMART در هارددیسک چیست؛ خطای اسمارت و رفع آن” را حتما بخوانید.
بررسی لاگ های خطا باعث پیدا کردن مشکل و رفع آن میشود که قبل از خرابی سیستم قابل انجام است.
۱۱. بررسی لاگ های سروری
لاگ های نگهداری سرور، دسترسی و خطا را بررسی میکند. این لاگ ها ممکن است زیاد و گسترده باشند اما با ابزارها و رویه ها میتوان آنها را به آسانی مدیریت کرد.
بررسی مرتب لاگ ها شما را با عملکرد سرورتان مانوس میکند. لاگ میتواند مشکل سخت افزاری را به شما نشان دهد و در نتیجه قبل از خرابی آن را رفع میکنید.
لاگ های دسترسی میزان استفاده غیرمجاز یا دسترسی غیرمجاز کاربران را نشان میدهد.
۱۲. بررسی امنیت پسورد
مرتبا باید امنیت پسورد را بررسی کنید. اگر از سیستم مدیریتی پسورد استفاده نمیکنید همین حالا این کار را انجام دهید. باید سیستمی برای اتوماتیک کردن تغییر پسورد داشته باشید اگر ندارید باید از کاربران بخواهید تغییر پسورد را دستی انجام دهند.
۱۳. ارزیابی اکانت کاربران
به صورت دوره ای لیست اکانت کاربران را بررسی کنید. همچنین Permission های اکانت را بررسی کنید تا از درستی اختصاص آن به هر کاربر مطمئن شوید. هنگام این بررسی ممکن است لازم باشد دیتا و اطلاعات کاربر و اکانت را هم بررسی کنید. همچنین باید امکان پاک کردن اطلاعات کاربر قبلی به صورت دستی وجود داشته باشد.
۱۴. بررسی امنیت کلی سرور
سیاست های امنیتی سرورتان را ارزیابی کنید تا مطمئن شوید در حال اجرا هستند. از ابزار امنیت شبکه برای تست شبکه از بیرون استفاده کنید. این کار باعث میشود جاهایی که از چشم شما دور مانده را تشخیص دهید و قبل از وقوع رخنه، آنها را بیابید. این بررسی ها را ماهانه و یا فصلی انجام دهید.