Linux 系統維護常用指令大全:管理、監控與排錯的完整手冊

把 Linux VPS 維運時最常用的系統查詢、監控、排錯指令整理成手冊,涵蓋 CPU、記憶體、磁碟、網路與日誌分析,幫你遇到問題時快速定位原因。

Linux指令系統管理VPS監控效能磁碟空間程序管理教學運維手冊htopjournalctl排錯網路診斷

真正管理 VPS 時,你最需要的不是某一條神奇指令,而是一套遇到 CPU 飆高、磁碟滿、服務掛掉時能快速檢查現況的手感。這篇就是把最常用的維運指令整理成可回查的手冊。

你如果不想每次都只是照著別人的畫面一步一步跟著按,卻不知道自己到底改了什麼,這篇會比較適合你。重點不是讓你背流程,而是讓你下次遇到類似情況時,還知道該怎麼自己判斷。

你會學到什麼

  • 建立基本的 Linux 觀察與排錯順序。
  • 知道哪些指令適合看 CPU、記憶體、磁碟、網路狀態。
  • 出事時能先做出比「重開看看」更好的第一步。
  • 學會日誌分析與效能瓶頸定位技巧。

什麼情況最適合先看這篇

  • 第一次自己管理 Linux 主機,想把操作做穩而不是只會貼指令的人
  • 你現在正要處理「Linux 系統維護常用指令大全」這類操作
  • 你希望做完之後不只功能能用,連驗證與排錯也有概念

開始前先確認

  • 先確認你能 SSH 登入主機。
  • 最好知道系統正在跑哪些主要服務。
  • 如果是正式環境,所有操作先記錄。

先提醒你一件事

VPS 最怕的不是不會下指令,而是你不知道指令會影響到哪個服務、哪個設定檔、哪個對外連線。

詳細教學與操作步驟

本文為你整理了在管理 Linux 伺服器時最常用的基礎指令。無論你是要檢查記憶體、查看磁碟空間,還是處理卡住的程序,這份手冊都能幫你快速上手。

排錯的黃金順序

當 VPS 出問題時,建議按這個順序檢查:

  1. 先看負載: uptime -- load average 超過 CPU 核心數就是過載
  2. 再看記憶體: free -h -- Swap 使用量過高代表記憶體不足
  3. 看磁碟: df -h -- 使用率超過 90% 要立刻處理
  4. 看程序: tophtop -- 找出吃最多資源的程序
  5. 看日誌: journalctl -xe -- 找出具體錯誤訊息

一、 系統狀態監控

# 系統開機時間與平均負載
uptime

# 系統版本資訊
cat /etc/os-release

# 核心版本
uname -r

# CPU 資訊(核心數、型號)
lscpu | head -15

# 即時負載監控(推薦安裝 htop)
sudo apt install htop -y
htop

# 記憶體使用量(h = human readable)
free -h

# 記憶體詳細資訊
cat /proc/meminfo | head -10

理解 load average: uptime 會顯示三個數字(1 分鐘、5 分鐘、15 分鐘平均負載)。如果你有 2 核 CPU,load average 超過 2.0 就代表 CPU 開始排隊。持續超過核心數的 1.5 倍就該注意了。

二、 磁碟與檔案管理

侃瑞科技 VPS 的高性能磁碟上,你可以快速進行以下操作:

# 磁碟剩餘空間
df -h

# 顯示 inode 使用量(有時磁碟沒滿但 inode 用完了)
df -i

# 檢查資料夾大小
du -sh /var/www/html

# 找出最佔空間的前 10 個目錄
du -h /var/ --max-depth=2 | sort -rh | head -10

# 尋找大於 100MB 的檔案
find / -type f -size +100M -exec ls -lh {} \; 2>/dev/null

# 檢查磁碟 I/O(需安裝 iotop)
sudo apt install iotop -y
sudo iotop -o

磁碟快滿了的緊急處理:

# 清理 APT 快取
sudo apt clean

# 清理舊核心
sudo apt autoremove -y

# 清理 systemd journal(保留最近 7 天)
sudo journalctl --vacuum-time=7d

# 清理 Docker 未使用資源(如果有用 Docker)
docker system prune -a

三、 程序 (Process) 管理

# 列出所有執行中程序
ps aux

# 篩選特定程序
ps aux | grep nginx

# 按 CPU 使用率排序
ps aux --sort=-%cpu | head -10

# 按記憶體使用量排序
ps aux --sort=-%mem | head -10

# 查看程序的樹狀結構
pstree -p

# 強制關閉程序
kill -9 程序ID

# 優雅地終止程序(先嘗試這個)
kill -15 程序ID

# 根據名稱結束程序
pkill -f 程序名稱

四、 網路診斷

# 查看網路監聽埠
ss -lntu

# 查看所有連線(含 PID)
ss -tunap

# 查看特定 port 被誰佔用
ss -lntp | grep :80

# 查看即時網路流量(需安裝 iftop)
sudo apt install iftop -y
sudo iftop

# DNS 查詢
dig example.com +short

# 追蹤路由
traceroute example.com

# 測試某個 port 是否可連
nc -zv 目標IP 80

# 查看網路介面設定
ip addr show

# 查看路由表
ip route show

五、 系統日誌檢查 (Troubleshooting)

# 使用 journalctl 查看系統日誌(推薦)
journalctl -xe

# 查看特定服務的日誌
journalctl -u nginx --since "1 hour ago"

# 查看開機後的日誌
journalctl -b

# 即時追蹤日誌
journalctl -f

# 傳統日誌檔案
tail -f /var/log/syslog
tail -f /var/log/auth.log

# 搜尋錯誤訊息
grep -i "error" /var/log/nginx/error.log | tail -20

# 搜尋特定時間範圍的日誌
journalctl --since "2026-04-10 00:00" --until "2026-04-10 12:00"

六、 檔案操作快速參考

# 搜尋檔案
find /etc -name "*.conf" -type f

# 搜尋檔案內容
grep -r "server_name" /etc/nginx/

# 即時追蹤檔案變化
tail -f /var/log/nginx/access.log

# 比較兩個檔案差異
diff file1.conf file2.conf

# 查看檔案權限與擁有者
ls -la /var/www/

# 遞迴修改擁有者
chown -R www-data:www-data /var/www/html/

# 遞迴修改權限
chmod -R 755 /var/www/html/

七、 效能調校基礎

Swap 空間管理:

# 查看 Swap 狀態
swapon --show

# 如果沒有 Swap,建立 2GB Swap 檔案
sudo fallocate -l 2G /swapfile
sudo chmod 600 /swapfile
sudo mkswap /swapfile
sudo swapon /swapfile

# 加入 fstab 讓重開機後自動啟用
echo '/swapfile none swap sw 0 0' | sudo tee -a /etc/fstab

# 調整 Swap 使用傾向(值越低越傾向用 RAM)
echo 'vm.swappiness=10' | sudo tee -a /etc/sysctl.conf
sudo sysctl -p

系統資源限制檢查:

# 查看開啟檔案數限制
ulimit -n

# 查看目前開啟的檔案數
cat /proc/sys/fs/file-nr

# 如果需要提高限制
echo "* soft nofile 65535" | sudo tee -a /etc/security/limits.conf
echo "* hard nofile 65535" | sudo tee -a /etc/security/limits.conf

常見問題

Q:伺服器變得好慢,該怎麼辦? 按照排錯黃金順序:先用 uptime 看負載,再用 free -h 看記憶體,df -h 看磁碟,最後用 htop 找出兇手。大部分情況是某個程序吃太多記憶體或 CPU。侃瑞科技的 全代管 VPS 也包含專業工程師的諮詢,若有複雜的系統問題,除了問 AI,也可以隨時聯繫我們。

Q:如果不小心刪錯檔案怎麼辦? 在 Linux 中刪除檔案通常是無法復原的。建議在執行 rm 指令前加上 -i 參數進行確認。重要操作前先做 自動備份

Q:怎麼知道是哪個服務拖慢了系統?

# 查看各服務的資源使用
systemd-cgtop

# 查看服務啟動時間(找出拖慢開機的服務)
systemd-analyze blame

做完後怎麼確認自己真的有設對

  • 把本文的關鍵指令跑一遍,確認你的環境都能正常執行。
  • 記下你的 VPS 在正常狀態下的 load average、記憶體使用量、磁碟使用量,作為基準值。
  • 出問題時先跑排錯黃金順序,再決定下一步。

這一題最常踩的坑

  • 看到錯誤就立刻重開,反而把線索洗掉。
  • 只會看一個指標,不會交叉比對。
  • 沒有基本紀錄,之後很難回推問題發生前後。
  • kill -9 暴力砍程序,不給程序清理資源的機會。
  • 磁碟 inode 用完了但空間還有,找不到原因。

如果你要往下一步走

如果你更常用 SSH 操作,建議搭配 SSH 常用指令手冊。想學習文字編輯器操作,參考 Vim 與 Nano 教學。如果你準備開始自己架服務,可以直接對照侃瑞的 VPS 方案與價格 選環境。

需要主機來實作?

侃瑞科技提供 cPanel 虛擬主機與 VPS,教學裡的操作開箱即用。

查看方案 →
LINE 諮詢