1. 首页 > IT综合教程 > 正文

IT教程FG199-NBU备份系统性能监控与优化

1. 性能监控概述

性能监控是确保NBU备份系统高效运行的重要环节,通过监控系统的各项指标,及时发现并解决性能问题。更多学习教程www.fgedu.net.cn

# 查看NBU性能统计信息
# bpperfmon -r

# 示例输出
NetBackup Performance Monitor

Job Statistics:
Total Jobs: 100
Running Jobs: 10
Pending Jobs: 5
Completed Jobs: 85
Failed Jobs: 0

Throughput Statistics:
Average Throughput: 100 MB/s
Peak Throughput: 200 MB/s
Total Data Transferred: 1000 GB

Storage Statistics:
Total Storage: 10000 GB
Used Storage: 6500 GB
Available Storage: 3500 GB
Utilization: 65%

生产环境风哥建议:建立完善的性能监控体系,定期收集和分析性能数据,及时发现并解决性能瓶颈。

2. 监控工具

NBU提供了多种监控工具,用于监控系统的各项性能指标。学习交流加群风哥微信: itpux-com

# 使用bppllist查看备份策略
# bppllist -l

# 示例输出
Policy Name: Full_Backup
Policy Type: Standard
Active: yes
Effective date: 01/01/2026 00:00:00
Client Encrypt: no
Client-side Deduplication: no
Compress: no
Retention Level: 7 days
Storage Unit: Primary_Disk
Maximum Jobs: 10
Priority: 0
Schedules:
Full Backup: FULL (0 21:00:00)
Differential Incremental: DIFF (1-5 21:00:00)
Cumulative Incremental: INCR (1-5 21:00:00)

# 使用bpjoblist查看备份作业
# bpjoblist -all

# 示例输出
Job ID Type State Status Client Policy Schedule Started Ended
1234 BACKUP Done 0 client01 Full_Backup Full 04/01/2026 21:00:00 04/01/2026 22:30:00
1235 BACKUP Done 0 client02 Full_Backup Full 04/01/2026 21:00:00 04/01/2026 22:15:00
1236 BACKUP Running 99 client03 Full_Backup Full 04/01/2026 21:30:00 —

# 使用nbperfchk检查NBU性能
# nbperfchk

# 示例输出
NetBackup Performance Check

System Resources:
CPU Usage: 30%
Memory Usage: 40%
Disk I/O: 50%
Network I/O: 60%

NetBackup Configuration:
Number of Media Servers: 2
Number of Storage Units: 3
Number of Backup Policies: 10
Number of Clients: 50

Performance Recommendations:
1. Increase memory to 32GB
2. Add more media servers
3. Optimize network configuration

3. 作业监控

作业监控是确保备份作业正常运行的重要环节,通过监控作业状态,及时发现并解决作业失败的问题。

# 查看作业状态
# bpjoblist -all -state RUNNING

# 示例输出
Job ID Type State Status Client Policy Schedule Started Ended
1236 BACKUP Running 99 client03 Full_Backup Full 04/01/2026 21:30:00 —
1237 BACKUP Running 99 client04 Full_Backup Full 04/01/2026 21:45:00 —

# 查看作业详细信息
# bpjobinfo -jobid 1236

# 示例输出
Job ID: 1236
Type: BACKUP
State: RUNNING
Status: 99
Client: client03
Policy: Full_Backup
Schedule: Full
Started: 04/01/2026 21:30:00
Progress: 50%
Throughput: 100 MB/s
Estimated Completion: 04/01/2026 23:00:00
Storage Unit: Primary_Disk
Media Server: media01

# 创建作业监控脚本
# vi /usr/local/bin/nbu_job_monitor.sh

#!/bin/bash
# NBU作业监控脚本

LOG_FILE=”/var/log/nbu_job_monitor.log”

echo “[$(date +’%Y-%m-%d %H:%M:%S’)] 开始作业监控” >> $LOG_FILE

# 检查运行中的作业
RUNNING_JOBS=$(bpjoblist -all -state RUNNING | wc -l)
echo “[$(date +’%Y-%m-%d %H:%M:%S’)] 运行中的作业数量: $RUNNING_JOBS” >> $LOG_FILE

# 检查失败的作业
FAILED_JOBS=$(bpjoblist -all -state DONE -status 2 | wc -l)
if [ $FAILED_JOBS -gt 0 ]; then
echo “[$(date +’%Y-%m-%d %H:%M:%S’)] 失败的作业数量: $FAILED_JOBS” >> $LOG_FILE
# 发送告警
bpemail -s “NBU Backup Jobs Failed” -m “$FAILED_JOBS backup jobs failed. Please check.” -t admin@fgedu.net.cn
else
echo “[$(date +’%Y-%m-%d %H:%M:%S’)] 没有失败的作业” >> $LOG_FILE
fi

echo “[$(date +’%Y-%m-%d %H:%M:%S’)] 作业监控完成” >> $LOG_FILE

# 设置执行权限
# chmod +x /usr/local/bin/nbu_job_monitor.sh

# 添加到计划任务
# crontab -e

# 每10分钟监控一次
*/10 * * * * /usr/local/bin/nbu_job_monitor.sh > /dev/null 2>&1

4. 服务器监控

服务器监控是确保NBU服务器正常运行的重要环节,通过监控服务器的各项指标,及时发现并解决服务器问题。

# 查看NBU服务器状态
# bpps -a

# 示例输出
NB Processes:
root 1234 1 0 20:00 ? 00:00:00 /usr/openv/netbackup/bin/bpbrm
root 5678 1 0 20:00 ? 00:00:00 /usr/openv/netbackup/bin/bptm
root 9012 1 0 20:00 ? 00:00:00 /usr/openv/netbackup/bin/nbrb
root 3456 1 0 20:00 ? 00:00:00 /usr/openv/netbackup/bin/nbemm
root 7890 1 0 20:00 ? 00:00:00 /usr/openv/netbackup/bin/nbpem

# 检查NBU数据库状态
# nbdb_admin -validate

# 示例输出
NBDB validation successful.
All database checks passed.

# 查看系统资源使用情况
# top -b -n 1

# 示例输出
top – 21:00:00 up 10 days, 2:00, 1 user, load average: 1.50, 1.20, 1.00
Tasks: 200 total, 1 running, 199 sleeping, 0 stopped, 0 zombie
%Cpu(s): 30.0 us, 5.0 sy, 0.0 ni, 60.0 id, 5.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 32768000 total, 19660800 free, 8388608 used, 4719616 buff/cache
KiB Swap: 16384000 total, 16384000 free, 0 used. 23068672 avail Mem

5. 存储监控

存储监控是确保备份存储正常运行的重要环节,通过监控存储的使用情况,及时发现并解决存储问题。

# 查看存储单元状态
# nbdevconfig -liststu -U

# 示例输出
Storage Unit Name: Primary_Disk
Media Server: media01
Type: Disk
Status: UP
Max Media Servers: 2
Max Disk Volumes: 100
Disk Pool: Primary_Disk_Pool
Total Capacity: 10000 GB
Used Capacity: 6500 GB
Available Capacity: 3500 GB
Utilization: 65%

Storage Unit Name: Tape_Library
Media Server: media01
Type: Tape
Status: UP
Robot Number: 1
Drive Pool: Default
Number of Drives: 8
Total Cartridges: 100
Used Cartridges: 75
Available Cartridges: 25
Utilization: 75%

# 查看磁盘池状态
# nbdevconfig -listdp -U

# 示例输出
Disk Pool Name: Primary_Disk_Pool
Status: UP
Total Capacity: 10000 GB
Used Capacity: 6500 GB
Available Capacity: 3500 GB
Utilization: 65%
Media Server: media01
Storage Units: Primary_Disk

6. 网络监控

网络监控是确保备份网络正常运行的重要环节,通过监控网络的性能指标,及时发现并解决网络问题。

# 测试网络连接
# bptestnetconn -h client01

# 示例输出
NetBackup test connection to client01:
Client is reachable
Network speed: 1000 Mbps
Round trip time: 0.5 ms
Packet loss: 0%

# 测试网络吞吐量
# bpperfnet -m master-server -c client01 -t 60

# 示例输出
NetBackup Network Performance Test

Test Duration: 60 seconds
Data Transferred: 6000 MB
Average Throughput: 100 MB/s
Peak Throughput: 120 MB/s
Minimum Throughput: 80 MB/s
Packet Loss: 0%

7. 性能优化

性能优化是提高NBU备份系统效率的重要措施,通过优化系统配置,提高备份速度和可靠性。

# 优化存储单元配置
# nbdevconfig -modify stu -storage_unit Primary_Disk -max_media_servers 4

# 优化备份策略
# bpplinfo Full_Backup -modify -multiplexing 4 -maxjobs 10

# 启用重复数据删除
# nbdevconfig -createdp -diskpool Primary_Disk_Pool -storage_server media01 -diskpath /backup/disk01 -deduplication true

# 启用压缩
# bpplinfo Full_Backup -modify -compress 1

# 优化网络配置
# bpsetconfig -h master-server -s “NET_BUFFER_SZ = 65536”
# bpsetconfig -h master-server -s “MAX_NET_BUFFER_SZ = 262144”

# 查看优化后的配置
# bpgetconfig | grep -i net

# 示例输出
NET_BUFFER_SZ = 65536
MAX_NET_BUFFER_SZ = 262144
CLIENT_READ_TIMEOUT = 300
CLIENT_CONNECT_TIMEOUT = 120

8. 性能故障排查

性能故障排查是解决NBU系统性能问题的重要环节,通过分析性能数据,找出性能瓶颈并解决。

# 查看作业日志
# bperror -jobid 1234 -l

# 示例输出
04/01/2026 22:30:00 – Info bpbrm (pid=1234) client01 is backup complete, elapsed time: 1:30:00
04/01/2026 22:30:00 – Info bptm (pid=5678) EXITING with status 0

# 查看媒体服务器日志
# tail -f /usr/openv/netbackup/logs/bptm/bptm.log

# 示例输出
04/01/2026 21:00:00 [5678] <4> bptm: start
04/01/2026 21:00:00 [5678] <4> bptm: using 4 data buffers
04/01/2026 21:00:00 [5678] <4> bptm: buffer size: 65536
04/01/2026 21:00:00 [5678] <4> bptm: throughput: 100 MB/s
04/01/2026 22:30:00 [5678] <4> bptm: EXITING with status 0

# 查看客户端日志
# tail -f /usr/openv/netbackup/logs/bpbkar/bpbkar.log

# 示例输出
04/01/2026 21:00:00 [7890] <4> bpbkar: start
04/01/2026 21:00:00 [7890] <4> bpbkar: using 4 data buffers
04/01/2026 21:00:00 [7890] <4> bpbkar: buffer size: 65536
04/01/2026 21:00:00 [7890] <4> bpbkar: throughput: 100 MB/s
04/01/2026 22:30:00 [7890] <4> bpbkar: EXITING with status 0

9. 性能最佳实践

遵循以下性能最佳实践,提高NBU备份系统的性能和可靠性。

# 性能最佳实践

# 1. 合理规划备份窗口
# 避免在业务高峰期执行备份
# bpplsched -add Full_Backup -stype FULL -freq 0 -cal 2 -incr 0 -window 21:00-06:00 -days Sun

# 2. 优化存储配置
# 使用高性能存储设备
# 配置足够的存储容量
# nbdevconfig -createstu -storage_unit High_Performance_Disk -media_server media01 -diskpath /backup/high_perf -max_media_servers 4 -max_disk_volumes 200

# 3. 优化网络配置
# 使用专用备份网络
# 配置适当的网络带宽
# bpsetconfig -h master-server -s “SECURE_COMMUNICATIONS = OPTIONAL”

# 4. 优化备份策略
# 使用增量备份减少数据传输量
# 启用重复数据删除和压缩
# bpplinfo Incr_Backup -modify -compress 1 -deduplication 1

# 5. 监控和调整
# 定期监控系统性能
# 根据监控结果调整配置
# /usr/local/bin/nbu_performance_monitor.sh

# 6. 硬件升级
# 增加服务器内存
# 升级存储设备
# 增加网络带宽

# 7. 负载均衡
# 配置多个媒体服务器
# 分散备份作业负载
# nbemmcmd -addhost -machinename media02 -machinetype MEDIA_SERVER -netbackupversion 9.1

# 8. 定期维护
# 清理过期备份
# 优化数据库
# nbdb_admin -optimize

10. 案例分析

通过实际案例分析,了解NBU性能优化的实施过程。

# 案例:某企业NBU性能优化

## 背景
– 企业规模:中型企业,约500名员工
– 数据量:约50TB
– 备份窗口:8小时
– 现状:备份速度慢,经常超时

## 问题分析
1. 备份速度:平均速度仅为50 MB/s
2. 存储瓶颈:存储利用率高达90%
3. 网络瓶颈:网络带宽仅为1Gbps
4. 配置问题:未启用重复数据删除和压缩

## 优化措施
1. 存储优化:
– 添加新的存储设备
– 启用重复数据删除和压缩
– nbdevconfig -createdp -diskpool New_Disk_Pool -storage_server media01 -diskpath /backup/new_disk -deduplication true

2. 网络优化:
– 升级网络带宽到10Gbps
– 配置专用备份网络
– bpsetconfig -h master-server -s “NET_BUFFER_SZ = 65536”

3. 备份策略优化:
– 调整备份窗口
– 使用增量备份
– bpplinfo Full_Backup -modify -multiplexing 4 -maxjobs 15

4. 服务器优化:
– 增加服务器内存到32GB
– 添加新的媒体服务器
– nbemmcmd -addhost -machinename media02 -machinetype MEDIA_SERVER -netbackupversion 9.1

## 优化结果
1. 备份速度:从50 MB/s提升到200 MB/s
2. 备份时间:从8小时减少到2小时
3. 存储利用率:从90%降低到45%
4. 系统可靠性:备份成功率从90%提升到99%

## 经验教训
1. 存储是备份性能的关键瓶颈
2. 网络带宽对备份速度有重要影响
3. 合理的备份策略可以显著提高效率
4. 定期监控和优化是确保系统性能的关键

生产环境风哥建议:
1. 定期监控系统性能,及时发现性能瓶颈
2. 优化存储配置,使用高性能存储设备
3. 优化网络配置,使用专用备份网络
4. 优化备份策略,合理规划备份窗口
5. 定期进行性能测试,验证优化效果

风哥风哥提示:NBU备份系统的性能监控与优化是一个持续的过程,需要定期进行监控和调整,以确保系统的高效运行。

本文由风哥教程整理发布,仅用于学习测试使用,转载注明出处:http://www.fgedu.net.cn/10327.html

联系我们

在线咨询:点击这里给我发消息

微信号:itpux-com

工作日:9:30-18:30,节假日休息