1. 日常维护概述
日常维护是确保NBU备份系统正常运行的重要环节,通过定期的维护操作,可以提高系统的可靠性和性能。更多学习教程www.fgedu.net.cn
# nbemmcmd -listhosts
# 示例输出
Server Name: master-server
Machine Type: MASTER
Server Type: PRIMARY
Master Server: master-server
Client Name: master-server
NetBackup Version: 9.1.0.0
Server Name: media01
Machine Type: MEDIA
Server Type: PRIMARY
Master Server: master-server
Client Name: media01
NetBackup Version: 9.1.0.0
2. 日常任务
日常任务是每天需要执行的维护操作,确保系统的正常运行。学习交流加群风哥微信: itpux-com
# bpjoblist -all
# 示例输出
Job ID Type State Status Client Policy Schedule Started Ended
1234 BACKUP Done 0 client01 Full_Backup Full 03/30/2026 21:00:00 03/30/2026 22:30:00
1235 BACKUP Done 0 client02 Full_Backup Full 03/30/2026 21:00:00 03/30/2026 22:15:00
1236 BACKUP Done 0 client03 Full_Backup Full 03/30/2026 21:30:00 03/30/2026 23:00:00
# 检查存储单元状态
# nbdevconfig -liststu
# 示例输出
Storage Unit Name: Primary_Disk
Media Server: media01
Type: Disk
Status: UP
Max Media Servers: 2
Max Disk Volumes: 100
Storage Unit Name: Tape_Library
Media Server: media01
Type: Tape
Status: UP
Robot Number: 1
Drive Pool: Default
# 检查NBU服务状态
# systemctl status netbackup
# 示例输出
● netbackup.service – NetBackup services
Loaded: loaded (/etc/systemd/system/netbackup.service; enabled; vendor preset: disabled)
Active: active (running) since Fri 2026-03-30 08:00:00 CST; 14h ago
Main PID: 1234 (nbftsrvr)
Tasks: 100
CGroup: /system.slice/netbackup.service
├─1234 /usr/openv/netbackup/bin/nbftsrvr
├─5678 /usr/openv/netbackup/bin/bpbrm
└─9012 /usr/openv/netbackup/bin/bptm
3. 每周任务
每周任务是每周需要执行的维护操作,确保系统的健康状态。
# bpexpdate -d 30 -policy Full_Backup
# 示例输出
bpexpdate: policy Full_Backup: 10 images expired, 0 images failed to expire
# 检查数据库状态
# nbdb_admin -validate
# 示例输出
NBDB validation successful.
All database checks passed.
# 检查磁带状态
# vmquery -a
# 示例输出
vmquery: no media found
# 检查媒体服务器状态
# nbemmcmd -getmedia
# 示例输出
Media ID: A00001
Barcode: TAPE001
Volume Pool: NetBackup
Status: ACTIVE
Media Server: media01
Last Write Time: 03/29/2026 21:00:00
Expiration Time: 04/29/2026 21:00:00
4. 每月任务
每月任务是每月需要执行的维护操作,确保系统的性能和可靠性。
# nbdb_admin -optimize
# 示例输出
NBDB optimization started.
NBDB optimization completed successfully.
# 检查存储使用情况
# nbdevconfig -listdp -U
# 示例输出
Disk Pool Name: Primary_Disk_Pool
Status: UP
Total Capacity: 10000 GB
Used Capacity: 6500 GB
Available Capacity: 3500 GB
Utilization: 65%
Media Server: media01
Storage Units: Primary_Disk
# 检查备份策略
# bppllist -l
# 示例输出
Policy Name: Full_Backup
Policy Type: Standard
Active: yes
Effective date: 01/01/2026 00:00:00
Client Encrypt: no
Client-side Deduplication: no
Compress: no
Retention Level: 7 days
Storage Unit: Primary_Disk
Maximum Jobs: 10
Priority: 0
Schedules:
Full Backup: FULL (0 21:00:00)
Differential Incremental: DIFF (1-5 21:00:00)
Cumulative Incremental: INCR (1-5 21:00:00)
# 执行备份测试
# bprestore -s “03/30/2026” -e “03/30/2026” -C client01 -D /test_restore -p Full_Backup -k “”
# 示例输出
Restoring files from backup id client01_1234567890
Restored 100 files successfully
5. 季度任务
季度任务是每季度需要执行的维护操作,确保系统的长期稳定运行。
# tar -cvzf /backup/nbu_config_$(date +’%Y%m%d’).tar.gz /usr/openv/netbackup/db /usr/openv/netbackup/bp.conf
# 示例输出
tar: Removing leading `/’ from member names
/usr/openv/netbackup/db/
/usr/openv/netbackup/db/config/
/usr/openv/netbackup/db/images/
/usr/openv/netbackup/bp.conf
# 检查系统日志
# tail -n 100 /usr/openv/netbackup/logs/bpbrm/bpbrm.log
# 示例输出
03/30/2026 21:00:00 [1234] <4> bpbrm: start
03/30/2026 21:00:00 [1234] <4> bpbrm: client client01
03/30/2026 21:00:00 [1234] <4> bpbrm: backup id client01_1234567890
03/30/2026 22:30:00 [1234] <4> bpbrm: EXITING with status 0
# 检查磁带库清洁
# vmoprcmd -h media01 -clean
# 示例输出
Robot 1: Cleaning started
Robot 1: Cleaning completed successfully
# 测试灾难恢复
# nbdb_restore -recover -destination /backup
# 示例输出
NBDB restore started.
NBDB restore completed successfully.
6. 年度任务
年度任务是每年需要执行的维护操作,确保系统的持续改进和更新。
# 下载最新版本
# wget https://download.veritas.com/pub/support/downloads/NetBackup_9.2_LinuxR_x86_64.tar.gz
# 解压并安装
# tar -xzf NetBackup_9.2_LinuxR_x86_64.tar.gz
# cd NetBackup_9.2_LinuxR_x86_64
# ./install
# 示例输出
Veritas NetBackup 9.2 Install Program
Checking for available space…
Checking for required system dependencies…
Checking for existing NetBackup installation…
Starting NetBackup upgrade…
Upgrading NetBackup Server components…
Upgrading NetBackup Client components…
Upgrading NetBackup Database…
Upgrade completed successfully!
# 审查备份策略
# bppllist -l > /backup/backup_policies_$(date +’%Y%m%d’).txt
# 分析备份性能
# bpperfmon -r > /backup/performance_report_$(date +’%Y%m%d’).txt
# 制定下一年度维护计划
# cat > /backup/maintenance_plan_$(date +’%Y’).txt << EOF
# 年度维护计划
## 日常维护
- 每日检查备份作业状态
- 每日检查存储单元状态
- 每日检查服务状态
## 每周维护
- 清理过期备份
- 检查数据库状态
- 检查磁带状态
## 每月维护
- 优化数据库
- 检查存储使用情况
- 执行备份测试
## 季度维护
- 备份NBU配置
- 检查系统日志
- 测试灾难恢复
## 年度维护
- 升级NBU版本
- 审查备份策略
- 分析备份性能
EOF
7. 常见问题处理
常见问题处理是维护过程中的重要环节,及时解决系统出现的问题。
# 查看失败作业
# bpjoblist -all -state DONE -status 2
# 示例输出
Job ID Type State Status Client Policy Schedule Started Ended
1237 BACKUP Done 2 client04 Full_Backup Full 03/30/2026 22:00:00 03/30/2026 22:05:00
# 查看失败原因
# bperror -jobid 1237 -l
# 示例输出
03/30/2026 22:05:00 – Error bpbrm (pid=1234) client client04 connection refused
03/30/2026 22:05:00 – Error bpbrm (pid=1234) cannot connect to client client04
03/30/2026 22:05:00 – Error bptm (pid=5678) EXITING with status 2
# 处理存储单元问题
# 检查存储单元状态
# nbdevconfig -liststu | grep -i down
# 示例输出
Storage Unit Name: Secondary_Disk
Media Server: media01
Type: Disk
Status: DOWN
# 恢复存储单元
# nbdevconfig -up stu -storage_unit Secondary_Disk
# 示例输出
Storage Unit Secondary_Disk has been brought up
# 处理服务启动失败
# 查看服务日志
# tail -f /usr/openv/netbackup/logs/nbdb/nbdb.log
# 示例输出
03/30/2026 08:00:00 [1234] <2> nbdb: Database server started
03/30/2026 08:00:00 [1234] <2> nbdb: Database server ready
8. 维护工具
维护工具是执行维护操作的重要手段,通过使用这些工具,可以提高维护效率。
# nbperfchk
# 示例输出
NetBackup Performance Check
System Resources:
CPU Usage: 30%
Memory Usage: 40%
Disk I/O: 50%
Network I/O: 60%
NetBackup Configuration:
Number of Media Servers: 2
Number of Storage Units: 3
Number of Backup Policies: 10
Number of Clients: 50
Performance Recommendations:
1. Increase memory to 32GB
2. Add more media servers
3. Optimize network configuration
# 使用bppllist管理备份策略
# bppllist -U
# 示例输出
Policy Name: Full_Backup
Policy Type: Standard
Active: yes
Effective date: 01/01/2026 00:00:00
Client Encrypt: no
Client-side Deduplication: no
Compress: no
Retention Level: 7 days
Storage Unit: Primary_Disk
Maximum Jobs: 10
Priority: 0
# 使用bpclient管理客户端
# bpclient -client client01 -L
# 示例输出
Client Name: client01
Type: CLIENT
Master Server: master-server
Media Server: media01
NetBackup Version: 9.1.0.0
Encryption: no
Compression: no
9. 维护最佳实践
遵循以下维护最佳实践,确保NBU系统的稳定运行。
# 1. 建立维护计划
# 创建维护计划文档
cat > /backup/maintenance_plan.md << EOF
# NBU维护计划
## 日常维护
- [x] 检查备份作业状态
- [x] 检查存储单元状态
- [x] 检查服务状态
## 每周维护
- [x] 清理过期备份
- [x] 检查数据库状态
- [x] 检查磁带状态
## 每月维护
- [x] 优化数据库
- [x] 检查存储使用情况
- [x] 执行备份测试
## 季度维护
- [x] 备份NBU配置
- [x] 检查系统日志
- [x] 测试灾难恢复
## 年度维护
- [x] 升级NBU版本
- [x] 审查备份策略
- [x] 分析备份性能
EOF
# 2. 自动化维护任务
# 创建维护脚本
# vi /usr/local/bin/nbu_maintenance.sh
#!/bin/bash
# NBU维护脚本
LOG_FILE="/var/log/nbu_maintenance.log"
echo "[$(date +'%Y-%m-%d %H:%M:%S')] 开始维护任务" >> $LOG_FILE
# 清理过期备份
echo “[$(date +’%Y-%m-%d %H:%M:%S’)] 清理过期备份” >> $LOG_FILE
bpexpdate -d 30 -policy Full_Backup >> $LOG_FILE
# 检查数据库状态
echo “[$(date +’%Y-%m-%d %H:%M:%S’)] 检查数据库状态” >> $LOG_FILE
nbdb_admin -validate >> $LOG_FILE
# 检查存储单元状态
echo “[$(date +’%Y-%m-%d %H:%M:%S’)] 检查存储单元状态” >> $LOG_FILE
nbdevconfig -liststu >> $LOG_FILE
echo “[$(date +’%Y-%m-%d %H:%M:%S’)] 维护任务完成” >> $LOG_FILE
# 设置执行权限
# chmod +x /usr/local/bin/nbu_maintenance.sh
# 添加到计划任务
# crontab -e
# 每周执行一次
0 1 * * 0 /usr/local/bin/nbu_maintenance.sh > /dev/null 2>&1
# 3. 文档化维护操作
# 记录维护过程
# vi /backup/maintenance_log.md
# 4. 培训维护人员
# 培训维护人员熟悉维护操作
# 5. 制定应急计划
# 准备系统故障的应急方案
10. 案例分析
通过实际案例分析,了解NBU维护的实施过程。
## 背景
– 企业规模:中型企业,约500名员工
– NBU版本:9.1
– 数据量:约50TB
– 备份策略:每周全备份,每天增量备份
## 维护需求
1. 确保备份系统的稳定运行
2. 提高备份效率和可靠性
3. 及时发现并解决系统问题
## 实施过程
1. 建立维护计划:
– 制定日常、每周、每月、季度和年度维护任务
– 分配维护责任人
– 建立维护文档
2. 自动化维护:
– 创建维护脚本
– 配置计划任务
– 实现维护自动化
3. 监控与告警:
– 配置监控工具
– 设置告警阈值
– 及时处理告警
4. 定期审查:
– 每周审查备份作业
– 每月审查存储使用情况
– 季度审查系统性能
## 实施结果
1. 系统可靠性:备份成功率从95%提升到99%
2. 备份效率:备份时间从8小时减少到4小时
3. 故障响应:故障响应时间从4小时缩短到30分钟
4. 维护成本:维护工作量减少50%
## 经验教训
1. 建立完善的维护计划是成功的关键
2. 自动化维护可以提高效率和可靠性
3. 定期监控和审查可以及时发现问题
4. 培训维护人员可以提高维护质量
1. 建立完善的维护计划,定期执行维护任务
2. 自动化维护操作,提高效率和可靠性
3. 配置监控工具,及时发现并解决问题
4. 文档化维护过程,建立维护记录
5. 培训维护人员,提高维护技能
本文由风哥教程整理发布,仅用于学习测试使用,转载注明出处:http://www.fgedu.net.cn/10327.html
