技术知识
Oracle Exadata Database Machine 健康巡检报告
exadata 数据库一体机巡检内容
| 设备型号 | 设备序列号 | |||
| PDU数量 | 存储节点数量 | |||
| IB/RoCE交换机数量 | 计算节点数量 | |||
| 机房环境状态 | ||||
| 温度10~25℃ | □是 □否 | 湿度40~70% | □是 □否 | |
| 设备表面是否清洁 | □是 □否 | |||
| PDU | ||||
| 检查项目 | 检查结果 | 异常情况说明 | ||
| PDU 1 是否正常 | □是 □否 | |||
| PDU 2 是否正常 | □是 □否 | |||
| 管理交换机 | ||||
| 检查项目 | 检查结果 | 异常情况说明 | ||
| 以太网交换机是否正常 | □是 □否 | |||
| InfiniBand或RoCE交换机检查 | ||||
| 检查项目 | 检查结果 | 异常情况说明 | ||
| 交换机1是否正常 | □是 □否 | |||
| 交换机2是否正常 | □是 □否 | |||
| CELL(存储)节点检查 | ||||
| 检查项目 | 检查结果 | 异常情况说明 | ||
| 节点主机LED状态是否为绿色 | □是 □否 | |||
| 当前镜像检查:#imageinfo | □是 □否 | |||
| 历史镜像检查:#imagehistory | □是 □否 | |||
| 操作系统检查:#cat /etc/os-release | ||||
节点硬盘,闪存卡状态检査: #cellcli-e list physicaldisk | □是 □否 | |||
闪存工作模式状态: #cellcli -e list cell detail|grep flashCacheMode | □是 □否 | |||
各数据库闪存分配检査: #cellcli -e list metriccurrent DB FC_BY_ALLOCATED | □是 □否 | |||
各PDB闪存分配检査: #cellcli -e list metriccurrent PDB FC_BY_ALLOCATED | □是 □否 | |||
griddisk状态检查: # cellcli -e list griddisk attributes name, asmmodestatus,status | □是 □否 | |||
磁盘组缓存策略检査: # cellcli -e list griddisk atributes name,asmDiskgroupName,cachingPolicy | □是 □否 | |||
系统盘RAID信息检査: #mdadm -Q -D /dev/md24 | □是 □否 | |||
磁盘擦洗操作周期检査: #cellcli -e list cell attributes harddiskscrubinterval | □是 □否 | |||
硬件firmware检查: #/opt/oracle.SupportTools/CheckHWnFWProfile -c strict | □是 □否 | |||
| IB网卡状态检查:#ibstatus | □是 □否 | |||
| 防火墙状态检查:#systemctl status cellwall | □是 □否 | |||
| IORM状态检査:#cellcli -e list iormplan detail | □是 □否 | |||
性能统计数据检査: #cellsrvstat -interval=2 -count=10 | □是 □否 | |||
| 磁盘I/0检查:#iostat -dxk 1 100 | □是 □否 | |||
| 文件系统使用率检查:#df -Th | □是 □否 | |||
| 时钟同步检查:#chronyc sources -y | □是 □否 | |||
系统日志检查:/var/log 目录下messages、lastlog、maillog | □是 □否 | |||
节点alert日志检查: /var/log/oracle/diag/asm/cell/<cell nodename>/trace/alert.log | □是 □否 | |||
| DB(计算)节点检查 | ||||
| 检查项目 | 检查结果 | 异常情况说明 | ||
| 节点主机LED状态是否为绿色 | □是 □否 | |||
| 当前镜像检查:#imageinfo | □是 □否 | |||
| 历史镜像检查:#imagehistory | □是 □否 | |||
| 操作系统检查:#cat/etc/os-release | □是 □否 | |||
| 硬盘状态检查:#dbmcli -e list physicaldisk | □是 □否 | |||
硬盘RAID信息检查: #mdadm -Q -D /dev/md25 | □是 □否 | |||
硬件firmware检查: #/opt/oracle.SupportTools/CheckHWnFWProfile -c strict | □是 □否 | |||
| IB网卡状态检査:#ibstatus | □是 □否 | |||
| 网卡状态检查:#ethtoolbondeth0/eth0 | □是 □否 | |||
网卡绑定检查: #cat /proc/net/bonding/bondeth0 | □是 □否 | |||
| 文件系统检查:#df-Th | □是 □否 | |||
系统大页检查: # cat /proc/meminfo|grep HugePages | □是 □否 | |||
| 时钟同步检查:#chronycsources -v | □是 □否 | |||
| 交换分区检查:#free | □是 □否 | |||
| DNS解析顺序检查:#cat /etc/nsswitch.conf | □是 □否 | |||
| DNS配置信息检查:#cat/etc/resolv.conf | □是 □否 | |||
系统日志检查:/var/log 目录下messages、lastlog、maillog | □是 □否 | |||
查看存储磁盘: #/u01/app/19.0.0.0/grid/bin/kfod op=disks disks=all | □是 □否 | |||
| 数据库集群检查 | ||||
| 检查项目 | 检查结果 | 异常情况说明 | ||
| DB集群alert日志: | □是 □否 | |||
| ASM alert日志: | □是 □否 | |||
| DB alert日志: | □是 □否 | |||
| CELL alert日志: | □是 □否 | |||
| 版本检查: | □是 □否 | |||
| OCR状态检查: | □是 □否 | |||
| OCR备份检查: | □是 □否 | |||
| votedisk检查: | □是 □否 | |||
| 网络配置信息: | □是 □否 | |||
| 集群状态检查: | □是 □否 | |||
| 集群scan状态检查: | □是 □否 | |||
| 集群scan监听状态检查: | □是 □否 | |||
| 数据库实例检查 | ||||
| 检查项目 | 检查结果 | 异常情况说明 | ||
| 数据库版本检查: | ||||
| 数据库状态检査: | ||||
| 数据库时区及会话时区检查: | ||||
| 数据库字符集检查: | ||||
| 数据库自动维护定时任务检查: | ||||
| 数据库磁盘组使用情况检查: | ||||
| 数据库磁盘组属性检查: | ||||
| 磁盘Rebalance操作检查: | ||||
| 数据库直接路径读取参数检查: | ||||
| 数据库备份检查: | ||||
| AWR配置检查: | ||||
如需要收集最近30天数据库的性能报告: SQL>@?/rdbms/admin/awrrpt.sql SQL>@?/rdbms/admin/addmrpt.sql SQL>@?/rdbms/admin/ashrpt.sql SQL>@?/rdbms/admin/awrsqrpt.sql SQL>@?/rdbms/admin/awrddrpt.sql SQL>@?/rdbms/admin/awrgrpt.sql SQL>@?/rdbms/admin/awrrpti.sql SQL>@?/rdbms/admin/awrextr.sql | ||||
| 如需要运行exachk 和orachk工具 | ||||