手动清理IPCS 资源:
技术(故障)
问题(摘要)
HT agent 不能正常,由于IPCS 资源问题
Symptom
症状
这个可能导致不期望的Web Server 状态在TEP,Web site 名字或者状态或者不期望的统计信息
IPCS 资源 可能有wrong user ID 或者 wrong 权限。
它可能是 共享内存和semaphores 信号量是需要被清理(它们按照下麦安的程序)
它也可能是产生缺陷导致(它们尝试更新到最新的HT agent 代码查看如果问题存在,联系支持)
诊断问题:
这些问题通常被认为是共享内存和信号量相关错误消息:
684118 569530 5:27:55 16:43:43 5:27:55
m 1048577 0x010012fb --rw-rw---- www wadmgrp root icogrp 3 13648 245926 839906 16:46:22 16:46:22 5:20:05
m 1048578 0xffffffff D-rw-rw---- trwww trwadm root system 4 10224 594046 245926 5:20:05 5:20:05 5:20:05
m 3 0x7800002c --rw-rw-rw- root system root system 1 268435456 684118 569530 5:27:55 16:43:43 5:27:55
T ID KEY MODE OWNER GROUP CREATOR CGROUP NSEMS OTIME CTIME
Semaphores:
s 9437184 0x010012fb --ra-ra---- www wadmgrp root icogrp 2 16:46:24 5:20:05
s 1 0x62018b61 --ra-r--r-- root system root system 1 5:07:37 5:07:37
s 4194306 0x020012fb --ra-ra---- trwww trwadm root system 1 16:46:22 5:18:03
s 5242884 0xffffffff --ra------- trwww trwadm root system 1 no-entry 5:17:55
s 7340037 0xffffffff --ra------- trwadm trwadm root system 1 no-entry 5:12:53
s 2097170 0xffffffff --ra------- www wadmgrp root icogrp 1 no-entry 5:19:55
s 1048595 0xffffffff --ra------- wadmuser wadmgrp root icogrp 1 no-entry 5:19:53
s 1048596 0x010189b2 --ra------- root system root system 1 5:19:34 5:19:34
s 1048597 0xffffffff --ra------- trwww trwadm root system 1 16:46:24 5:18:03
s 22 0xffffffff --ra------- www wadmgrp root icogrp 1 16:46:24 5:20:05
潜在的资源问题已经被看到了( 这是一个例子 2个Werb server 运行在相同的机器上):
-- key 0xffffffff 不能被使用
如何查看当前活动的:
2个命令行是可用的:
ipcrm 删除信号量,消息队列和共享内存区域从system:
ipcs 显示信号量状态,消息队列和共享内存
ipcrm 命令是前端用于shmctl, semctl, and msgctl 系统调用
shmctl(共享内存管理)
初始化信号量,此时使用 semctl() 函数的SETVAL操作。当使用二维信号量时,通常将信号量初始化为1。
根据传递的flag是什么到命令 如果调用者有合适的权限,
这个会删除合适的资源
The ipcs command is used to view current status:
ipcs -am (shared memory)
ipcs -aq (message queues)
ipcs -as (semaphores)
oracle@lspj1:/home/oracle/$ipcs -m
IPC status from /dev/mem as of Mon Feb 27 10:51:03 BEIST 2017
T ID KEY MODE OWNER GROUP
Shared Memory:
m 1048576 0x780000e8 --rw-rw-rw- root system
m 1048577 0x780000e6 --rw-rw-rw- root system
m 11534338 00000000 --rw-r----- grid oinstall
m 386924547 0xffffffff D-rw------- oracle oinstall
m 4 0x21000052 --rw------- pconsole system
m 2097157 00000000 --rw-r----- grid oinstall
m 6291462 0x10a4d874 --rw-r----- grid oinstall
m 7 0x210000fa --rw-rw---- root system
m 572522504 0x0d011992 --rw-rw---- root system
m 222298121 0x6c00807c --rw------- zabbix staff
m 13631498 0x210000f2 --rw-rw---- oracle oinstall
m 271581195 0xffffffff D-rw------- oracle oinstall
m 962593516 0xd0307dbc --rw-r----- oracle oinstall
m 22020845 0xffffffff D-rw------- oracle oinstall
m 15729390 0xffffffff D-rw------- oracle oinstall
m 955253487 0xffffffff D-rw------- oracle oinstall
m 682623728 0xffffffff D-rw------- oracle oinstall
oracle@lspj1:/home/oracle/$
有些字段 是常用的对于每个IPC :
Type= m (shared memory), s (semaphore) or q (message queues)
ID:
这是标示用于条目类似文件描述符,它是通过操作函数调用来访问资源
KEY:
类似于一个文件,这是函数用于get,open resource
当get这个名字,返回值是ID
如果 key 是0xFFFFFFFF (IPC_PRIVATE),这个entry 只能用于通过相关的 父/子 进程 使用