免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 7044 | 回复: 10
打印 上一主题 下一主题

[Veritas NBU] socket write failed (24) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-10-13 13:18 |只看该作者 |倒序浏览
hi,各位,我有这样一个问题。

我有三台red hat 客户端,三台的网段都一样,客户端和master的网段也一样,都是一个网段的。

我有一个备份策略包含了这三个客户端,但是每次都是client1成功,其他的2个客户端失败,并且报socket write failed (24)。。。 在图形界面的Host Properties--->client列表里,这2台clients现实的也是socket write failed (24),只有client1是connected的状态。。。。

我比较了三台,我感觉配置都是一样的啊。。。。
bp.conf, /etc/services....13782,13720,13724。。。。。。我不知道还可以从哪里查呢?

论坛徽章:
0
2 [报告]
发表于 2011-10-13 13:20 |只看该作者
http://bbs.chinaunix.net/thread-1581256-1-1.html
之前有人发的我也看了,不过应该和权限没关系吧?anyway,我的日志目录本来就是777,三台客户端的都是

论坛徽章:
0
3 [报告]
发表于 2011-10-13 14:11 |只看该作者
我的master是solaris的,客户端是linux,我尝试从master上重新推送下客户端软件。。。也就是重装下。。也失败了,提示我:
client2: Connection refused
Client client2is not responding.
       client2install failed
。。。。

master@root># bpgetconfig -s client2 -L -A  获取配置也失败了
socket write failed

master和client之间通信有问题。。。不知道咋解决 郁闷

论坛徽章:
0
4 [报告]
发表于 2011-10-13 15:02 |只看该作者
图形界面推送失败估计是rsh的原因吧,于是我用ssh重新推送了一下。。都成功了
不过还是socket write failed (24)

论坛徽章:
0
5 [报告]
发表于 2011-10-13 15:15 |只看该作者
2011-10-12 21:17:28 - requesting resource L24-LTO4
2011-10-12 21:17:28 - requesting resource san-oraadmin-1.NBU_CLIENT.MAXJOBS.app-p2.fin.activenetwork.com
2011-10-12 21:17:28 - requesting resource san-oraadmin-1.NBU_POLICY.MAXJOBS.OS_linux
2011-10-13 0:12:19 - Error bpbrm (pid=9983) bpcd on app-p2.fin.activenetwork.com exited with status 24: socket write failed
2011-10-13 0:12:19 - Error bpbrm (pid=9983) cannot send mail because BPCD on app-p2.fin.activenetwork.com exited with status 24: socket write failed
2011-10-13 0:12:19 - granted resource  san-oraadmin-1.NBU_CLIENT.MAXJOBS.app-p2.fin.activenetwork.com
2011-10-13 0:12:19 - granted resource  san-oraadmin-1.NBU_POLICY.MAXJOBS.OS_linux
2011-10-13 0:12:19 - granted resource  000024
2011-10-13 0:12:19 - granted resource  HP.ULTRIUM4-SCSI.000
2011-10-13 0:12:19 - granted resource  L24-LTO4
2011-10-13 0:12:19 - estimated 286771 kbytes needed
2011-10-13 0:12:19 - started process bpbrm (pid=9983)
2011-10-13 0:12:19 - end writing
socket write failed (24)

这个就是详细的报错呢,有点山穷水尽了,哪个大虾指个方向也行哈

论坛徽章:
0
6 [报告]
发表于 2011-10-13 17:27 |只看该作者
host表改了么?
还有个linux的网络服务得打开,以前我也遇到过

论坛徽章:
0
7 [报告]
发表于 2011-10-13 18:17 |只看该作者
嗯 客户端上13724端口telnet都是okay的
客户端上的xinetd安装了已经
客户端上/etc/selinux/config里配置的是DISABLED,因为我看有些帖子提到了这个问题
客户端上的bpcd,vnetd都是出于LISTEN状态;
bp.conf的第一行都是master的信息

host表说的是/etc/hosts么 ?我用的是dns解析的。。。

重启了client的xinetd服务,重启了master的NBU service,问题依旧。。。。。。

anyway thanks!

论坛徽章:
0
8 [报告]
发表于 2011-10-13 18:20 |只看该作者
san-oraadmin-1@root># bptestbpcd -client app-p1.fin.activenetwork.com -verbose -debug
01:05:14.589 [15271] <2> bptestbpcd: VERBOSE = 5
01:05:14.589 [15271] <2> read_client: ?
01:05:14.589 [15271] <2> read_client: opendir() failed: app-p1.fin.activenetwork.com: No such file or directory (2)
01:05:14.589 [15271] <2> ConnectToBPCD: db_getCLIENT(app-p1.fin.activenetwork.com) failed: 227
01:05:14.590 [15271] <2> vauth_get_user_name: vauth_comm.c.687: cached_user_name: root
01:05:14.590 [15271] <2> vauth_get_user_name: vauth_comm.c.689: cached_user_name: :root
01:05:14.590 [15271] <2> vauth_get_user_name: vauth_comm.c.695: user_name: :root
01:05:14.590 [15271] <2> local_bpcr_connect: bpcr.c.276: connect_opts = 0x01000100 connect_opts2 = 0x01000100
01:05:14.590 [15271] <2> local_bpcr_connect: bpcr.c.283: connect_opts = 0x01000100
01:05:14.590 [15271] <2> local_bpcr_connect: bpcr.c.322: daemon_port_type = 0
01:05:14.590 [15271] <2> init_cache: vnet_hosts.c.1045: host_cache_size: 200 0x000000c8
01:05:14.590 [15271] <2> init_cache: vnet_hosts.c.1046: cache_time: 3600 0x00000e10
01:05:14.590 [15271] <2> init_cache: vnet_hosts.c.1060: host_failed_cache_size: 40 0x00000028
01:05:14.590 [15271] <2> init_cache: vnet_hosts.c.1061: cache_time: 3600 0x00000e10
01:05:14.591 [15271] <2> init_cache: vnet_hosts.c.1045: host_cache_size: 200 0x000000c8
01:05:14.591 [15271] <2> init_cache: vnet_hosts.c.1046: cache_time: 3600 0x00000e10
01:05:14.591 [15271] <2> init_cache: vnet_hosts.c.1060: host_failed_cache_size: 40 0x00000028
01:05:14.591 [15271] <2> init_cache: vnet_hosts.c.1061: cache_time: 3600 0x00000e10
01:05:14.591 [15271] <2> vnet_async_connect: vnet_vnetd.c.4033: connect in progress: 0 0x00000000
01:05:14.597 [15271] <2> vnet_vnetd_service_socket: vnet_vnetd.c.2046: VN_REQUEST_SERVICE_SOCKET: 6 0x00000006
01:05:14.598 [15271] <2> vnet_vnetd_service_socket: vnet_vnetd.c.2060: service: bpcd
01:05:14.637 [15271] <2> vnet_async_connect: vnet_vnetd.c.4219: in progress connect: 0 0x00000000
01:05:14.637 [15271] <2> vnet_async_connect: vnet_vnetd.c.4222: connect: async CONNECT FROM 172.16.34.207.35113 TO 172.16.34.203.13724 fd = 4
01:05:14.637 [15271] <2> logconnections: BPCD CONNECT FROM 172.16.34.207.35113 TO 172.16.34.203.13724
01:05:14.638 [15271] <2> vauth_authentication_required: vauth_comm.c.749: no methods for address: no authentication required
01:05:14.638 [15271] <2> vauth_connector: vauth_comm.c.182: no methods for address: no authentication required
01:05:14.638 [15271] <2> bpcr_authenticate_connection: no authentication required
01:05:14.638 [15271] <2> vnet_connect_to_vnetd_extra: vnet_vnetd.c.180: msg: VNETD CONNECT FROM 172.16.34.207.35114 TO 172.16.34.203.13724 fd = 5
01:05:14.648 [15271] <2> vnet_vnetd_connect_forward_socket_begin: vnet_vnetd.c.533: VN_REQUEST_CONNECT_FORWARD_SOCKET: 10 0x0000000a
01:05:14.689 [15271] <2> vnet_vnetd_connect_forward_socket_begin: vnet_vnetd.c.550: ipc_string: /tmp/vnet-01271318492933552891000000000-RDYoPv
01:05:14.689 [15271] <2> vnet_vnetd_connect_forward_socket_begin: vnet_vnetd.c.561: hash_str1: b6a1376f7898ccd37001c5ad7ab6ec40
01:05:14.690 [15271] <2> put_long: (11) network write() error: Broken pipe (32); socket = 4
01:05:14.690 [15271] <2> bpcr_put_vnetd_forward_socket: put_string /tmp/vnet-01271318492933552891000000000-RDYoPv failed: 32
01:05:14.690 [15271] <2> local_bpcr_connect: bpcr_put_vnetd_forward_socket failed: 24
01:05:14.690 [15271] <2> ConnectToBPCD: bpcd_connect_and_verify(app-p1.fin.activenetwork.com, app-p1.fin.activenetwork.com) failed: 24
<16>bptestbpcd main: Function ConnectToBPCD(app-p1.fin.activenetwork.com) failed: 24
01:05:14.690 [15271] <16> bptestbpcd main: Function ConnectToBPCD(app-p1.fin.activenetwork.com) failed: 24
<2>bptestbpcd: socket write failed
01:05:14.690 [15271] <2> bptestbpcd: socket write failed
<2>bptestbpcd: EXIT status = 24
01:05:14.690 [15271] <2> bptestbpcd: EXIT status = 24
socket write failed

我比较了okay的客户端,与有问题的客户端。。。。红色部分有异,这里应该是访问客户端的13724端口才对。。。但我还是没找到solution 。客户端上有应用我不能重启,不然我也会尝试重启客户端。。。

论坛徽章:
0
9 [报告]
发表于 2011-10-14 15:30 |只看该作者
好吧 问题解决了。我以为我用的是DNS解析。。原来不是的。。

我修改了客户端的/etc/hosts。。。I made a stupid mistake

anyway thanks everybody here!

论坛徽章:
0
10 [报告]
发表于 2011-10-14 15:31 |只看该作者
host表改了么?
还有个linux的网络服务得打开,以前我也遇到过
牛奶加蛋 发表于 2011-10-13 17:27



    多谢啊 牛奶加鸡蛋。。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP