Chinaunix

标题: oscar [打印本页]

作者: overdose    时间: 2008-02-26 17:01
标题: oscar
我的Oscar 从网络安装完计算节点后重起,计算节点从硬盘启动时报错


环境:头节点 redhatAS4+Oscar5.0
       计算节点 vmware5.0

不知是何故
请大仙救我
作者: jerrywjl    时间: 2008-02-26 17:10
首先我想知道oscar是什么?

第二从系统启动过程看,是系统在装载ramdisk出错,可能你的ramdisk镜像被修改。建议你到rescue模式下重建initrd镜像文件。

# mkinitrd –f /boot/initrd-<kernel version>.img <kernel-version>

然后重启一下试试。
作者: overdose    时间: 2008-02-26 17:23
Oscar的官网oscar.openclustergroup.org


我用了你给我的命令但是它返回/lib/modules/<kernel-version> is not a directory
作者: jerrywjl    时间: 2008-02-26 17:29
无语了,
# mkinitrd –f /boot/initrd-<kernel version>.img <kernel-version>

你的kernel-version是什么,比如说2.6.9-22.ELsmp等等,这个你用uname -r去看,你直接抄我的<kernel-version>,当然说找不到目录啦!

再一个你用的是什么系统?是redhat吗?如果是其他的linux,我还不确定呢!
作者: overdose    时间: 2008-02-26 17:35
系统是redhat AS4

返回错误
/lib/modules/2.6.9-5.ELsmp is not a directory
作者: overdose    时间: 2008-02-26 17:42
由于我是在rescue 方式下操作的所以他把kernel输出到光盘上就报错
你知道怎么定向到指定目录吗?
作者: overdose    时间: 2008-02-26 17:43
说错了是initrd 不是kernel
作者: jerrywjl    时间: 2008-02-26 17:43
唉!你强制把kernel重装一次吧!

rpm -ihv kernel-smp-2.6.9-5.EL.i686.rpm --force

如果这个包我记得没错的话。

重装kernel的过程中会自动重建initrd。对了,备份你的重要数据出来。
作者: overdose    时间: 2008-02-26 17:54
今天是搞不完了 明天继续

谢谢 大哥了
作者: nntp    时间: 2008-02-26 18:40
initrd 里面是否不支持你现在的硬盘或者硬盘控制器.

我要是你,就换调整个Oscar, 推荐Platform或者Rocks.

[ 本帖最后由 nntp 于 2008-2-26 18:43 编辑 ]
作者: jerrywjl    时间: 2008-02-26 22:02
原帖由 nntp 于 2008-2-26 18:40 发表
initrd 里面是否不支持你现在的硬盘或者硬盘控制器.

我要是你,就换调整个Oscar, 推荐Platform或者Rocks.



我就是想看看问题是否就在这里。
作者: nntp    时间: 2008-02-26 23:57
原帖由 jerrywjl 于 2008-2-26 22:02 发表



我就是想看看问题是否就在这里。


那简单,rescue 进去,拿到现在的initrd.copy出来,展开检查module.
作者: jerrywjl    时间: 2008-02-27 00:42
原帖由 nntp 于 2008-2-26 23:57 发表


那简单,rescue 进去,拿到现在的initrd.copy出来,展开检查module.



So 麻烦的,他进入rescue模式直接mkinitrd一次,启动看看是否有不同情形不就行了!
作者: nntp    时间: 2008-02-27 04:13
原帖由 jerrywjl 于 2008-2-27 00:42 发表



So 麻烦的,他进入rescue模式直接mkinitrd一次,启动看看是否有不同情形不就行了!


这样单机固然可以,呵呵.. 但是顶楼是Oscar集群..
作者: overdose    时间: 2008-03-03 14:46
nntp 我找不到platform OCS 的下载地址

您能否提供一个

谢谢
作者: overdose    时间: 2008-03-03 18:06
i got it
作者: overdose    时间: 2008-03-04 09:45
SOS my.platform.com 他不给断点续传哦 我下了一半就断了 欲哭无泪啊
作者: kartwall    时间: 2008-03-11 21:52
先熟悉Linux的安装和配置,再去碰Platform, Rocks这些东西。

看起来像是SATA硬盘,LZ是SATA硬盘么?如果是SATA控制器的驱动没有导致找不到硬盘的话,网络安装系统的时候硬盘是怎么被找到的?除非你自己修改过initrd.img,将驱动打了进去,但是却没有将驱动打入kernel那个rpm包。

当然,我不熟悉OSCAR,我不知道OSCAR有多神通广大,我只是从linux的单机安装和网络安装出发来考虑问题。
作者: nntp    时间: 2008-03-12 17:53
原帖由 kartwall 于 2008-3-11 21:52 发表
先熟悉Linux的安装和配置,再去碰Platform, Rocks这些东西。

看起来像是SATA硬盘,LZ是SATA硬盘么?如果是SATA控制器的驱动没有导致找不到硬盘的话,网络安装系统的时候硬盘是怎么被找到的?除非你自己修改过 ...



我整理了一下思路,还是那个说法. 任何给出的建议,一定有讨论的范畴.

比如如果在小节点数,非重要的研究性集群项目中,你怎么搞都可以,比如比如学生可以通过自己搭建hpc cluster来熟悉每个部分的构成和运作.

如果是在大节点数(比如64node, 128 node)或者是在重要的工程项目中,哪里还容你有时间自己搞,先把任务完成先。

我之前另外一个帖子已经说了,我们其实在一个讨论方向的不同方面在互相补充,就是貌似"热烈"了点.

我书读的不好,没有接触太多的小节点或研究性质的hpc 项目,大部分都是一根鞭子追在后面的上规模的工程项目,所以效率和可靠性,对我来说是第一位的。对于初学者来说,我的建议可能不太针对于学习,但是对于目的是要搭建一个集群然后在上面展开计算任务和研究的人来说,选择成熟的ROCKS/OCS是比较理想的方向. 另外我并不认为ROCKS的这种包装有多么了不起,在我眼里面,即便是用ROCKS/Rolls,也不会掩盖原有的那些组件的技术特点,也不会给学习制造障碍。我认为你把ROCKS打包的做法给学习带来的危害性夸大了。

[ 本帖最后由 nntp 于 2008-3-12 17:57 编辑 ]




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2