回复 10楼 dbcat 的帖子

谢谢朋友们！！

我再把问题详细说一下：
注释行是为了标记开始和结束的，所以只有头尾两行，文件一共有一亿行左右，不是定值。
现在问题的焦点是空间问题。希望在不要增加空间使用的情况下，用简洁的方式处理掉头
尾行。假如使用grep awk sed，都需要双倍的空间才能完成操作。

ps：文件是给informatic 读取，进行加载的，如果有办法让informatic忽略注释行也可以。

谢谢了！！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

r2007

广告杀手

论坛徽章:: 7

12楼 [报告]

发表于 2006-02-20 08:31 |只看该作者

试一下：创建一个命名管道，用grep,sed or awk处理源文件作为输入。然后用informatic加载这个命名管道。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yalp

白手起家

论坛徽章:: 0

13楼 [报告]

发表于 2006-02-20 08:58 |只看该作者

原帖由 r2007 于 2006-2-20 08:31 发表
试一下：创建一个命名管道，用grep,sed or awk处理源文件作为输入。然后用informatic加载这个命名管道。

能否举个例子,学习一下。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

r2007

广告杀手

论坛徽章:: 7

14楼 [报告]

发表于 2006-02-20 09:30 |只看该作者

mkfifo pipe #or mknod pipe p
sed '/^#/d' bigfile >pipe &
informatic pipe #没用过这个程序，参数自行补充

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

woodie

小富即安

论坛徽章:: 1

15楼 [报告]

发表于 2006-02-20 17:36 |只看该作者

informatic我也没用过。如果它和其它unix程序表现一样，能够从管道接受输入文件，那就很简单了：
sed '/^#/!p' HugeFile | informatic other arguments
如果不能，但是能在命令行接受文件名作为参数，并且你的平台有bash可用，你可以用bash的进程替换：
informatic <(sed '/^#/!p' HugeFile) other arguments
如果informatic是一个图形程序，而且不能在命令行接受文件名作为参数，又或者你没有bash，那么用r2007的方法吧。