免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2957 | 回复: 1
打印 上一主题 下一主题

【求助】一个COPY使用的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-11-16 00:25 |只看该作者 |倒序浏览
我有一个8G的文件,里面全是网络蜘蛛抓下来的按照规定格式保存的网页文件,包括了网页的链接以及内容等等,我能够编程把我需要的信息提取出来另外存储到一个文件,按照pgsql的COPY需求,我提取出来之后保存的这个新文件如果以文本方式保存的话,必须要有DELIMITER才好被pgsql的COPY命令处理,现在问题来了,因为我的表设计中有一个字段是用来保留网页内容的,所以我必须提取这一部分出来,问题是网页页面内容可能包含任何的字符,这样以来我的DELIMITER就无法确定了,因为无论我用哪个字符作为DELIMITER,它都有可能在网页页面中出现,从而产生混淆,有什么别的办法吗?谢谢。

论坛徽章:
0
2 [报告]
发表于 2009-11-16 13:55 |只看该作者
既然用分隔符,那自然是由分隔符分隔的多个字段域,这种情况推荐采用编程或脚本过滤!!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP