免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2515 | 回复: 6
打印 上一主题 下一主题

求教最近流行的竖排文字怎么提取真实内容? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-07-02 10:09 |只看该作者 |倒序浏览
最近流行这个
┌─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
│享┆界┆族┆难┆版┆国┆律┆一┆言┆中┆自┆野┆反┆删┆事┆代┆,┆违│
│受┆第┆,┆道┆自┆家┆。┆部┆论┆国┆由┆蛮┆国┆除┆实┆庖┆网┆法│
│到┆一┆以┆中┆由┆中┆在┆保┆自┆至┆,┆的┆家┆的┆证┆法┆络┆只│
│基┆种┆1┆国┆排┆,┆世┆护┆由┆今┆才┆办┆法┆言┆明┆官┆警┆有│
│本┆族┆3┆人┆名┆中┆界┆新┆的┆没┆是┆法┆律┆论┆,┆的┆察┆法│
│的┆,┆亿┆是┆第┆国┆上┆闻┆法┆有┆违┆限┆的┆,┆那┆审┆有┆院│
│言┆居┆人┆低┆1┆的┆1┆自┆律┆一┆反┆制┆。┆并┆些┆判┆什┆有│
│论┆然┆口┆贱┆6┆言┆6┆由┆。┆部┆宪┆他┆他┆不┆被┆?┆么┆权│
│自┆不┆的┆的┆3┆论┆8┆的┆没┆保┆法┆人┆们┆是┆他┆很┆资┆宣│
│由┆配┆世┆种┆。┆出┆个┆法┆有┆护┆。┆的┆用┆违┆们┆多┆格┆判│
└─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘
这样竖排的文字对模式匹配很有挑战性啊!
由于无法判断里面的内容有没有非法的关键词,容易造成网监封杀
请各位高手帮忙研究下:
1 怎么样可以获得里面的内容呢?
2 怎么样可以替换里面的内容并仍保持以竖排格式输出?

[ 本帖最后由 白水 于 2008-7-2 10:14 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2008-07-02 10:47 |只看该作者
我能想到的办法:split提取字符形成横排的文本再去判断.

论坛徽章:
0
3 [报告]
发表于 2008-07-02 11:01 |只看该作者
看来也只能用万能的split了,哈哈

论坛徽章:
0
4 [报告]
发表于 2008-07-02 12:03 |只看该作者

已经解决了

其实也没什么技术含量,切分后倒一下矩阵就行了,主要是要细心点,行列关系别搞错,试了几次终于搞定,哈哈哈!

论坛徽章:
1
IT运维版块每日发帖之星
日期:2016-03-09 06:20:00
5 [报告]
发表于 2008-08-05 10:09 |只看该作者
原来有人研究这个啊,我这几天也做了一个,竖横文互转的。

http://shupai.perltest.cn

论坛徽章:
0
6 [报告]
发表于 2008-08-05 10:23 |只看该作者
当成行列式处理~~~~

论坛徽章:
0
7 [报告]
发表于 2008-08-05 23:49 |只看该作者
如果是特定的竖排文,处理我觉得不麻烦
但在www上面,首先你要区分哪些是竖排文,哪些是横排文
竖排文也可以有很多种表现形式。

因此这才是麻烦事
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP