免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 14089 | 回复: 3
打印 上一主题 下一主题

[应用] 【详解】回车 换行 0x0D 0x0A CR LF \r \n的来龙去脉 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-09-01 14:35 |只看该作者 |倒序浏览
本帖最后由 crifan 于 2012-07-06 15:38 编辑

【详解】回车 换行 0x0D 0x0A CR LF \r \n的来龙去脉

日期:2011-09-01

联系方式:green-waste (at) 163.com





最新内容已更新至: 【详解】回车 换行 0x0D 0x0A CR LF \r \n的来龙去脉




【回车和换行的历史】

在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行,需要回车换行,此过程,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。

于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界;另一个叫做“换行”,告诉打字机把纸向下移一行。


【关于回车和换行的更详细的解释】

首先,打字机打完一行,意味着,从左到右把一行的字打完了,此时打印机的打印头处于最右边,所以,想要继续打字,需要(1)将把打印头移动到最左边,然后(2)打字所用的纸张,换到下一行。

而(1)打印头移动到最左边的动作,称之为回车;

2)打字所用的纸张换到下一行,称之为换行。其是通过打字机的滚筒滚动,将纸向前滚动,就相当于打印头换了一行,处在新一行的最左边的开始的位置了,即所谓的走纸。


这就是“回车” 和“换行”的来历,从它们的英语名字上也可以看出一二。


对应到计算机系统中:

回车:将当前光标移动到同一行中的最左边(假设是从左到右的输入方式)

换行:保持当前光标的水平位置位置不变,换到下一行。


因此,将回车和换行联合起来,才是我们所常理解的含义:

输入完一行后,回车换行到下一行,即光标不仅仅是回到了最左边,而且也换到了下一行。


【不同系统中表示回车换行含义所用字符不同】

后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。

不同的系统里面,对于同样一个回车换行的含义,所用的字符不同:

Table 1 不同系统中回车换行对应的字符

系统类型

回车换行所用字符

Linux/Unix

\n=newline=0x0A=10=LF(Line Feed)=换行=Ctrl + J

Windows/Dos

\r \n=0x0D 0x0A=CR LF=回车 换行

Mac

\r==return=0x0D=13=CR(Carriage Return)=回车=Ctrl + M



提示:

1. 对应的,在Linux中通过键盘输入Enter回车键,输入的是\n=0x0A, Windows中的Enter键则是输入的是0x0D 0x0A

2.其中关于0x0A对应的着Ctrl + J0x0D对应着Ctrl + M等等相关的ASCII的控制字符及输入方式,可参见:

ASCII字符集中的功能/控制字符

http://againinput4.blog.163.com/blog/static/1727994912011115104235992/


【由于回车换行在不同系统中所用不同字符所导致的问题及解决办法】

1. Linux中打开Windows中的文件

由于Linux\n=0x0A=10=LF来表示换行,所以,打开Windows中的文件的时候,如果其中有换行,即其中有\r \n= 0x0D 0x0A,此时,就会被处理为,只将\n理解为换行,而把\r看作为一个单独的字符,此\r字符,对应ASCII的值是0x0D=13,是个控制字符,对应的是用Ctrl+M=一个Ctrl加上一个大写的M字符,在Linux中的文本编辑器中,如Vi中,对应显示为一个“^M“。


解决办法:

1Linux下,用命令:

tr -d "\015" < myfile.txt > myfile_new.txt

将其中^M去除掉。其中\015中的015是八进制的15=十进制的13=十六进制的0x0D

2)或者用dos2unix工具处理:

dos2unix file_name


详情参见:

【整理】如何取消Linux下,vi中显示的^M符号

http://hi.baidu.com/serial_story/blog/item/8b1e211704f2420d4b90a704.html


2. Mac中打开Windows中的文件

同理,Mac中打开Windows中的文件,如果有回车换行的话,只会识别其中的\r=0x0D,而将余下的\n=0xA=LF看成一个单独的字符,显示出“^J”。


3. Windows中打开MacLinux中的文件

经过测试,发现,在windows中,估计把原先的0x0D 0x0A去掉其中任何一个的话,然后用windows下的文本类编辑器再去打开,发现:

除了最简单的Windows自带的Notepad,无法正常识别回车换行,内容被显示到同一行中之外;其他一些编辑器,如Notepad2Notepad++Windows自带的记事本WordPad,都可以正常识别成回车换行,不会将内容都输出在同一行。


【引用】

1.
回车与换行的故事

http://huangyunbin.iteye.com/blog/1112171


2. Carriage return

http://en.wikipedia.org/wiki/Carriage_return


3. 回车和换行的区别

http://bbs.chinaunix.net/thread-393307-1-1.html


4. 回车和换行有什么区别?我们平时按下的Enter键是回车还是换行?[原创

http://www.**/blog/Detail_RD.Blog_imjacob_12317.html


5. 【整理】回车(\r, return, CR, Carriage Return)和换行(\n, newline, LF, Line Feed)有什么区别

http://againinput4.blog.163.com/blog/static/17279949120101017104227360/

论坛徽章:
0
2 [报告]
发表于 2012-02-07 17:15 |只看该作者
受教了

论坛徽章:
0
3 [报告]
发表于 2012-05-20 21:11 |只看该作者
mark,谢谢。

论坛徽章:
0
4 [报告]
发表于 2012-05-22 20:41 |只看该作者
曾经在脚本中出现 ^M 字符,整的郁闷过,早看到lz的文章就节省不少时间了...
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP