- 论坛徽章:
- 0
|
所谓回车、换行这些控制符,都是从以前的电传打字机的控制命令继承下来的。回车就是打印头复位,换行就是走纸。Dos/Windows和Unix/Linux对回车、换行的理解差别就在于Dos/Windows认为0d=0d0a=0a,而Unix/Linux坚持沿用电传打字机的工作方式(这个其实是比较正确的)。
所以在回车换行在Linux中是"0d",在Windows中是"0d0a".我们可以通过下面的程序测试一下:
#define MAX_LENGTH 15536
#include
#include
using namespace std;
string delEnter(const string src) // 过滤掉串中的回车换行符
{
string des;
for(int i = 0; i
int main()
{
char html[MAX_LENGTH] = "";
FILE *fp = fopen("Linux.txt", "rb"); //FILE *fp = fopen("Windows.txt", "rb");
char buf[16384];
while (fgets(buf, 16384, fp))
strcat(html, buf);
strcat(html,"\0");
string s(html);
cout
fclose(fp);
return 0;
}
程序中文件Linux.txt是从Linux系统中copy过来的。
我们可以通过这个程序观察到,通过过滤掉回车换行符,Linux文件中的字符数的减少等于其行数,而
Windows中等于其行数的两倍。但有一个问题要注意,程序中行:
FILE *fp = fopen("Linux.txt", "rb");
不能写成:
FILE *fp = fopen("Linux.txt", "r");
后者默认的文件打开方式是文本方式,这时系统自动对文本进行了转换,就不能得到上述的结论。
不过大家可以在Windows下用工具HexWorkShop,在Linux下用命令hexdump直接观察具体的二进制代码,更为直接。
From:
http://noding.bokee.com/3867119.html
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/13855/showart_426483.html |
|