免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 13529 | 回复: 15
打印 上一主题 下一主题

fgetc, EOF 及其它 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2003-12-29 23:09 |只看该作者 |倒序浏览
在另一个贴子中,我与一些朋友对 getc 展开了一些讨论. 由于觉得楼主最终未能明白
我的意思,所以我把我个人的看法总结出来,写在这里.我不太擅长说明,但已经尽力了.
任何人转本贴, 请务必把本人的名字写在显眼的位置.  


约定编译器为 gcc2/x86:
所以 char, unsigned char 为 8 位, int 为 32 位

请参考 http://bbs.chinaunix.net/forum/23/20031223/229236.html


(1) 字节的读取

在正常的情况下, getc 以 unsigned char 的方式读取文件流, 扩张为一个整数,并返
回. 换言之, getc 从文件流中取一个字节, 并加上24个零,成为一个小于256的整数,
然后返回.

int c;
while ((c = fgetc (rfp))!= -1) // -1就是 EOF
fputc (c, wfp);

上面 fputc 中的 c 虽然是整数, 但在 fputc 将其写入文件流之前, 又把整数的高24位
去掉了, 因此 fgetc, putc 配合能够实现文件复制. 到目前为止, 把 c 定义为
char仍然是可行的, 但下面我们将看到,把 c 定义为 int 是为正确判段文件是否结束.

(2) 判断文件结束.

多数人认为文件中有一个EOF,用于表示文件的结尾. 但这个观点实际上是错误的,在文
件所包含的数据中,并没有什么文件结束符. 对getc 而言, 如果不能从文件中读取,
则返回一个整数 -1,这就是所谓的EOF. 返回 EOF 无非是出现了两种情况,一是文件已
经读完; 二是文件读取出错,反正是读不下去了.

请注意: 在正常读取的情况下, 返回的整数均小于256, 即0x0~0xFF. 而读不出返回的
是 0xFFFFFFFF. 但, 假如你用fputc把 0xFFFFFFFF 往文件里头写, 高24位被屏蔽,写入的将
是 0xFF. // lixforalpha 请注意这一点

(3) 0xFF 会使我们混淆吗?

不会, 前提是, 接收返回值的 c 要按原型定义为 int.

如果下一个读取的字符将为 0xFF, 则

int c;
c = fgetc (rfp); // c = 0x000000FF;
if (c != -1)    // 当然不等, -1 是 0xFFFFFFFF
fputc (wfp);   // 噢, OXFF 复制成功.

字符0xFF, 其本身并不是EOF.

(4) 将 c 定义 char

假定下一个读取的字符为 0xFF 则

char c;
c = fgetc (rfp); // fgetc(rfp)的值为 0x000000FF, 暗中降为字节, c = 0xFF
if (c != -1)    // 字符与整数比较? c 被带符号(signed)扩展为0xFFFFFFFF, 喔噢,
条件成立,文件复制提前退出.

while ((c=fgetc(rfp))!=EOF) 中的判别条件成立, 文件复制结束! 意外中止.

(5) 将 c 定义为 unsigned char;

当读到文件末尾, 返回 EOF 也就是 -1 时,

unsigned char c;
c = fgetc (rfp); // fgetc (rfp)的值为EOF,即-1,即0xFFFFFFFF, 降格为字节, c=0xFF
if ( c!= -1)  // c 被扩展为 0x000000FF, 永远不回等于 0xFFFFFFFF

所以这次虽然能正确复制 0xFF, 但却不能判断文件结束. 事实上,在 c 为 uchar 时,
c != -1 是永远成立的, 一个高质量的编译器, 比如 gcc会在编译时指出这一点.

(6) 为何需要feof?
FILE *fp;
fp 指向一个很复杂的数据结构, feof 是通过这个结构中的标志来判断文件是否结束的.
如果文件用 fgetc 读取, 刚好把最后一个字符读出时, fp 中的EOF标志不会打开,这时
用feof判断,将会得到文件尚未结束的结论.

fgetc 返回 -1 时, 我们仍无法确信文件已经结束, 因为可能是读取错误! 这时我们
需要 feof 和 ferror.

论坛徽章:
0
2 [报告]
发表于 2003-12-29 23:40 |只看该作者

fgetc, EOF 及其它

多谢,吐血奉献
太好了,终于明白了些!
偶低层的功力实在太差了!
话说回来,有些书讲得实在很马虎

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
3 [报告]
发表于 2003-12-30 08:48 |只看该作者

fgetc, EOF 及其它

win_hate啊,早上来了就看见你在这里法帖子,写的很详细,原创精华,你没意见吧!

呵呵

论坛徽章:
0
4 [报告]
发表于 2003-12-30 09:07 |只看该作者

fgetc, EOF 及其它

原帖由 "蓝色键盘" 发表:
win_hate啊,早上来了就看见你在这里法帖子,写的很详细,原创精华,你没意见吧!

呵呵


谢谢老大!

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
5 [报告]
发表于 2003-12-30 09:08 |只看该作者

fgetc, EOF 及其它

兄弟们因该学习win_hate同志追根到底的精神,论坛有几个这样的人,一定能够带动大家的积极性

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
6 [报告]
发表于 2003-12-30 09:15 |只看该作者

fgetc, EOF 及其它

嘿嘿,偶也顶一下!
以后要多发文章哦!

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
7 [报告]
发表于 2003-12-30 09:25 |只看该作者

fgetc, EOF 及其它

lenovo在这里的贡献和精神大家有目共睹,以后准备让你当接班人呢!

加油吧!

相互提高。。。。

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
8 [报告]
发表于 2003-12-30 09:38 |只看该作者

fgetc, EOF 及其它

原帖由 "蓝色键盘" 发表:
lenovo在这里的贡献和精神大家有目共睹,以后准备让你当接班人呢!

加油吧!

相互提高。。。。

谢谢鼓励!
惭愧呀,老大!

论坛徽章:
0
9 [报告]
发表于 2003-12-30 10:18 |只看该作者

fgetc, EOF 及其它

总结的不错,提个建议:尽量不要用-1代替EOF。EOF是与系统有关的,某些系统的EOF不是-1。

论坛徽章:
0
10 [报告]
发表于 2003-12-30 15:45 |只看该作者

fgetc, EOF 及其它

谨以此献不辞劳苦给予详细解释的win_hate、flw、dadaball、aero、蓝色键盘等众多网友

            完美解答
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP