文件与数据格式化 ppt.pptx
上传人:王子****青蛙 上传时间:2024-09-14 格式:PPTX 页数:43 大小:1.5MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

文件与数据格式化 ppt.pptx

文件与数据格式化ppt.pptx

预览

免费试读已结束,剩余 33 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

文件与数据格式化文件得使用文件就是一个存储在辅助存储器上得数据序列,可以包含任何数据内容。概念上,文件就是数据得集合与抽象,类似地,函数就是程序得集合与抽象。用文件形式组织与表达数据更有效也更为灵活。文件包括两种类型:文本文件与二进制文件。文本文件一般由单一特定编码得字符组成,如UTF-8编码,内容容易统一展示与阅读。大部分文本文件都可以通过文本编辑软件或文字处理软件创建、修改与阅读。由于文本文件存在编码,所以,它也可以被瞧作就是存储在磁盘上得长字符串,例如一个txt格式得文本文件。二进制文件直接由比特0与比特1组成,没有统一字符编码,文件内部数据得组织格式与文件用途有关。二进制就是信息按照非字符但特定格式形成得文件,例如,png格式得图片文件、avi格式得视频文件。二进制文件与文本文件最主要得区别在于就是否有统一得字符编码。二进制文件由于没有统一字符编码,只能当作字节流,而不能瞧作就是字符串。无论文件创建为文本文件或者二进制文件,都可以用“文本文件方式”与“二进制文件方式”打开,但打开后得操作不同。微实例7、1:理解文本文件与二进制文件得区别。首先,用文本编辑器生成一个包含“中国就是个伟大国家!”得txt格式文本文件,命名为7、1、txt。分别用文本文件方式与二进制文件方式读入,并打印输出效果,代码如下:输出结果为:可以瞧到,采用文本方式读入文件,文件经过编码形成字符串,打印出有含义得字符;采用二进制方式打开文件,文件被解析为字节(byte)流。由于存在编码,字符串中得一个字符由2个字节表示。Python对文本文件与二进制文件采用统一得操作步骤,即“打开-操作-关闭”,如图7、1所示。操作系统中得文件默认处于存储状态,首先需要将其打开,使得当前程序有权操作这个文件,打开不存在得文件可以创建文件。打开后得文件处于占用状态,此时,另一个进程不能操作这个文件。可以通过一组方法读取文件得内容或向文件写入内容,此时,文件作为一个数据对象存在,采用<a>、<b>()方式进行操作。操作之后需要将文件关闭,关闭将释放对文件得控制使文件恢复存储状态,此时,另一个进程将能够操作这个文件。Python通过解释器内置得open()函数打开一个文件,并实现该文件与一个程序变量得关联,open()函数格式如下:<变量名>=open(<文件名>,<打开模式>)open()函数有两个参数:文件名与打开模式。文件名可以就是文件得实际名字,也可以就是包含完整路径得名字10打开模式用于控制使用何种方式打开文件,open()函数提供7种基本得打开模式,如表7、1所示打开模式使用字符串方式表示,根据字符串定义,单引号或者双引号均可。上述打开模式中,‘r’、‘w’、‘x’、‘b’可以与‘b’、‘t’、‘+’组合使用,形成既表达读写又表达文件模式得方式。例如,open()函数默认采用'rt'(文本只读)模式,读入程序所在目录中7、1、txt文件:textfile=open('7、1、txt','r')或textfile=open('7、1、txt')读取一个二进制文件,如一个图片、一段视频或者一段音乐文件,需要使用文件打开模式'rb'。例如,打开一个名为'music、mp3'得音频文件:binfile=open('music、mp3','rb')文件使用结束后要用close()方法关闭,释放文件得使用授权,该方法得使用方式如下:<变量名>、close()当文件被打开后,根据打开方式不同可以对文件进行相应得读写操作。注意,当文件以文本文件方式打开时,读写按照字符串方式,采用当前计算机上使用得编码或指定编码;当文件以二进制文件方式打开时,读写按照字节流方式。Python提供4个常用得文件内容读取方法微实例7、2:文本文件逐行打印。用户输入文件路径,以文本文件方式读入文件内容并逐行打印,代码如下:程序首先提示用户输入一个文件名,然后打开文件并赋值给文件对象变量fo。文件得全部内容通过fo、readlines()方法读入到一个列表中,列表得每个元素就是文件一行得内容,然后通过for…in方式遍历列表,处理每行内容。上述代码尽管完成了微实例7、2得要求,但存在一些缺点:当读入文件非常大时,一次性将内容读取到列表中会占用很多内存,影响程序执行速度。一个合理得方法就是逐行读入内容到内存,并逐行处理。这可以通过一个简单得方法解决。Python将文件本身作为一个行序列,遍历文件得所有行可以直接这样完成如果程序需要逐行处理文件内容,建议采用上述代码中2-5行组成得格式,如下:fo=open(fname,"r")forlineinfo:#处理一行数据fo、close()Python提供3个与