Java 学习笔记(14)—— 文件操作

java文件操作主要封装在Java.io.File中,而文件读写一般采用的是流的方式,Java流封装在 java.io 包中。Java中流可以理解为一个有序的字符序列,从一端导向到另一端。建立了一个流就好似在两个容器中建立了一个通道,数据就可以从一个容器流到另一个容器

文件操作

Java文件操作使用 java.io.File 类进行。该类中常见方法和属性有:

  • static String pathSeparator: 多个路径间的分隔符,这个分隔符常用于系统的path环境变量中。Linux中采用 : Windows中采用 ;
  • static String separator: 系统路径中各级目录的分隔符,比如Windows路劲 c:\windows\ 采用的分隔符为 \, 而Linux中 /root 路径下的 分隔符为 /

    为了达到跨平台的效果,在写路径时一般不会写死,而是使用上述几个静态变量来进行字符串的拼接

构造方法有:

  • File(String pathname); 传入一个路径的字符串
  • File(String parent, String child); 传入父目录和子目录的路径,系统会自动进行路径拼接为一个完整的路径
  • File(File parent, String child); 传入父目录的File对象和子目录的路径,生成一个新的File对象

常见方法:

  • 以can开头的几个方法,用于判断文件的相关权限,比如可读、可写、可执行
  • String getAbsolutePath() 获取文件绝对路径的字符串
  • String getPath() 获取文件的路径,这个方法会根据构造时传入的路径来决定返回绝对路径或者相对路径
  • String getName() 获取文件或者路径的名称
  • long length() 返回文件的大小,以字节为单位,目录会返回0;
  • boolean exists(); 判断文件或者目录是否存在
  • boolean isDirectory(); 判断对应的File对象是否为目录
  • boolean isFile(); 判断对应的File对象是否为文件
  • boolean delete(); 删除对应的文件或者目录
  • boolean mkdir(); 创建目录
  • boolean mkdirs(); 递归创建目录
  • String[] list(); 遍历目录,将目录中所有文件路径字符串放入到数组中
  • File[] listFiles(); 遍历目录,将目录中所有文件和目录对应的File对象保存到数组中返回

下面是一个遍历目录中文件的例子

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
public static void ResverFile(String path){
File f = new File(path);
ResverFile_Core(f);
}

public static void ResverFile_Core(File f){
//System.out.println("开始遍历目录:" + f.getAbsolutePath());
File[] subFile = f.listFiles();

for(File sub : subFile){
if(sub.isDirectory()){
if(".".equals(sub.getName()) || "..".equals(sub.getName())){
continue;
}

ResverFile_Core(sub);
}else{
System.out.println(sub.getAbsolutePath());
}
}
}

上述代码根据传入的路径,递归遍历路径下所有文件。

从 JDK文档中可以看到 list 和listFiles方法都可以传入一个FileFilter 或者FilenameFilter 的过滤器, 查看一下这两个过滤器:

1
2
3
4
5
6
7
public interface FilenameFilter{
boolean accept(File dir, String name);
}

public interface FileFilter{
boolean accept(File pathname);
}

上述接口都是用来进行过滤的,FilenameFilter 会传入一个目录的File对象和对应文件的名称,我们在实现时可以根据这两个值来判断文件是否是需要遍历的,如果返回true则结果会包含在返回的数组中,false则会舍去结果

将上述的代码做一些改变,该成遍历所有.java 的文件

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
public static void ResverFile(String path){
File f = new File(path);
ResverFile_Core(f);
}

public static void ResverFile_Core(File f){
//System.out.println("开始遍历目录:" + f.getAbsolutePath());
File[] subFile = f.listFiles(pathname->pathname.isDirectory() || pathname.getName().toLowerCase().endsWith(".java"));

for(File sub : subFile){
if(sub.isDirectory()){
if(".".equals(sub.getName()) || "..".equals(sub.getName())){
continue;
}

ResverFile_Core(sub);
}else{
System.out.println(sub.getAbsolutePath());
}
}
}

IO 流

Java将所有IO操作都封装在了 java.io 包中,java中流分为字符流(Reader、Writer)和字节流(InputStream、OutputStream), 它们的结构如下:
IO

字节流读写文件

在读写任意文件时都可以使用字节流进行,文件字节流是 FileInputStream和FileOutputStream

1
2
3
4
5
6
7
8
9
10
//可以使用路径作为构造方式
//FileInputStream fi = new FileInputStream("c:/test.dat");
//可以使用File对象进行构造
FileInputStream fi = new FileInputStream(new File("c:/test.dat"));
int i = fi.read();
byte[] buffer = new byte[1024];
while(fi.read(buffer) > 0 ){
//do something
}
fi.close();

下面是一个copy文件的例子

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
public static void CopyFile() throws IOException{
FileInputStream fis = new FileInputStream("e:\\党的先进性学习.avi");
FileOutputStream fos = new FileOutputStream("党的先进性副本学习.avi");

int len = 0;
byte[] buff = new byte[1024];
long start = System.currentTimeMillis();
while((len = fis.read(buff)) > 0){
fos.write(buff, 0, len);
}
long end = System.currentTimeMillis();

System.out.println("耗时:" + (end - start));
fos.close();
fis.close();
}

字符流读写文件

一般在读写文本文件时,为了读取到字符串,使用的是文件的字符流进行读写。文件字节流是FileReader和FileWriter

1
2
3
4
5
6
FileReader fr = new FileReader(new File("c:/test.dat"));
char[] buffer = new char[]
while(fr.read(buffer) > 0 ){
//do something
}
fr.close();

下面是一个拷贝文本文件的例子

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
public static void CopyFile() throws IOException{
FileReader fr = new FileInputStream("e:\\党的先进性学习.txt");
FileWriter fw = new FileOutputStream("党的先进性副本学习.txt");

int len = 0;
char[] buff = new char[1024];
long start = System.currentTimeMillis();
while((len = fr.read(buff)) > 0){
fw.write(buff, 0, len);
}
long end = System.currentTimeMillis();

System.out.println("耗时:" + (end - start));
fr.close();
fw.close();
}

读写IO流的其他操作

IO流不仅能够读写磁盘文件,在Linux的哲学中,一切皆文件。根据这点IO流是可以读写任意设备的。比如控制台;

之前在读取控制台输入的时候使用的是Scanner,这里也可以使用InputStream或者InputStreamReader。Java中定义了用于控制台输入输出的InputStream 和 OutputStream 对象: System.in 和 System.out

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
//多次读取单个字符
char c;
InputStreamReader isr = new InputStreamReader(System.in);
System.out.println("输入字符, 按下 'q' 键退出。");
// 读取字符
do {
c = (char) isr.read();
System.out.println(c);
} while (c != 'q');

isr.close();

//读取字符串
// 使用 System.in 创建 BufferedReader
BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
String str;
System.out.println("Enter lines of text.");
System.out.println("Enter 'end' to quit.");
do {
str = br.readLine();
System.out.println(str);
} while (!str.equals("end"));
br.close();

控制台的写入与读取类似

1
2
3
4
5
OutputStreamWriter ow = new OutputStreamWriter(System.out);
char[] buffer = new char{'a', 'b', 'c'};
ow.write(buffer);
ow.flush();
ow.close();

由于write函数的功能有限,所以在打印时经常使用的是 System.out.println 函数。

缓冲流

在操作系统中提到内存的速度是超过磁盘的,在使用流进行读写操作时,CPU向磁盘下达了读写命令后会长时间等待,影响程序效率。而缓冲流在调用write和read方法时并没有真正的进行IO操作。而是将数据缓存在一个缓冲中,当缓冲满后或者显式调用flush 后一次性进行读写操作,从而减少了IO操作的次数,提高了效率。

常用的缓冲流有下面几个

  • BufferedInputStream
  • BufferedOutputStream
  • BufferReader
  • BufferWriter

分别对应字节流和字符流的缓冲流。它们需要传入对应的Stream 或者Reader对象。

下面是一个使用缓冲流进行文件拷贝的例子,与上面不使用缓冲流的拷贝进行对比,当文件越大,效率提升越明显

1
2
3
4
5
6
7
8
9
10
11
12
13
14
BufferedInputStream bis = new BufferedInputStream(new FileInputStream("E:\\test.avi"));
BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("test.avi"));

int len = 0;
byte[] buff = new byte[1024];
long start = System.currentTimeMillis();
while((len = bis.read(buff)) > 0){
bos.write(buff, 0, len);
}
long end = System.currentTimeMillis();

System.out.println("耗时:" + (end - start));
bos.close();
bis.close();

文件编码转换

在读取文件时经常出现乱码的情况,乱码出现的原因是文件编码与读取时的解码方式不一样,特别是出现中文的情况。

上面说过Java 中主要有字符流和字节流。从底层上来说,在读取文件时都是二进制的数据。然后将二进制数据转化为字符串。也就是先有InputStream/OutputStream 读出二进制数据,然后根据默认的编码规则将二进制数据转化为字符也就是 Reader/Writer。如果读取时的编码方式与文件的编码方式不同,则会出现乱码。

我们在程序中使用 InputStreamReader和 OutputStreamWriter 来设置输入输出流的编码方式。

1
2
3
4
5
//以UTF-8方式写文件
FileOutputStream fos = new FileOutputStream("test.txt");
OutputStreamWriter osw = new OutputStreamWriter(fos, "UTF-8");
osw.write(FileContent);
osw.flush();
1
2
3
4
5
6
7
8
//以UTF-8方式读文件
FileInputStream fis = new FileInputStream("test.txt");
InputStreamReader isr = new InputStreamReader(fis, "UTF-8");
BufferedReader br = new BufferedReader(isr);
String line = null;
while ((line = br.readLine()) != null) {
FileContent += line;
}

序列化与反序列化

在程序中经常需要保存类的数据,如果直接使用OutputStream 也是可以保存类数据的,但是需要考虑类中有引用的情况,如果里面有引用,需要保存引用所对应的那块内存。每个类都需要额外提供一个方法来处理存在引用成员的情况。针对这种需求,Java提供了序列化与反序列化的功能

Java序列化与反序列化可以使用ObjectOutputStream 和 ObjectInputStream。

1
2
3
4
5
public class Student{
public String name;
public int age;
public Date birthday;
}

比如我们要序列化 上述的 Student 类,可以使用下面的代码

1
2
3
4
5
6
7
ObjectOutputStream oos = ObjectOutputStream(new FileOutputStream("student.dat"));

Student stu = new Student();
stu.name = "Tom";
stu.age = 22;
stu.brithday = new Date();
oos.writeObject(stu);

当然如果要进行序列化和反序列化操作,必须要在类中实现Serializable接口, 这个接口没有任何方法它仅仅作为一个标志,拥有这个标志的方式才能进行序列化。也就是得将上述的Student 类做一个修改

1
2
3
4
5
public class Student implements Serializable{
public String name;
public int age;
public Date birthday;
}

类的静态变量在类的对象创建之前就加载到了内存中。它与具体的类对象无关,所以在序列化时不会序列化静态成员。如果有的成员不想被序列化,可以将它变为静态成员;但是从设计上来说,也不是所有的类成员都可以变为静态成员。为了保证非静态成员可以不被序列化,可以使用 transient 关键字

实现了serialiable 接口的类在保存为.class文件 时会增加 一个SerializableID, 序列化时会在对应文件中保存序列号,如果类发生了修改而没有进行序列化操作时,二者不同会抛出一个异常。

例如说上述的Student类中先进行了一次序列化,在文件中保存了一个ID,后来根据需求又增加了一个 id 字段,在编译后又生成了一个ID,如果这个时候用之前的文件来反序列化,此时就会报错。

为了解决上述问题,可以采用以下几种方法:

  1. 改类代码文件后重新序列化。
  2. 增加一个 static final long serialVerssionID = xxxx; 这个ID是之前序列化文件保存的ID。这个操作是为了让新修改的类ID与文件中的ID相同。

调用 writeObject 方法时一个文件只能保存一个对象的内容。为了使一个文件保存多个对象,可以使用集合保存多个对象,在序列化时序列化 这个集合