利用Java读写Excel(两种方法:Apache POI ,easyExcel)

利用Java操作Excel

Apache-poi

1.Apache-poi写入Excel(xls、xlsx)

xls只能由65536行数据,xlsx理论无限制

(1)导入依赖

<dependencies>
    <!--xls(03)-->
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi</artifactId>
        <version>3.9</version>
    </dependency>

    <!--xlsx(07)-->
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
        <version>3.9</version>
    </dependency>

    <!--日期格式化工具-->
    <dependency>
        <groupId>joda-time</groupId>
        <artifactId>joda-time</artifactId>
        <version>2.10.1</version>
    </dependency>

    <!--test-->
    <dependency>
        <groupId>junit</groupId>
        <artifactId>junit</artifactId>
        <version>4.12</version>
    </dependency>
</dependencies>

(2)编写代码

import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.joda.time.DateTime;
import org.junit.Test;

import java.io.FileOutputStream;


/**
 * @author 许可新
 * @date 2020/11/2 - 20:41
 */
public class ExcelWriteTest {

    String PATH = "E:\IDEA\OperationExcel\xkx-poi";

    @Test
    public void testWrite03() throws Exception {
        // 1.创建一个工作簿
        Workbook workbook = new HSSFWorkbook();
        // 2.创建一个工作表
        Sheet sheet = workbook.createSheet("观众表");
        // 3.创建一个行
        Row row = sheet.createRow(0);
        // 4.创建一个单元格(1,1)
        Cell cell11 = row.createCell(0);
        cell11.setCellValue("今日新增观众");

        Cell cell12 = row.createCell(1);
        cell12.setCellValue("创建时间");

        Row row2 = sheet.createRow(1);
        Cell cell21 = row2.createCell(0);
        cell21.setCellValue(666);

        Cell cell22 = row2.createCell(1);
        cell22.setCellValue(new DateTime().toString("yyyy-MM-dd HH-mm-ss"));


        // 生成一张表(IO流) 03版本就是使用xls结尾
        FileOutputStream fileOutputStream = new FileOutputStream(PATH+"观众表03.xls");

        workbook.write(fileOutputStream);

        fileOutputStream.close();

        System.out.println("文件生成完毕");
    }

    @Test
    public void testWrite07() throws Exception {
        // 1.创建一个工作簿
        Workbook workbook = new XSSFWorkbook();
        // 2.创建一个工作表
        Sheet sheet = workbook.createSheet("观众表");
        // 3.创建一个行
        Row row = sheet.createRow(0);
        // 4.创建一个单元格(1,1)
        Cell cell11 = row.createCell(0);
        cell11.setCellValue("今日新增观众");

        Cell cell12 = row.createCell(1);
        cell12.setCellValue("创建时间");

        Row row2 = sheet.createRow(1);
        Cell cell21 = row2.createCell(0);
        cell21.setCellValue(666);

        Cell cell22 = row2.createCell(1);
        cell22.setCellValue(new DateTime().toString("yyyy-MM-dd HH-mm-ss"));


        // 生成一张表(IO流) 03版本就是使用xlsx结尾
        FileOutputStream fileOutputStream = new FileOutputStream(PATH+"观众表07.xlsx");

        workbook.write(fileOutputStream);

        fileOutputStream.close();

        System.out.println("文件生成完毕");
    }
}

2.数据批量导入时各个版本的优缺点

大文件写HSSF


缺点︰最多只能处理65536行,否则会抛出异常
java.lang.I1legalArgumentException: Invalid row number (65536) outside allowable range (0…65535)

优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快

//超过65536行就会报错
    @Test
    public void testWrite03BigData() throws Exception {

        long begin = System.currentTimeMillis();

        // 1.创建一个工作簿
        Workbook workbook = new HSSFWorkbook();
        // 2.创建一个工作表
        Sheet sheet = workbook.createSheet();
        // 3.写入数据
        for (int rowNum = 0; rowNum < 65537; rowNum++) {
            Row row = sheet.createRow(rowNum);
            for (int cellNum = 0; cellNum <10; cellNum++) {
                Cell cell = row.createCell(cellNum);
                cell.setCellValue(cellNum);
            }
        }

        System.out.println("Over");

        // 生成一张表(IO流) 03版本就是使用xls结尾
        FileOutputStream fileOutputStream = new FileOutputStream(PATH+"testWrite03BigData.xls");

        workbook.write(fileOutputStream);

        fileOutputStream.close();

        long end = System.currentTimeMillis();

        System.out.println("文件生成完毕,耗时:  "+(double)(end-begin)/1000);
    }

大文件写XSSF


缺点:写数据时速度非常慢,非常耗内存,也会发生内存溢出,如100万条

优点:可以写较大的数据量,如20万条

 //耗时较长 但可以使用缓存解决
    @Test
    public void testWrite07BigData() throws Exception {

        long begin = System.currentTimeMillis();

        // 1.创建一个工作簿
        Workbook workbook = new XSSFWorkbook();
        // 2.创建一个工作表
        Sheet sheet = workbook.createSheet();
        // 3.写入数据
        for (int rowNum = 0; rowNum < 65538; rowNum++) {
            Row row = sheet.createRow(rowNum);
            for (int cellNum = 0; cellNum <10; cellNum++) {
                Cell cell = row.createCell(cellNum);
                cell.setCellValue(cellNum);
            }
        }

        System.out.println("Over");

        // 生成一张表(IO流) 03版本就是使用xls结尾
        FileOutputStream fileOutputStream = new FileOutputStream(PATH+"testWrite07BigData.xlsx");

        workbook.write(fileOutputStream);

        fileOutputStream.close();

        long end = System.currentTimeMillis();

        System.out.println("文件生成完毕,耗时:  "+(double)(end-begin)/1000);
    }

大文件写SXSSF


优点:可以写非常大的数据量,如100万条甚至更多条,写数据速度快,占用更少的内存

注意:

过程中会产生临时文件,需要清理临时文件

默认由100条记录被保存在内存中,如果超过这数量,则最前面的数据被写入临时

文件如果想自定义内存中数据的数量,可以使用new sxSSFWorkbook(数量)

 //耗时较少,且可处理大文件
    @Test
    public void testWrite07BigDataS() throws Exception {

        long begin = System.currentTimeMillis();

        // 1.创建一个工作簿
        Workbook workbook = new SXSSFWorkbook();
        // 2.创建一个工作表
        Sheet sheet = workbook.createSheet();
        // 3.写入数据
        for (int rowNum = 0; rowNum < 100001; rowNum++) {
            Row row = sheet.createRow(rowNum);
            for (int cellNum = 0; cellNum <10; cellNum++) {
                Cell cell = row.createCell(cellNum);
                cell.setCellValue(cellNum);
            }
        }

        System.out.println("Over");

        // 生成一张表(IO流) 03版本就是使用xls结尾
        FileOutputStream fileOutputStream = new FileOutputStream(PATH+"testWrite07BigDataS.xlsx");

        workbook.write(fileOutputStream);

        fileOutputStream.close();
        
		//清除临时文件
        ((SXSSFWorkbook)workbook).dispose();
        long end = System.currentTimeMillis();

        System.out.println("文件生成完毕,耗时:  "+(double)(end-begin)/1000);
    }

SXSSFWorkbook-来至官方的解释︰实现"BigGridDem"策略的流式XSSFWorkbook版本。这允许写入非常大的文件而不会耗尽内存,因为任何时候只有可配置的行部分被保存在内存中。

请注意,仍然可能会消耗大量内存,这些内存基于您正在使用的功能,例如合并区域,注和……….然只存储在内存中,因此如果广泛使用,可能需要大量内存。

3.Apache-poi读取Excel(xls、xlsx)

基本读取操作

03版本
 String PATH = "E:\IDEA\OperationExcel\xkx-poi\";

    @Test
    public void testRead03() throws Exception {

        //获取文件流
        FileInputStream fileInputStream = new FileInputStream(PATH + "观众表03.xls");


        // 1.从流中获取工作簿
        Workbook workbook = new HSSFWorkbook(fileInputStream);
        // 2.得到表
        Sheet sheet = workbook.getSheetAt(0);
        // 3. 得到行
        Row row = sheet.getRow(0);
        // 4.得到列
        Cell cell = row.getCell(0);

        //获取字符串类型
        System.out.println(cell.getStringCellValue());

        // 3. 得到行
        Row row1 = sheet.getRow(1);
        // 4.得到列
        Cell cell1 = row1.getCell(0);

        //获取数字类型
        System.out.println(cell1.getNumericCellValue());
        fileInputStream.close();
    }
07版本
 @Test
    public void testRead07() throws Exception {
        //获取文件流
        FileInputStream fileInputStream = new FileInputStream(PATH + "观众表07.xlsx");
        // 1.从流中获取工作簿
        Workbook workbook = new XSSFWorkbook(fileInputStream);
        // 2.得到表
        Sheet sheet = workbook.getSheetAt(0);
        // 3. 得到行
        Row row = sheet.getRow(0);
        // 4.得到列
        Cell cell = row.getCell(0);
        
        //读取值的时候一定要注意获取值的类型
        //获取字符串类型
        System.out.println(cell.getStringCellValue());
        // 3. 得到行
        Row row1 = sheet.getRow(1);
        // 4.得到列
        Cell cell1 = row1.getCell(0);
        //获取数字类型
        System.out.println(cell1.getNumericCellValue());
        fileInputStream.close();
    }

读取不同的数据类型(工作中这是最麻烦的了)

 @Test
    public void testCellType07() throws Exception {
        //获取文件流
        FileInputStream fileInputStream = new FileInputStream(PATH + "明细表.xlsx");

        // 1.从流中获取工作簿
        Workbook workbook = new XSSFWorkbook(fileInputStream);

        Sheet sheet = workbook.getSheetAt(0);
        //获取标题内容
        Row rowTitle = sheet.getRow(0);
        if (rowTitle != null) {
            //一定要掌握
            int cellCount = rowTitle.getPhysicalNumberOfCells();

            for (int cellNum = 0; cellNum < cellCount; cellNum++) {
                Cell cell = rowTitle.getCell(cellNum);
                if (cell != null) {
                    int cellType = cell.getCellType();
                    String cellValue = cell.getStringCellValue();
                    System.out.print(cellValue + " | ");
                }
            }
            System.out.println();
        }

        // 获取表中的内容
        int rowCount = sheet.getPhysicalNumberOfRows();
        for (int rowNum = 1; rowNum < rowCount; rowNum++) {
            Row rowData = sheet.getRow(rowNum);
            if (rowData != null) {
                //读取列
                int cellCount = rowTitle.getPhysicalNumberOfCells();
                for (int cellNum = 0; cellNum < cellCount; cellNum++) {
                    System.out.print("[" + (rowNum + 1) + "-" + (cellNum + 1) + "]");

                    Cell cell = rowData.getCell(cellNum);

                    //匹配列的数据类型
                    if (cell != null) {
                        int cellType = cell.getCellType();
                        String cellValue = "";

                        switch (cellType) {
                            case HSSFCell.CELL_TYPE_STRING: //字符串
                                System.out.print("[String]");
                                cellValue = cell.getStringCellValue();
                                break;
                            case HSSFCell.CELL_TYPE_BOOLEAN: //布尔
                                System.out.print("[Boolean]");
                                cellValue = String.valueOf(cell.getBooleanCellValue());
                                break;
                            case HSSFCell.CELL_TYPE_BLANK: //空
                                System.out.print("[BLANK]");
                                break;
                            case HSSFCell.CELL_TYPE_NUMERIC: //数字(日期,普通数字)
                                System.out.print("[NUMERIC]");
                                if (HSSFDateUtil.isCellDateFormatted(cell)) {//是日期
                                    System.out.print("[日期]");
                                    Date date = cell.getDateCellValue();
                                    cellValue = new DateTime(date).toString("yyyy-MM-dd");
                                } else {
                                    //不是日期格式,防止数字过长
                                    System.out.print("[数字转换为字符串输出]");
                                    cell.setCellType(HSSFCell.CELL_TYPE_STRING);
                                    cellValue = cell.toString();
                                }
                                break;
                            case HSSFCell.CELL_TYPE_ERROR: //空
                                System.out.print("[数据类型错误]");
                                break;
                        }
                        System.out.println(cellValue);

                    }

                }
            }
        }
        fileInputStream.close();
    }

注意:类型转换问题

计算公式(了解即可)

 @Test
    public void testFormula07() throws Exception {
        //获取文件流
        FileInputStream fileInputStream = new FileInputStream(PATH + "公式.xlsx");
        Workbook workbook = new XSSFWorkbook(fileInputStream);
        Sheet sheet = workbook.getSheetAt(0);

        Row row = sheet.getRow(4);
        Cell cell = row.getCell(0);

        // 拿到计算公式 eval
        XSSFFormulaEvaluator FormulaEvaluator = new XSSFFormulaEvaluator((XSSFWorkbook) workbook);

        //输出单元格
        int cellType = cell.getCellType();
        switch (cellType){
            case Cell.CELL_TYPE_FORMULA://公式
                String formula = cell.getCellFormula();
                System.out.println(formula);

                // 计算
                CellValue evaluate = FormulaEvaluator.evaluate(cell);
                String cellValue = evaluate.formatAsString();
                System.out.println(cellValue);
                break;
        }
    }

EasyExcel

JAVA解析Excel工具EasyExcel

Java解析、生成Excel比较有名的框架有Apache poi、jxl。但他们都存在一个严重的问题就是非常的耗内存,poi有一套SAX模式的API可以一定程度的解决一些内存溢出的问题,但POI还是有一些缺陷,比如07版Excel解压缩以及解压后存储都是在内存中完成的,内存消耗依然很大。easyexcel重写了poi对07版Excel的解析,能够原本一个3M的excel用POI sax依然需要100M左右内存降低到几M,并且再大的excel不会出现内存溢出,03版依赖POI的sax模式。在上层做了模型转换的封装,让使用者更加简单方便

写入Excel

https://www.yuque.com/easyexcel/doc/write

读取Excel

https://www.yuque.com/easyexcel/doc/read

固定套路:
1、写入,固定类格式进行写入
2、读取,根据监听器设置的规则进行读取!

小结-学习方式

了解,面向对象的思想,学会面向接口编程!

理解使用测试API !

作业∶把EasyExcel的所有api都测试一下( 2~3小时!)

匿名

发表评论

匿名网友