0

0

Java中将CSV数据转换为带属性的XML文件教程

聖光之護

聖光之護

发布时间:2025-10-05 10:10:14

|

189人浏览过

|

来源于php中文网

原创

Java中将CSV数据转换为带属性的XML文件教程

本文旨在指导开发者如何使用Java将CSV格式数据转换为包含属性而非子元素的XML文件。通过分析传统DOM解析方法的局限性,我们推荐并详细演示了基于JAXB(Java Architecture for XML Binding)的解决方案,该方案利用注解实现CSV数据到POJO对象的映射,进而高效生成符合特定属性格式要求的XML输出。

引言

在数据交换和存储中,csv(comma separated values)和xml(extensible markup language)是两种常见格式。有时,我们需要将结构化的csv数据转换为xml,并且要求csv的列数据在xml中以元素的属性(attributes)形式呈现,而非子元素(child elements)。例如,将如下csv数据:

Col1,Col2,Col3,Col4,Col5
All,0,,0,0
All,935,231,0,30
None,1011,257,0,30

转换为如下XML格式:



    
    
    

传统的基于DocumentBuilder和Transformer的DOM操作在处理将CSV列映射为XML属性时,往往需要更复杂的逻辑来手动创建和设置属性。当列数量增多或结构复杂时,这种方式会变得繁琐且易出错。为此,JAXB提供了一种更简洁、声明式的方法来解决这类问题。

传统DOM方法的局限性

原始的DOM操作代码示例尝试读取CSV文件,并为每一行创建一个元素,然后为每个CSV字段创建一个子元素。例如,它会生成:


    
        All
        0
        
        0
        0
    
    

这与我们期望的属性格式()不符。要通过DOM API实现属性,需要使用Element.setAttribute()方法,而非Element.appendChild(newDoc.createElement(fieldName))。手动管理这些细节会增加代码的复杂性。

立即学习Java免费学习笔记(深入)”;

推荐方案:使用JAXB进行CSV到XML属性转换

JAXB(Java Architecture for XML Binding)提供了一种将Java对象(POJO)与XML文档相互映射的机制。通过在POJO类上使用特定的注解,我们可以声明性地控制Java对象的哪些字段应映射为XML元素、哪些应映射为XML属性。

1. 定义POJO类

首先,我们需要定义两个POJO类:一个用于表示XML的根元素(),另一个用于表示每个数据行()。

Cutout.Pro抠图
Cutout.Pro抠图

AI批量抠图去背景

下载

Root.java (用于表示XML的根元素)

import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;
import java.util.ArrayList;
import java.util.List;

@XmlRootElement(name = "root") // 映射到XML的根元素 
public class Root {
    private List rows = new ArrayList<>();

    @XmlElement(name = "row") // 映射到XML的子元素 
    public List getRows() {
        return rows;
    }

    public void setRows(List rows) {
        this.rows = rows;
    }
}

RowData.java (用于表示XML的每一行 元素及其属性)

import javax.xml.bind.annotation.XmlAttribute;
import javax.xml.bind.annotation.XmlRootElement; // 也可以不加,因为它是作为Root的子元素

public class RowData {
    private String col1;
    private String col2;
    private String col3;
    private String col4;
    private String col5;

    // JAXB需要一个无参构造函数
    public RowData() {}

    public RowData(String col1, String col2, String col3, String col4, String col5) {
        this.col1 = col1;
        this.col2 = col2;
        this.col3 = col3;
        this.col4 = col4;
        this.col5 = col5;
    }

    @XmlAttribute(name = "col1") // 映射到XML属性 col1
    public String getCol1() { return col1; }
    public void setCol1(String col1) { this.col1 = col1; }

    @XmlAttribute(name = "Col2") // 映射到XML属性 Col2 (注意大小写与期望输出一致)
    public String getCol2() { return col2; }
    public void setCol2(String col2) { this.col2 = col2; }

    @XmlAttribute(name = "Col3") // 映射到XML属性 Col3
    public String getCol3() { return col3; }
    public void setCol3(String col3) { this.col3 = col3; }

    @XmlAttribute(name = "Col4") // 映射到XML属性 Col4
    public String getCol4() { return col4; }
    public void setCol4(String col4) { this.col4 = col4; }

    @XmlAttribute(name = "Col5") // 映射到XML属性 Col5
    public String getCol5() { return col5; }
    public void setCol5(String col5) { this.col5 = col5; }
}

注解说明:

  • @XmlRootElement(name = "root"): 标记一个类为XML文档的根元素,并指定其名称。
  • @XmlElement(name = "row"): 标记一个字段或方法为XML元素,并指定其名称。在这里,它告诉JAXB Root 类的 rows 列表中的每个 RowData 对象都应被序列化为 元素。
  • @XmlAttribute(name = "col1"): 标记一个字段或方法为XML属性,并指定其名称。这是实现CSV列到XML属性转换的关键。

2. 实现CSV解析和JAXB转换逻辑

接下来,我们将编写一个方法来读取CSV文件,将每一行数据解析并填充到 RowData 对象中,最后使用JAXB将这些对象集合转换为XML文件。

import javax.xml.bind.JAXBContext;
import javax.xml.bind.Marshaller;
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

public class CsvToXmlConverter {

    public void convertCsvToXmlWithAttributes(String csvFileName, String xmlFileName, String delimiter) {
        try {
            // 1. 读取CSV文件并解析数据
            List rowDataList = new ArrayList<>();
            try (BufferedReader csvReader = new BufferedReader(new FileReader(csvFileName))) {
                String line;
                boolean isFirstLine = true; // 用于跳过CSV头行

                while ((line = csvReader.readLine()) != null) {
                    if (isFirstLine) {
                        isFirstLine = false;
                        // 假设CSV文件的第一行是标题,我们跳过它
                        // 如果CSV文件没有标题行,请移除此if块
                        continue;
                    }

                    String[] fields = line.split(delimiter, -1); // -1 参数保留空字符串

                    // 确保字段数量与POJO的属性数量匹配
                    if (fields.length == 5) {
                        RowData row = new RowData(
                            fields[0], fields[1], fields[2], fields[3], fields[4]
                        );
                        rowDataList.add(row);
                    } else {
                        System.err.println("警告: CSV行字段数量不匹配,跳过此行: " + line);
                    }
                }
            }

            // 2. 将解析后的数据封装到根对象中
            Root root = new Root();
            root.setRows(rowDataList);

            // 3. 使用JAXB进行对象到XML的转换(Marshalling)
            JAXBContext jaxbContext = JAXBContext.newInstance(Root.class);
            Marshaller jaxbMarshaller = jaxbContext.createMarshaller();

            // 设置JAXB Marshaller的属性
            jaxbMarshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true); // 格式化输出,使其可读
            jaxbMarshaller.setProperty(Marshaller.JAXB_ENCODING, "UTF-8");      // 设置编码

            // 将对象写入XML文件
            jaxbMarshaller.marshal(root, new File(xmlFileName));

            System.out.println("CSV文件 '" + csvFileName + "' 已成功转换为XML文件 '" + xmlFileName + "'。");

        } catch (IOException e) {
            System.err.println("文件操作异常: " + e.getMessage());
            e.printStackTrace();
        } catch (Exception e) {
            System.err.println("JAXB转换或未知异常: " + e.getMessage());
            e.printStackTrace();
        }
    }

    public static void main(String[] args) {
        // 创建一个示例CSV文件
        String csvContent = "Col1,Col2,Col3,Col4,Col5\n" +
                            "All,0,,0,0\n" +
                            "All,935,231,0,30\n" +
                            "None,1011,257,0,30";
        String csvFileName = "input.csv";
        String xmlFileName = "output.xml";
        String delimiter = ",";

        try {
            java.nio.file.Files.write(java.nio.file.Paths.get(csvFileName), csvContent.getBytes());
            System.out.println("示例CSV文件 '" + csvFileName + "' 已创建。");
        } catch (IOException e) {
            System.err.println("创建示例CSV文件失败: " + e.getMessage());
            return;
        }

        CsvToXmlConverter converter = new CsvToXmlConverter();
        converter.convertCsvToXmlWithAttributes(csvFileName, xmlFileName, delimiter);
    }
}

要运行此代码,您可能需要确保您的Java环境支持JAXB。 对于Java 9及更高版本,JAXB API已从JDK中移除,需要手动添加Maven/Gradle依赖:



    jakarta.xml.bind
    jakarta.xml.bind-api
    2.3.3 


    org.glassfish.jaxb
    jaxb-runtime
    2.3.3 
    runtime

3. 运行结果

执行 main 方法后,将生成 output.xml 文件,其内容将严格按照我们期望的属性格式:



    
    
    

注意事项与最佳实践

  1. 错误处理: 在实际应用中,需要对文件I/O、CSV解析(例如,行字段数量不一致、数据类型转换失败)和JAXB操作进行更健壮的异常处理。
  2. CSV解析: 示例代码使用了 String.split() 方法,这对于简单的CSV文件足够。对于包含逗号、引号等复杂情况的CSV,推荐使用专业的CSV解析库,如 Apache Commons CSV 或 OpenCSV,它们能更好地处理各种CSV格式规范。
  3. 性能与内存: JAXB在转换时通常会将整个对象图加载到内存中。对于非常大的CSV文件,这可能会导致内存问题。在这种情况下,可以考虑使用流式XML写入(如StAX或SAX),但这会增加代码的复杂性,需要手动管理属性的写入。
  4. JAXB版本: 确保您的Java环境与JAXB库版本兼容。如前所述,Java 9+ 需要额外的JAXB运行时依赖。
  5. XML命名规范: CSV列名可能不总是符合XML属性的命名规范(例如,不能以数字开头,不能包含某些特殊字符)。在POJO中通过 @XmlAttribute(name = "...") 指定属性名时,可以进行必要的映射和清理。

总结

通过JAXB提供的注解机制,我们可以以声明式的方式将Java对象映射到XML结构,包括将对象的字段映射为XML元素的属性。这种方法比手动使用DOM API创建和设置属性更为简洁、高效且易于维护,特别适用于将CSV数据转换为具有特定属性结构的XML文件。理解并熟练运用JAXB,能够极大地简化Java中XML数据处理的开发工作。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

825

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

724

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

728

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

395

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

445

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

428

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16881

2023.08.03

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

7

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.1万人学习

C# 教程
C# 教程

共94课时 | 5.7万人学习

Java 教程
Java 教程

共578课时 | 40万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号