2007-12-22

对Java处理XML性能的比较(DOM和SAX)

测试数据是结构很简单的一个20M的XML文档,里面的数据来自我的一个项目。测试程序很简单,就是读取这个XML文件,把里面的链接写入到一个文本文件。然后把数据原样重复了一遍,然后又测试了一次,下面是测试结果。

方法数据大小内存峰值
CPU峰值
耗时
SAX 20M
20M
30%
142秒
DOM
20M
152M
100%
171秒
SAX
40M
20M
30%
290秒
DOM
40M
345M
100%
376秒

表1 SAX和DOM的性能比较


结论:SAX的内存消耗稳定,CPU占用率低,耗时短,大数据量XML的简单处理一定首选SAX。DOM的性能受到内存的严重影响,内存消耗受到数据量的影响,大数据量XML的读处理最好不要用DOM。

Technorati technorati tags: , ,


请不要吝惜您的评论,每一条评论,都是我在漫漫长夜前行的力量

6 条评论:

Blogger Eric 说...

这个比较不公平呀 DOM 是要建一个文档树的. 要是提链接, 我想正则是最快的 :)

3:01 上午

 
Blogger tiny 说...

正则应该跟SAX差不多,这里比较又不是说谁好,呵呵

只是对大文件处理的具体性能做一个量化的比较而已。

DOM比较简单,所以一般程序用的比较多,这对大多数的情形是没有问题的。但是遇到了大XML,DOM的内存占用往往会造成问题。比如我的测试数据有20M,放置在了DreamWeaver设置的一个site里面,结果这个文件造成我的DreamWeaver在site caching过程失去响应……测试文件删除后,DreamWeaver启动完全正常。

3:08 上午

 
Blogger tiny 说...

当然DreamWeaver遇到我的大XML失去响应不光是因为DOM模式处理XML,应该因为它要比较所有的链接(正常情况下,倒不是不可完成的任务)。

3:09 上午

 
Anonymous 匿名 说...

还有一个VTD-XML的库 官方说的是和DOM SAX不一样的方法
http://vtd-xml.sourceforge.net/

3:34 上午

 
Blogger Achir 说...

使用什么工作来测试不同方法的性能差异呢?

12:40 上午

 
Blogger tiny 说...

方法很简单,就是自己写两个程序来比较,代码中用计时器计算时间,内存占用可以用操作系统提供的性能监视工具。我在用mac os x的activity monitor。Windows可以用任务管理器嘛。

1:13 上午

 

发表评论

<< 主页