오픈 소스 API로 XML 문서 조작을 단순하게
난이도 : 중급
Wes Biggs, Senior Developer, T.H.I.
Harry Evans, Senior Developer, T.H.I.
2007 년 8 월 28 일
JDOM은 XML과 함께 작동하는 고유한 자바 툴킷으로서, XML 애플리케이션의 신속한 개발을 목적으로 설계되었습니다.
JDOM의 디자인에는 자바 언어의 신택스부터 의미까지 포괄되어 있습니다. 하지만, 기존의 XML API보다 과연 얼마나
나을까요? 여러분이 직접 예제를 실행해 보고, 오픈 소스 프로젝트의 디자인 목표와 비교하면서 판단해 봅시다.
개발자인 여러분들도 80-20 규칙에 대해 들어봤을 것이다. 프로세스나 방법론이 모든 상황의 80 퍼센트를 차지하고,
나머지 20 퍼센트는 상황 별로(case-by-case) 다루어져야 한다. 소프트웨어 개발 세계에서 개발자가 주어진 기술을
사용하여 수행할 수 있는 일들의 80 퍼센트를 이룩하기는 매우 쉽다.
물론, 소프트웨어 제품과 표준이 80-20 규칙을 늘 따르는 것은 아니다. 특히 자바 XML 툴의 어긋난 부분은 이 규칙의
예외를 증명하고 있다. 자바 프로그래밍 세계는 수 많은 API들로 가득 차있다. 어떤 것은 자생한 것이고, 어떤 것은 대기업의
마케팅의 지원을 받기도 한다. XML의 보편성에 대한 약속으로서, 모든 새로운 태스크에는 새로운 기술이 있다. 하지만, 무엇이
접착제 역할을 하고, 여러분은 80 퍼센트의 작업을 수행하는데 적합한 툴을 어떻게 찾겠는가? JDOM은 이러한 질문을 염두 해
두고 구현된 XML API이다.
자바와 XML
여러 가지 면에서, 자바 언어는 XML을 위한 프로그래밍 언어가 되었다. Apache Software Foundation과
IBM alphaWorks의 노력으로 XML 문서의 생성, 조작, 변형, 파싱을 위한 완전한 툴 체인이 생겼다.
많은 자바 개발자들은 XML을 매일 사용하지만, Sun은 XML을 자바 플랫폼에 적용하는데 뒤쳐졌다. Java 2 플랫폼은
XML이 비즈니스 대 비즈니스 통합부터 웹 사이트 콘텐트 스트리밍에 이르기까지 모든 것에 대한 핵심 기술이 되기 전에 가치 있는
것이 되었기 때문에 Sun은 폭넓은 채택성을 획득했던 기존 XML API의 창시자가 되는 JSR 프로세스를 사용해왔다. 가장
중요한 것은 JAXP(Java API for XML Parsing)의 추가이다. 여기에는 세 개의 패키지들이 포함된다.
org.w3c.dom
: XML을 위한 표준 프로그래밍 방식의 Document Object Model의 W3C recommendation의 자바 구현.
org.xml.sax
: XML 파싱을 위한 이벤트 중심의 API.
javax.xml.parsers
: 애플리케이션 개발자들이 특정 파서 구현을 설정하고 획득할 수 있도록 해주는 팩토리 구현.
이러한 패키지들의 추가가 자바 개발자들에게는 좋은 일이지만, 고급의 자바-XML 상호 운용성으로 큰 도약을 이룬 것이 아닌
기존 API 표준에 대한 일반적인 순응을 나타낸다. 핵심 자바 플랫폼에서 부족한 것은 XML 문서를 자바 객체로서 조작할 수
있는 매력적인 인터페이스이다.
JDOM을 생각해 보자. 유명한 자바 개발자이자 작가인 Brett McLaughlin과 Jason Hunter의 생각의
산물인 JDOM은 2000년 초반에 Apache 계열의 라이센스 하에서 오픈 소스 프로젝트로서 시작되었다. 폭넓은 자바 개발자
베이스로부터 기여와 피드백, 버그 픽스를 받아들였고, 자바 코드에서 XML 데이터에 액세스 하여, 조작 및 결과를 만들어 내는
완벽한 자바 플랫폼 기반의 솔루션 구현을 목표로 설정했다.
API로서의 JDOM
JDOM은 XML 문서들을 프로그래밍 방식으로 조작하는 org.w3c.dom
패키지에 대한
대안으로서 사용될 수 있다. 완벽한 대체는 아니고, 사실, JDOM과 DOM은 공존할 수 있다. 게다가, JDOM은 텍스트
인풋에서 XML을 파싱하는 것을 신경 쓰지 않는다. 파서 구현을 설정 및 실행하는데 도움이 되는 래퍼 클래스를 제공하기도 한다.
JDOM은 기존 API를 기반으로 구현되었다.
대안 API의 필요성을 이해하려면, W3C DOM의 디자인 제약 조건에 대해 살펴보자.
- 언어 독립성. DOM은 자바 언어를 염두 해 두고 설계되지 않았다. 이것의 접근 방식은 다양한 언어들 사이에서 매우 비슷한 API를 유지하지만, 자바의 이디엄에 익숙한 프로그래머에게는 성가신 API이다. 예를 들어, 자바 언어는
String
클래스가 언어에 구현되어 있지만, DOM 스팩은 고유의 Text
클래스를 정의한다.
- 엄격한 계층. DOM의 API는 XML 스팩을 따른다. 따라서, 모든 것의 노드가 되는 XML에서, 모든 것이 확장하는 DOM에서
Node
기반 인터페이스와 Node
를 리턴하는 메소드의 호스트를 찾는다. 이는 다형성의 관점에서 볼 때는 뛰어나지만, 자바 언어로 작업하기에는 불편하다. Node
에서 리프(leaf) 유형으로의 변화는 장황하고 이해하기 어려운 코드를 만든다.
- 인터페이스 중심. 퍼블릭 DOM API는 인터페이스들로만 구성된다. (한 가지 예외는
Exception
클래스이다.) W3C는 인터페이스를 정의할 때 구현을 제공하는 것에는 관심이 없다. 자바 프로그래머로서 API를 사용한다는 것은
XML 객체들을 생성할 때 어느 정도의 분리가 된다. W3C 표준은 일반적인 팩토리 클래스와 유연하지만 덜 직접적인 패턴들을
사용하기 때문이다. XML 문서들이 애플리케이션 레벨 코드가 아닌 파서에 의해서만 구현되는 특수한 경우, 이는 무관하다.
하지만, XML 사용이 널리 퍼지면서, 애플리케이션 개발자들은 XML 객체들을 프로그래밍 방식으로 구현하는 편리한 방법을 필요로
하게 되었다.
프로그래머에게, 이러한 제약 조건은 (메모리 사용과 인터페이스 규모 면에서) 무겁고 다루기 어렵다는 것을 의미한다. 반대로, JDOM은 자바 중심의, 경량의 API이다. DOM의 원리를 조정하여 위에 언급한 불편함을 해소시켰다.
- JDOM은 자바 플랫폼 식이다. 이 API는 자바 언어의 빌트인
String
지원을 사용하기 때문에, 텍스트 값은 String
으로서 언제나 사용할 수 있다. List
와 Iterator
같은 Java 2 플랫폼 컬렉션 클래스도 활용하면서 자바 언어에 익숙한 프로그래머에게 풍부한 환경을 제공한다.
- 계층이 없음. JDOM에서, XML 엘리먼트는
Element
의 인스턴스이고, XML 애트리뷰트는 Attribute
의 인스턴스이며, XML 문서는 Document
의 인스턴스이다. 이 모든 것들이 XML에서 다른 개념들을 나타내기 때문에, 무정형의 "노드"로서가 아닌 고유의 유형으로서 참조된다.
- 클래스 중심. JDOM 객체는
Document
, Element
, Attribute
같은 클래스들의 직접적인 인스턴스이므로, 이를 구현하는 것은 자바 언어에서 new
연산자를 사용하는 것만큼이나 쉽다. 또한 설정 할 팩토리 인터페이스가 없다. JDOM은 jar에서 직접 사용할 준비가 되어있다.
JDOM 문서 구현 및 조작
JDOM은 표준 자바 코딩 패턴을 사용한다. 가능하다면, 복잡한 팩토리 패턴 대신에 자바 new
연산자를 사용하면서, 신참 사용자들도 객체를 쉽게 조작할 수 있게 해준다. JDOM을 사용하여 XML 문서를 구현하는 방법을 살펴보자. 우리가 구현할 구조는 Listing 1과 같다. (참고자료 섹션에서 전체 코드를 다운로드 할 수 있다.)
Listing 1. 구현할 XML 문서 샘플
<?xml version="1.0" encoding="UTF-8"?> <car vin="123fhg5869705iop90"> <!--Description of a car--> <make>Toyota</make> <model>Celica</model> <year>1997</year> <color>green</color> <license state="CA">1ABC234</license> </car>
|
주: 아래 Listing 2부터 7까지 샘플 문서를 구현할 것이다.
먼저, 루트(root) 엘리먼트를 만들고 이를 문서에 추가한다.
Listing 2. Document 구현하기
Element carElement = new Element("car"); Document myDocument = new Document(carElement);
|
이 단계는 새로운 org.jdom.Element
를 만들고, 이것을 org.jdom.Document
myDocument
의 루트 엘리먼트로 만든다. (참고자료 섹션에서 제공하는 샘플 코드를 사용하고 있다면 반드시 org.jdom.*
을 반입하라.) XML 문서는 하나의 루트 엘리먼트를 가져야 하므로, Document
는 생성자에 Element
를 취한다.
다음에는, vin
애트리뷰트를 추가한다.
Listing 3. Attribute 추가하기
carElement.addAttribute(new Attribute("vin", "123fhg5869705iop90"));
|
엘리먼트를 추가하는 것도 매우 단순하다. make
엘리먼트를 추가한다.
Listing 4. 엘리먼트와 하위 엘리먼트
Element make = new Element("make"); make.addContent("Toyota"); carElement.addContent(make);
|
Element
의 addContent
메소드가 Element
를 리턴하므로, 이를 다음과 같이 작성할 수 있다.
Listing 5. 간결한 형식으로 엘리먼트 추가하기
carElement.addContent(new Element("make").addContent("Toyota"));
|
이 문장들 모두 같은 일을 수행한다. 첫 번째 예제는 보다 읽기 쉽지만, 두 번째는 많은 엘리먼트들을 한번에 구현한다면 더욱 읽기 쉬울 것이라고 말할 수도 있겠다. 문서 구현을 완료하려면 다음과 같이 한다.
Listing 6. 나머지 엘리먼트 추가하기
carElement.addContent(new Element("model").addContent("Celica")); carElement.addContent(new Element("year").addContent("1997")); carElement.addContent(new Element("color").addContent("green")); carElement.addContent(new Element("license") .addContent("1ABC234").addAttribute("state", "CA"));
|
license
엘리먼트의 경우, 엘리먼트의 콘텐트를 추가했을 뿐만 아니라, 여기에 애트리뷰트도 추가하면서, 라이센스가 발행되었던 상태를 지정하고 있다. Element
에 대한 addContent
메소드는 Element
만 리턴하기 때문에 이것이 가능하다.
주석 섹션이나 기타 표준 XML 유형을 추가하는 것도 같은 방식이다.
Listing 7. 주석 추가하기
carElement.addContent(new Comment("Description of a car"));
|
문서 조작은 비슷한 방식으로 발생한다. 예를 들어, year
엘리먼트에 대한 레퍼런스를 획득하려면, Element
의 getChild
메소드를 사용한다.
Listing 8. 자식 엘리먼트에 액세스 하기
Element yearElement = carElement.getChild("year");
|
이 문은 실제로 엘리먼트 이름 year
를 가진 자식 Element
를 리턴한다. year
엘리먼트가 없다면, 호출은 어떤 것도 리턴하지 않는다. DOM Node
Node 인터페이스 같은 것에서 리턴 값을 던질 필요가 없었다. Element
의 자식 들은 단순히 Element
이다. 비슷한 방식으로, 문서에서 year
엘리먼트를 제거할 수 있다.
Listing 9. 자식 엘리먼트 제거하기
boolean removed = carElement.removeChild("year");
|
이 호출은 year
엘리먼트만 제거한다. 나머지 문서는 바뀌지 않은 채로 남아있다.
엘리먼트만 제거한다. 나머지 문서는 바뀌지 않은 채로 남아있다. XMLOutputter
클래스를 사용한다.
Listing 10. JDOM을 XML 텍스트로 바꾸기
try { XMLOutputter outputter = new XMLOutputter(" ", true); outputter.output(myDocument, System.out); } catch (java.io.IOException e) { e.printStackTrace(); }
|
XMLOutputter
는 포맷팅 옵션을 갖고 있다. 여기에서, 우리는 부모 엘리먼트에서 두 스페이스를 들여쓰기 한 자식 엘리먼트를 원한다고 지정했고, 엘리먼트들 사이에 새로운 라인을 원한다는 것을 지정했다. XMLOutputter
는 Writer
또는 OutputStream
을 출력한다. 파일로 출력하려면 아웃풋 라인을 다음과 같이 바꾼다.
Listing 11. FileWriter를 사용하여 XML 출력하기
FileWriter writer = new FileWriter("/some/directory/myFile.xml"); outputter.output(myDocument, writer); writer.close();
|
기존 XML 툴과 결합하기
JDOM의 재미있는 기능들 중 하나는 다른 API들과의 상호 운용성이다. JDOM을 사용하여, Stream
또는 Reader
뿐만 아니라, SAX Event Stream
또는 DOM Document
로
서도 문서를 출력할 수 있다. 이러한 유연성 때문에 JDOM이 이종의 환경에서 사용될 수 있고, XML을 핸들링 하는 또 다른
메소드를 이미 사용하고 있는 시스템에 추가될 수 있다. 나중에 예제에서 보겠지만, JDOM은 JDOM 데이터 구조를 인식하지
못하는 다른 XML 툴을 사용할 수 있다.
JDOM의 또 다른 사용법은 이미 존재하는 XML 데이터를 읽고 조작하는 기능이다. 잘 구성된 XML 파일을 읽는 것은 org.jdom.input
의 클래스들 중 하나를 사용함으로써 수행된다. 이 예제에서, 우리는 SAXBuilder
를 사용할 것이다.
Listing 12. SAXBuilder를 사용하여 XML 파일 파싱하기
try { SAXBuilder builder = new SAXBuilder(); Document anotherDocument = builder.build(new File("/some/directory/sample.xml")); } catch(JDOMException e) { e.printStackTrace(); } catch(NullPointerException e) { e.printStackTrace(); }
|
Listing 2부터 7까지의 방식과 똑같이 이 프로세스를 통해 구현된 문서를 조작할 수 있다.
JDOM의 또 다른 적용은 이를 Apache의 Xalan 제품과 결합하는 것이다. (참고자료) 위 자동차 예제를 사용하여, 특정 자동차에 대한 상세를 제공하는 온라인 자동차 딜러용 웹 페이지를 구현할 것이다. 우선, 이 문서는 우리가 사용자에게 제공하고자 하는 자동차에 대한 정보를 나타낸다. 그런 다음, 이 JDOM Document
를 XSL 스타일 시트로 결합하고, HTML 포맷의 결과를 서블릿의 OutputStream
으로 출력할 수 있다.
이 경우, 우리가 사용할 XSL 스타일시트는 car.xsl
이다.
Listing 13. 자동차 기록을 HTML로 변형하는 XSL 문서
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> <xsl:template match="/car"> <html> <head> <title><xsl:value-of select="make"/> <xsl:value-of select="model"/> </head> <body> <h1><xsl:value-of select="make"/></h1><br /> <h2><xsl:value-of select="model"/></h2><br /> <table border="0"> <tr><td>VIN:</td><td><xsl:value-of select="@vin"/></td></tr> <tr><td>Year:</td><td><xsl:value-of select="year"/></td></tr> <tr><td>Color:</td><td><xsl:value-of select="color"/></td></tr> </table> </body> </html> </xsl:template> </xsl:stylesheet>
|
이제, org.jdom.Document
를 DOM Document
로 바꾸고, 이것을 Xalan에 제공한다. XSL과 가상의 애플리케이션 서버에서 가져온 OutputStream
을 나타내는 파일도 함께 제공한다. (Listing 14)
Listing 14. JDOM과 Xalan을 사용하여 HTML 문서 생성하기
TransformerFactory tFactory = TransformerFactory.newInstance();
// Make the input sources for the XML and XSLT documents org.jdom.output.DOMOutputter outputter = new org.jdom.output.DOMOutputter(); org.w3c.dom.Document domDocument = outputter.output(myDocument); javax.xml.transform.Source xmlSource = new javax.xml.transform.dom.DOMSource(domDocument); StreamSource xsltSource = new StreamSource(new FileInputStream("/some/directory/car.xsl"));
// Make the output result for the finished document using // the HTTPResponse OutputStream StreamResult xmlResult = new StreamResult(response.getOutputStream());
// Get a XSLT transformer Transformer transformer = tFactory.newTransformer(xsltSource);
// Do the transform transformer.transform(xmlSource, xmlResult);
|
이 예제에서, 아웃풋은 자바 서블릿의 HTTPResponse
OutputStream
을 통해 체계화 된다. 하지만, 이 스트림은 XMLOutputter
를 사용한 이전 예제처럼 쉽게 파일스트림이 될 수 있다. 우리는 DOMOutputter
를 사용하여 Xalan용 XML 소스를 생성했다. 하지만, XMLOutputter
를 사용하여 XML 문서를 String
으로서 출력하고 이를 StreamSource
로 만듦으로써 같은 인풋을 생성할 수 있었다. 유연성에 대해서 보자. JDOM은 그 구조를 String
, SAX Event Stream
, 또는 DOM Document
로서 출력할 수 있다. 이는 JDOM이 인풋으로서 이러한 모델을 취할 수 있는 툴과 상호 작동할 수 있도록 해준다. (JDOM 웹 사이트에서 contrib
패키지를 참조하라. 여기에서 JDBC ResultSet-기반 빌더, XPATH 구현 같은 툴을 제공하는 JDOM 기반 유틸리티의 라이브러리를 찾을 수 있다.)
몇 줄의 코드로, JDOM은 다양한 기능을 실행한다. 우리는 XML에서 파싱하고 프로그래밍 방식으로 XML 문서를 생성하고, 그러한 문서들을 조작했고, XML 중심의 웹 페이지를 생성하는데 이를 사용했다.
|
Sun과 JDOM JDOM
의 공식 1.0 릴리스는 Java Community Process의 진행 과정과 발을 맞춘다. JSR-102로서 제출된
JDOM은 핵심 자바 플랫폼에 들어가도록 승인을 얻었다. 다음은 Sun 측에서 말한 부분이다. "JDOM은 이전 API들보다
사용하기가 훨씬 더 쉽기 때문에, 이 플랫폼에 매우 유용할 것이라고 생각한다." JSR에 따르면, 1.0 릴리스는 JDOM의
패키징 변화를 "org.jdom"에서 "javax.xml.tree"로 간주하고 있다. 미래는 긍정적이지만, 개발자들은 새로운
버전에 발을 맞추려면 코드를 개선해야 한다. | |
JDOM의 성장: 미래
이 글을 쓰고 있는 현재, JDOM 프로젝트는 Beta 6 버전을 릴리스 했다. 베타 상태임에도, JDOM은 안정적인
구현으로 입증되었다. API의 많은 부분이 안정적이고, 기존 인터페이스들에 잠재적으로 영향을 줄 많은 부분에서 작업이 진행
중이다. 따라서, 이 시점에서 진행되는 어떤 개발 프로젝트라도 JDOM을 무시해서는 안되겠다. 특정 메소드 시그너처와 특정
의미가 바뀔 것이고 핵심 자바 API에 채택될 것이기 때문이다. (Sun과 JDOM 참조)
JDOM을 위한 단기적인 TO-DO 리스트는 API를 안정화 하고 성능 부분을 평가하는 것에 초점이 맞춰졌다. 개발자들을
애먹이는 부분에는 DTD 엔터티 지원과 기타 구조들이다. XPATH 지원과 보다 직접적인 XML 데이터 소스와의 통합 등이 진행
중이다.
그래서, JDOM은 기존 XML API들보다 더 나은가? 여러분이 자바로 꿈을 꾼다면 대답은 '그렇다'이다. JDOM이
여러분이 선호하는 파서나 XML 인식 데이터베이스를 대체하는 것은 아니지만, 이것의 디자인 원리는 XML 세계에 적용될 수
있다.
참고자료
필자소개
|
|
|
Wes Biggs는 Los Angeles Times, USWeb, Elite Information Systems 등 여러
기업들에서 인터넷 애플리케이션을 개발했다. 오픈 소스 자바 프로젝트의 기여자이며, Free Software Foundation의
gnu.regexp 정규식 패키지를 관리하고 있다. (wes@tralfamadore.com) |
|
|
|
Harry Evans는 소프트웨어 디자인과 애플리케이션 엔지니어링 분야에서 경력을 쌓았다. 여러 웹 기반 및 인터넷 인식
제품들의 디자인 분야에서 일했다. Rapid Application Development부터 레거시 제품 통합까지 경력을 쌓았다.
(harry@tralfamadore.com) |