[인터넷라이프] 꿈의 인터넷언어 XML이 온다

XML을 설명하는 말에는 온갖 장밋빛 수식어가 넘실거린다. 혹자는 XML의 등장을 인터넷 분야의 산업혁명으로 비유하기도 한다. 증기기관이 산업혁명의 불을 당겼듯이 XML이 향후 펼쳐질 새로운 차원의 정보혁명에서 구심점이 될 것으로 확신하는 이들도 있다. 과연 XML(EXTENSIBLE MARKUP LANGUAGE)이란 무엇인가.◇HTML을 발전시킨 차세대 언어 인터넷 붐을 몰고 온 HTML(HYPERTEXT MARKUP LANGUAGE)의 매력은 하이퍼 텍스트라는 묘한 기술에 있었다. 하이퍼텍스트는 쉽게 풀이하면 「마우스를 대고 클릭하면 원하는 곳으로 보내주는」 언어라는 뜻이다. 드넓은 인터넷 세상을 여행할 수 있는 것은 오로지 이 「하이퍼 텍스트」라는 신기한 요술 덕택이다. 그러나 이 HTML도 사용할수록 하나 둘씩 한계를 드러내기 시작했다. 가장 큰 문제는 만들어낸 정보를 찾아서 활용하기가 어렵다는 것이다. 인터넷의 바다에 떠다니는 홈페이지만도 대략 10억개에 이른다. 이 중에 내가 원하는 정보가 담긴 문서를 찾는 것은 결코 쉬운 일이 아니다. 검색엔진이 그 일을 담당하고 있지만 역시 제몫을 못해내고 있는 실정이다. 검색엔진은 그저 수십개의 관련문서를 끌어다가 쏟아놓는데 그친다. 나머지는 당신이 알아서 찾아보라는 뜻이다. 이는 검색엔진을 다그친다고 해결될 문제가 아니다. HTML로 작성된 문서는 정보를 만들어 내기는 쉽지만 웹의 바다에 파묻히고 나면 다시 찾아쓰기가 좀처럼 쉽지않게 설계되었기 때문이다. 반면 XML은 정보를 만들어 올리는 것보다는 다시 찾아 쓰는데 중점을 둔 언어다. 인구가 늘어나면 주민등록번호 등 규격화된 정보가 필요하듯이 정보량이 늘어날수록 웹문서를 일정한 형식과 규약에 맞춰야 할 필요가 생겨 고안된 언어가 바로 XML이다. ◇정보를 쉽게 찾고 쉽게 가공할 수 있다. 일기를 쓸 때 날짜·날씨·쓴 시간·그날 만난 사람·주요 내용·그 날의 컨디션 등 항목(태그)을 만들어 구분해서 기입하면 수십년이 지나도 원하는 정보를 찾기 쉽다. 예를 들어 3년전 겨울 눈오는 날 만난 사람들의 이름을 알고 싶다면 날짜, 날씨, 만난 사람이라는 항목만 집중적으로 찾아보면 된다. 그런데 일기를 「나는 오늘 아무개를 만나서 기분이 좋다. 저녁 무렵 눈이 내렸고 오늘은 12월의 두번째 금요일이다」는 식으로 써 놓았다면, 더구나 날짜순으로 모아진 것도 아니고 그저 커다란 창고에 뒤섞여 쌓여 있다면 정보를 찾는 것은 결코 쉬운 일이 아니다. 이렇게 정보를 만들어 놓고 「눈」, 「만났다」등의 키워드로 검색엔진을 돌리니 「눈병 걸렸다」,「눈꼴 시리다」「오늘 드디어 임자 만났다」같은 엉뚱한 결과만 쏟아지는 것이다. XML은 태그라고 부르는 항목이 있어 정보를 분야별 의미별로 구분해 처리할 수 있게 되어있다. 이 태그는 분야에 따라 다양하게 응용할 수 있어 모든 종류의 정보를 XML로 표현할 수 있다. HTML문서에도 태그라는 것이 있지만 이것은 웹문서의 위쪽에는 이런 내용을 넣고, 중간에는 저런 그림을 붙이고 이 줄에서 다른 웹사이트로 이동하라는 등 웹문서의 모양과 구성에 치중한 항목이다. 정보를 규격화한다는 것은 엄청난 의미를 담고 있다. 본격적으로 정보를 재가공하고 자유롭게 응용할 수 있게 된다는 뜻이다. 어린이용 블럭쌓기 놀이인 레고를 보면 각 블럭들은 제각기 다양한 색깔과 모양을 가지고 있지만 어디에 끼워도 맞춰진다는 중요한 사실 때문에 그것으로 자동차도 만들고 비행기도 만들 수 있는 것이다. XML의 X가 「EXTENSIBLE(확장 가능한)」의 약자인 것도 XML이 무한한 응용분야를 갖고 있다는 사실을 설명한다. ◇이제 XML은 대세다 XML이 인터넷업계의 관심사로 떠오른 것은 1996년부터다. 사실 그 이전부터미국 국방성 등에서는 SGML이라는 규격화된 문서체계를 사용했었다. SGML의 문제는 너무 복잡하다는 것과 인터넷 주소를 담을 태그가 없어 웹에서 사용하기 어렵다는 것이었다. SGML을 좀더 단순화하고 HTML처럼 웹상에서 작동할 수 있도록 만든 것이 XML이다. 그러나 XML은 단점도 있다. 일단 배우기가 어렵다는 것이다. 살아서 퍼덕이는 정보를 딱딱한 규약에 끼워 맞추는 일은 쉽지 않다. 그래서 널리 퍼지기 어렵다는 약점이 있었다. 더구나 권력형 지배기구가 없는 인터넷 환경에서는 아무도 XML의 사용을 강요할 수 없다. 하지만 보이지 않는 「돈의 힘」이 이를 가능하게 만들고 있다. 마이크로소프트·오라클·IBM·SAP 등 거대 기업들이 XML을 받아들이기로 한 것이다. 결국 이들과 거래하려는 업체들은 XML을 도입하지 않을 수 없다. 수많은 기업들이 거미줄처럼 얽혀있는 상황에서 XML이 퍼지는 것은 이제 시간 문제다. 국내에서도 이미 정부기관의 공식문서 규약으로 XML을 채택하려는 움직임이 일고 있고 기업들도 EDI(기업간 문서교환) 시스템을 XML로 전환하려는 노력을 하고 있다. 기왕 쓰게 될거라면 먼저 쓰는 게 낫다는 생각이다. 아직 XML은 초기단계다. 주로 기업간 혹은 정부와 기업 사이의 데이터 교환에 적용되고 있을 뿐 모든 네티즌이 XML 형식의 문서를 사용하게 될 날은 아직 멀었다. 그러나 XML에 주목하는 많은 전문가들은 이렇게 말한다. 『XML은 단순한 상품이 아닌 일종의 시스템이라는 점에서 그 파급 효과는 아무도 예상할 수 없습니다. 도레미파솔라시라는 일곱 단계의 화성체계가 처음 만들어졌을 때 누구도 오늘날 같은 화려한 교향곡들이 넘쳐날 것을 예상하지 못했던 것처럼 말이지요』 이진우기자MALLIAN@SED.CO.KR

<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>