Tin tức
XML là gì
24/10/2008
 
XML viết tắt của chữ eXtensible Markup Language (ngôn ngữ nâng cấp có thể mở rộng) là một bộ qui luật về cách chia một tài liệu ra làm nhiều phần, rồi đánh dấu và ráp các phần khác nhau lại để dễ nhận diện chúng. Ðược chỉ đạo bởi Tổ hợp Web toàn cầu (W3C), XML trở thành một đặc điểm kỹ thuật chính thức.

Tổ hợp Web toàn cầu
W3C
gọi XML là "một cú pháp thông dụng cho việc biểu thị cấu trúc trong dữ liệu". Dữ liệu có cấu trúc tham chiếu đến dữ liệu được gán nhãn cho nội dung, ý nghĩa, hoặc công dụng. 
Ví dụ : Trong một trang Web ta dùng những Tag Pairs (cặp nhãn hiệu mở đóng) để đánh dấu như
<BODY></BODY>. Hãy quan sát một trang Web dưới đây:
<HTML>
   <HEAD>
      <TITLE>Welcome To Lê Hưng</Title>
   </HEAD>
   <body>
       <H1>Ðịnh Nghĩa</H1>
       A: "Sao anh lại cắt dây điện ở phòng họp?"<BR>
       B: "Vì dây điện nhà tôi thiếu mất một khúc".<BR>
       A: "Như vậy là lấy công làm tư!" <BR>
       B: "Không, như vậy là lấy dài nuôi ngắn!" <BR>
  </BODY>
</Html>
 
Trong HTML Web page các Tag Pair đều được định nghĩa trước và không chứa đựng ý nghĩa gì về dữ kiện mà chúng kẹp bên trong, trừ trường hợp cho TITLE. Thí dụ H1 có nghĩa display hàng chữ bên trong (Ðịnh Nghĩa) theo cỡ lớn nhất, nhưng hàng chữ ấy có thể là bất cứ thứ gì, không nhất thiết phải là từ (Ðịnh Nghĩa) ở đây. Còn XML thì cho phép ta tự do đặt tên các Tag Pair để dùng khi cần. Nếu tính ra, Dynamic HTML có đến khoảng 400 Tags mà nếu muốn dùng ta phải nhớ hết. Trong khi đó, XML không có giới hạn về con số Tags và ta không cần phải nhớ Tag nào cả. Ý nghĩa của các Tag rất linh động và ta có thể sắp xếp các tags của XML theo loại cho hợp lý. Thí dụ muốn làm một trang XML về môn Văn học ta cần những Tag diễn tả nhân vật, ngày sinh, ngày tử,..
Những nhà phát triển sẽ cho các bạn biết rằng XML không phải là một ngôn ngữ mà là một hệ thống cho việc định nghĩa các ngôn ngữ khác. Có thể bạn đã nghe nói, hoặc thậm chí đã từng sử dụng một trong những ngôn ngữ này - ví dụ như CDF (Channel Definition Format) của Microsoft, cái mà ta có thể nhìn thấy ở channel bar trên màn hình desktop. W3C gọi XML là một cú pháp thông dụng cho việc biểu thị cấu trúc trong dữ liệu. Dữ liệu có cấu trúc tham chiếu đến dữ liệu được gán nhãn nội dung, ý nghĩa, hoặc công dụng. Ví dụ trái với nhãn <H1> trong HTML chỉ rõ văn bản được trình bày trong một kích thước và kiểu chữ nào đó, một nhãn XML sẽ nhận dạng rõ ràng loại thông tin: các nhãn <BYLINE> có thể nhận diện tác giả của một tài liệu, các nhãn <PRICE> có thể chứa giá thành của một mặt hàng của một mặt hàng trong danh sách hàng bán - tất cả đều đi đến <DOFOODBRAND> nếu đó là mức độ chi tiết được đòi hỏi.

Bằng cách tách rời cấu trúc và nội dung từ sự trình bày, tài liệu XML nguồn có thể được viết một lần, sau đó được trình bày dưới nhiều cách khác nhau: trên một màn hình máy tính, bên trong một mạng điện thoại, được dịch sang tiếng nói trên một thiết bị dành cho người khiếm thị,...Nó sẽ hoạt động trên bất kì những thiết bị liên lạc nào có thể được phát triển; một tài liệu XML do đó có thể vượt qua được sự tạo lập đặc thù và trình bày những kỹ thuật có sẵn khi nó được viết.

Như vậy, XML sẽ có một sự hoạt động bên ngoài Internet, ví dụ đáp ứng công nghệ xuất bản nói chung, và đặc biệt là đối với những người tạo lập những tài liệu được dự định xuất hiện qua nhiều phương tiện khác nhau. Một số nhà xuất bản tài liệu phạm vi rộng, những người đã từng sử dụng ngôn ngữ nâng cấp tiêu chuẩn tổng quát (SGML) qua nhiều năm, sẽ chuyển qua XML. Hơn nữa, XML nền tảng độc lập đã được phát triển cho Web, và đó là nơi nó sẽ chịu sự tác động lớn nhất.

Ý kiến bạn đọc