Tin tức
Tối ưu hoá tìm kiếm
12/08/2008

Sau vài tuần, website của bạn không hề được liệt kê trong bất kỳ cỗ máy tìm kiếm nào. Sau đó bạn bắt đầu nhận thấy rằng những chương trình con nhện (spider) và Robot cỗ máy tìm kiếm không thể truy nhập website bởi vì trang web của bạn không hề có flie robots.txt, hoặc có nhưng viết sai tham số!.

 

Làm sao để chắc chắn rằng những spiders của cỗ máy tìm kiếm có thể truy nhập website của bạn:


Những con nhện (spider) của cỗ máy Tìm kiếm không có đầy đủ chức năng của những trình duyệt như Microsoft Internet Explorer, Firefox hay Netscape Navigator. Thật ra, chương trình Robot của các cỗ máy tìm kiếm sử dụng những chương trình giống như trình duyệt văn bản bình thường. Chúng thích văn bản, văn bản, và nhiều văn bản hơn. Chúng lờ đi thông tin được chứa đựng trong những hình ảnh đồ họa nhưng chúng có thể đọc được phần mô tả văn bản

<IMG ALT>.

Điều này có nghĩa rằng những chương trình con nhện (spider) của cỗ máy tìm kiếm không thể sử dụng công nghệ trình duyệt để truy nhập website của bạn. Nếu những trang Web của bạn yêu cầu Flash, DHTML, Cookies, JavaScript, Java hoặc những mật khẩu để truy nhập trang, thì có thể những con nhện (spider) của cỗ máy tìm kiếm sẽ không thể chỉ số hóa website của bạn.

Tránh những ký tự đặc biệt trong URL của bạn:
Đa số các cỗ máy tìm kiếm gặp vấn đề khi chỉ số hóa những trang Web nếu URLs có chứa đựng những ký tự đặc biệt. Những ký tự đặc biệt sau được gọi là “Chặn bước spider của search engines”:

* ký hiệu (&)

* dấu đô la ( $)

* những dấu bằng (=)

* phần trăm (%)

* dấu hỏi (?)

Những đặc tính này thường được tìm thấy trong những trang Web động. Chúng báo hiệu chương trình lướt mạng của cỗ máy tìm kiếm là có thể có một vòng vô hạn của những khả năng cho trang đó. Đó là vì sao vài cỗ máy tìm kiếm lờ đi trang Web mà URLs có những đặc tính kể trên.

 

1.    Tối ưu hoá tiêu đề các trang web của bạn

 

Dưới đây là một số kinh nghiệm để coá thể tối ưu hoá các tiêu đề trang web:

+ Tiêu đề không nên quá dài. Các cỗ máy tìm kiếm sẽ không đưa các dữ liệu về trang web của bạn dài quá 60-70 ký tự, (bao gồm cả ký tự trống). Vì vậy, nếu các thông tin quá dài, nó sẽ cắt bớt đi.

+ Nội dung tiêu đề nên dùng những từ ngữ thật sự có liên quan và có tính mô tả, sao cho máy tìm kiếm cũng như người dùng đều có thể hình dung ra nội dung đích thực của trang web là gì.

+ Hãy cho mỗi trang web một tiêu đề riêng biệt. Nếu không, máy tìm kiếm có thể hiểu là website của bạn có những nội dung trùng lặp và không thể phân biệt các trang web với nhau.

+ Hãy thể hiện tiêu đề bằng những từ ngữ rõ nghĩa, chính xác, để máy tìm kiếm cũng như người dùng không cần phải đoán mò hặoc tưởng tượng về các nội dung của trang web

+ Không nên nhồi nhét quá nhiều các từ khoá vào nội dung tiêu đề

+ Đây là trích dẫn nguyên câu viết của một chuyên gia SEO trong việc xây dựng tiêu đề : “Một tiêu đề tốt gợi ra một cảm xúc, một câu hỏi hoặc hứa hẹn một điều gì đó”

 

2.    Meta element – các thông tin dẫn hướng

 

Metadata, một cách đơn giản nhất được hiểu là thông tin về dữ liệu. Trong phần này chúng ta sẽ cùng tìm hiểu về các thành phần meta và cách thức tối ưu hóa chúng cho các cơ chế tìm kiếm.

Các thẻ meta nằm trong phần <head> …… </head> của các trang HTML và các trang XML và dùng để chứa đựng các thông tin về từ khoá, mô tả nội dung của trang, về ngôn ngữ diễn đạt trong trang, về thưòi hạn của trang, về kiểu dữ liệu của trang… Nói tóm lại, là các thông tin về các dữ liệu được thể hiện trong trang.

+ Các thuộc tính từ khoá: cách đây khoảng > 10 năm, khi Internet mới phát triển, các công cụ tìm kiếm sử dụng từ khoá của các trang web để đánh chỉ số cho các trang web. Hiện nay, các từ khoá được sử dụng để tăng thứ hạng của website. Cách thể hiện thuộc tính từ khoá như sau:

<meta name="keywords" content="seochat, search engine optimization, tutorial"/>

 

+ Các thuộc tính về ngôn ngữ:

Như bạn đã biết, trang web được thiết kế bằng ngôn ngữ lập trình. Tuy nhiên, khái niệm về ngôn ngữ lập trình không liên quan gì đến thuộc tính ngôn ngữ đang đwocj đề cập đến ở đây. Thuộc tính ngôn ngữ ở đây là ngôn ngữ thể hiện nội dung các thông tin được thể hiện trong trang web và cỗ máy tìm kiếm cần biết điều này. Ví dụ, trang web của bạn có nội dung là một bài thơ viết bằng tiếng Pháp, thuộc tính ngôn ngữ sẽ được thể hiện như sau:

 

<meta http-equiv="Content-Language" content="FR">

 

Thông tin này cho phép máy tìm kiếm biết được một số thông tin như trang web của bạn được viết bằng tiếng Pháp và bạn thích ăn pho mat…

 

+ Thuộc tính mô tả

Thuộc tính này nhằm mục đích mô tả nội dung chính của trang web. Các cỗ máy tìm kiếm sẽ lưu các nội dung này và liệt kê ra khi người sử dụng tìm kiếm một thuật ngữ cụ thể nào đó. Nội dung của thuộc tính này không nên quá dài, chỉ nên giới hạn trong khoảng dưới 200 ký tự. Ví dụ :

 

<html>

<head>

<meta name="description" content="Tutorials on Search Engine Optimization by the best writer in the world, James Payne">

</head>

<body>

</body>

</html>

 

+ Thuộc tính Robot

 

Hoàn toàn không giống như nội dung của các file robot.txt, thuộc tính robot dùng để điều khiển các con bọ của cỗ máy tìm kiếm trong việc index trang web cụ thể này. Có thể tham khảo một số giá trị của thuộc tính này như sau:

  • Noindex – Không index trang này
  • Nofollow – Không link tới trang này
  • Noarchive – Không lưu cached copy của trang này
  • Nosnippet – Không hiện cached link trang web của bạn trong danh sách kết quả của Google.

 

Tóm lại, các thành phần quan trọng của trang web trong việc tối ưu hoá là:

 

Các thành phần quan trọng của trang web
Hiện nay, với nhiều công cụ thiết kế và lập trình web mới, bạn sẽ dễ dàng có được một website với các ngôn ngữ: ASP.Net, ASP, PHP, Java, hay chỉ là một trang HTML bình thường. Tuy vậy, dù bạn lập trình web bằng ngôn ngữ nào đi nữa, thì một trang web vẫn cần có những phần tử chính giống nhau. Những phần tử này được đặt trong mã HTML của trang web. Việc quyết định sử dụng các thành phần website này như thế nào có thể làm cho trang web của bạn đạt kết quả cao hay thấp trong việc xếp hạng. OnBoom có thể giúp bạn tối ưu hóa mọi thành phần liên quan trong trang web để chúng phát huy hiệu quả cao nhất giúp cho việc tìm kiếm của các cỗ máy tìm kiếm dễ dàng nhất.

Title (tiêu đề):


Tiêu đề của một trang web là dòng chữ nằm trong thẻ HTML sau: <title>…</title>. Ví dụ: <title>Tiêu đề trang web của bạn</title>
Các Search Engines như Yahoo!, MSN, Altavista, Alltheweb đặc biệt coi trọng thẻ HTML này. Dòng chữ tiêu đề (Title) thậm chí còn quan trọng hơn cả thẻ từ khóa và thẻ miêu tả! Khi khách truy cập nhập vào một từ khóa hay một mệnh đề từ khóa, thì trước hết, các cỗ máy tìm kiếm nêu trên sử dụng giải thuật tìm kiếm tìm trên tất cả các dòng tiêu đề của tất cả website trong danh bạ của nó. Nếu phát hiện thấy từ khóa hay cụm từ xuất hiện trong dòng tiêu đề của trang web nào đó, các cỗ máy tìm kiếm này sẽ ưu tiên đưa những kết quả này lên trước.

Meta Keywords tag (thẻ từ khóa):


Meta Keywords tag là nơi xác định những từ, cụm từ khóa quan trọng nhất của trang web mà bạn cho là khách hàng sẽ dùng để tìm kiếm (tìm đến trang web của bạn). Nó nằm trong thẻ: <head>…</head> của mã HTML ở trang web của bạn.
Ví dụ: <meta name=”keywords” content=”từ khóa 1, từ khóa 2,…”>
Lựa chọn được những từ khóa tốt là yếu tố quan trọng hàng đầu đối với bất kỳ trang web nào muốn có được kết quả xếp hạng cao. Hầu hết các cỗ máy tìm kiếm tìm ra các trang web thông qua các từ hoặc cụm từ khóa xác định. Ví dụ, website của bạn quảng bá cho mặt hàng hoa tươi thì từ khóa có thể là "hoa tươi", "hoa tuoi", "hoa dat lat", "hoa hong do", "hoa lan rừng".... Tuyệt đối không nên sử dụng các từ khóa đơn, vì dụ như "hoa", "lan", "cúc",... vì những từ khóa đơn không được sự ủng hộ của các Search Engines - đó là chưa kể từ khóa càng ngắn bao nhiêu, càng phổ thông bao nhiêu thì cuộc chiến cạnh tranh giành vị trí của bạn càng cam go bấy nhiêu. Lời khuyên được đưa ra từ các cỗ máy tìm kiếm là bạn nên sử dụng những từ khóa hoặc mệnh đề từ khóa có từ 3 từ trở lên, ví dụ "hoa hồng đỏ" - thay vì sử dụng mỗi từ khóa "hoa".

Meta Description tag (thẻ mô tả):


Thẻ meta description là nơi để bạn mô tả những gì mà website của bạn muốn thể hiện một cách cô đọng nhất, súc tích nhất. Có một số cỗ máy tìm kiếm hiển thị dòng mô tả này bên dưới kết quả tìm kiếm. Điều đó có nghĩa là bạn có thể tác động vào kết quả tìm kiếm thông qua việc biên tập thật tốt phần mô tả này.
Ví dụ: <meta name=”description” content=”Phần mô tả về website của bạn.”>
Một website muốn thu hút sự chú ý của người truy cập Internet, ngoài việc luôn định vị ở thứ hạng đầu tiên trong các kết quả tìm kiếm thì phần mô tả phải hay, hấp dẫn và giàu ý nghĩa biểu cảm. Nhiều doanh nghiệp - đặc biệt là các doanh nghiệp nước ngoài thường thuê một chuyên gia giỏi viết phần mô tả cho website của mình. Đây chính là phần hiển thị bên dưới tiêu đề mỗi kết quả tìm kiếm.
Thẻ Meta Description được các Search Engines chú ý đưa vào danh bạ Index của chúng. Nếu một website được lập trình mạnh, đẹp nhưng thiếu thẻ Meta Description thì rất khó nhận được những kết quả tìm kiếm khả quan, bởi vì khi khách truy cập gõ vào dòng Search của một cỗ máy tìm kiếm bất kỳ một từ khoá thì kết quả là có hàng trăm, hàng ngàn, thậm chí hàng triệu kết quả được tìm thấy. Với tâm lý chung của mọi người, dù có cái gì đó dập ngay vào mắt, nhưng nếu nó thiếu hấp dẫn, không gây được tò mò thì cũng chẳng mấy khi nó được mọi người nhòm ngó. Như vậy, dù website của bạn được liệt kê ở dòng đầu tiên, nhưng với một dòng miêu tả rời rạc, luộm thuộm, thiếu cuốn hút thì cũng sẽ chẳng có ai thèm kích vào đường link của bạn! Các Search Engines biết điều này nên chúng khuyến khích các website có các dòng miêu tả ngắn gọn, súc tích nhưng phải hàm chứa đầy đủ ý nghĩa và giàu cảm xúc. Đây thực sự là công việc khó khăn, không nhiều người làm được. Tóm lại, website của bạn rất cần một thẻ miêu tả (Meta Description tag) tốt làm tiền đề cho việc đăng ký vào các Search Engines sau này.



Body Text (Nội dung):


Là phần nội dung được nhìn thấy khi mở trang web bằng một trình duyệt. Nó không chứa các dòng lệnh HTML hay các lời giải thích. Những dòng chữ hữu hình này là thành phần mà các cỗ máy tìm kiếm có thể nhập vào danh mục tìm kiếm của chúng. Body Text là thành phần cực kỳ quan trọng đối với giải thuật tìm kiếm của các cỗ máy tìm kiếm.


Một ví dụ dễ thấy là ngay tại trang web mà bạn đang đọc này, phần nội dung bạn đang xem chính là Body text. Các Search Engines đặc biệt coi trọng phần này - và đây cũng là phần quan trọng nhất - yếu tố sống còn của một trang web. Nếu bạn có từ khoá tốt; nếu bạn có thẻ miêu tả tốt, nếu bạn có tiêu đề hay nhưng phần nội dung văn bản - Body text mà dở, nghèo nàn và lủng củng thì kết quả cũng bằng không. Đối với các Search Engines, khi sử dụng các giải thuật như Robot, Spider để lần tìm, sắp xếp, đánh giá và lập danh bạ cho các website thì phần thông tin thu lượm được coi là quan trọng nhất chính là nội dung văn bản - Body Text. Đây là lý do vì sao các website có quá nhiều hình ảnh đồ hoạ nhưng lại có quá ít nội dung văn bản thường bị xếp nằm ở "chiếu dưới" trong các kết quả tìm kiếm từ các Search Engines. Ngược lại, những trang web luôn được đưa lên đầu bảng danh sách kết quả lại thường là các trang web giàu nội dung (văn bản), hình ảnh hạn chế. Điển hình cho ví dụ này là những trang báo điện tử. Nhiều trang web dạng này thậm chí không có thẻ Meta Description, thẻ Meta Keywords! Bí quyết ở đây một phần là nhờ chúng có quá nhiều nội dung văn bản trong phần Body Text!


Có một điều lưu ý nhỏ: Nếu website của bạn đã lỡ thiết kế quá nhiều hình ảnh, thì song song với việc bạn tìm cách giảm bớt hình ảnh minh hoạ, bạn cần phải thêm nội dung văn bản (càng nhiều càng tốt). các Search Engines thích văn bản và chỉ văn bản mà thôi.



Câu đầu tiên trong phần nội dung:


Câu đầu tiên trong phần nội dung là câu văn nằm ngay sau thẻ <body> của mã HTML trong trang web. Nhiều cỗ máy tìm kiếm đưa ra các mối quan hệ nhằm giới hạn tìm kiếm thường thể hiện câu đầu tiên này trong kết quả mà chúng tìm được. Một vài cỗ máy tìm kiếm đã sử dụng câu đầu tiên của body text làm phần miêu tả cho kết quả mà nó tìm thấy được.
Lưu ý rằng, câu đầu tiên trong phần nội dung không nhất thiết phải là phần hữu hình mà người xem có thể nhìn thấy được. Phần quyết định thuộc về người thiết kế, và câu đầu tiên có thể được đặt ở bất cứ đâu trong trang web của bạn.
Các cỗ máy tìm kiếm tin rằng, câu đầu tiên dù nằm cuối phần nội dung thì giá trị của nó vẫn không hề thay đổi, bất chấp vị trí hiện thời của nó.
Ví dụ: <body>Đây là nội dung câu đầu tiên. Phần này không phải là câu đầu tiên.

Headlines (Đầu dòng, tiêu đề, đề mục):


Dòng tiêu đề, đề mục H1 là dòng chữ được viết giữa thẻ: <h1>…</h1> của dòng mã HTML trong trang web.


Nhiều cỗ máy tìm kiếm đưa ra các tiêu chuẩn tìm kiếm mở rộng lại lấy dòng chữ này làm phần hiển thị trong kết quả tìm kiếm.
Ví dụ: <h1>Nội dung dòng đề mục với khổ chữ lớn</h1
Các trang web còn nhiều thành phần khác nữa. Mỗi thành phần lại có thể tác động đến kết quả xếp hạng của trang web. Những thành phần thêm nhập vào có thể được tìm thấy ở một trang web (gọi là những nhân tố trong trang web), kết quả xếp hạng cũng bị tác động bởi những nhân tố bên ngoài.
Như vậy, chúng ta hoàn toàn có thể tác động vào trang web của mình để nó được dễ dàng tìm thấy bởi các Search Engines. Đó chính là quá trình SEO (Search Engine Optimization).

Ý kiến bạn đọc