Chữ Nôm trên đường hội nhập
với khu vực và thế giới

Giáo sư Nguyễn Quang Hồng

Đặc San Nhịp Sống

1.

Trong khoảng mươi năm cuối cùng của thế kỉ XX trở lại đây, chữ Hán và những hệ thống chữ viết biểu ý tương tự ở các nước Á Ðông đã trở thành đối tượng thu hút sự chú ý của các chuyên gia quan tâm tới công nghệ thông tin trên thế giới. Quả thật, sau các hệ thống chữ viết phiên âm bắt nguồn từ hệ chữ cái La-tinh, Hi Lạp, A-rập, mà những vấn đề tin học hóa cho chúng về cơ bản đã được giải quyết, thì khối văn tự đồ sộ và đầy rẫy những nét đặc thù, lại có số người sử dụng khá lớn trên thế giới, là chữ Hán và các lối chữ ô vuông theo kiểu Hán tự, sẽ là mục tiêu công phá của tin học và công nghệ thông tin hiện đại.

Mối quan tâm đó của các chuyên gia tin học và công nghệ thông tin đối với các hệ thống văn tự ô vuông biểu ý thể hiện trước hết ở các cuộc thảo luận của nhóm CJK (gồm đại diện của China, Japan và Korea, tức là Trung Quốc, Nhật Bản và Hàn Quốc), nằm trong Tổ chức Tiêu chuẩn hóa Quốc tế ISO (International Standard Organization). Từ tháng 10-1993, nhóm này chuyển thành nhóm IRG (Ideographic Rappoteur Group), với chương trình làm việc dày dặn hơn và thường xuyên hơn, mỗi năm nhóm họp chính thức 2 kì. Ngoài 3 nước kể trên, nhóm IRG có thêm sự tham gia của đại diện các nhà chuyên môn về văn tự và tin học từ Ðài Loan, Việt Nam, Hong Kong, Hoa Kì, sau này có cả Singapore và cuối cùng, vào năm 2000, bắt đầu có đại diện của (Bắc) Triều Tiên.

Trong kết quả của sự hợp tác chặt chẽ giữa các nhà chuyên môn trong nước (ở Viện Hán Nôm, Viện Công nghệ Thông tin và Trung tâm Tiêu chuẩn Ðo lường Chất lượng) với các chuyên gia người Việt ở nước ngoài (nhóm Tiến sĩ Ngô Thanh Nhàn ở Mĩ), Việt Nam ta đã chính thức tham gia vào chương trình hoạt động của nhóm IRG từ đầu năm 1994 trong cuộc họp lần thứ 2 của nhóm này ở Hà Nội. Tại cuộc họp IRG#2 này, chữ Nôm của Việt Nam bắt đầu được đưa vào chương trình nghị sự của IRG trong tổ chức ISO của quốc tế.
 

2.

Mục tiêu trực tiếp nhất mà nhóm IRG muốn đạt tới là cùng nhau xác lập một kho chữ vuông biểu ý được tiêu chuẩn hóa và được thống nhất công nhận từ phía các thành viên có chủ quyền trong nhóm IRG đối với loại văn tự này. Kho chữ này phải làm sao bao gồm được hầu hết các đơn vị chữ và cả những biến thể của chúng, đã và đang được sử dụng phổ biến ở từng quốc gia vốn là chủ nhân của các thứ văn tự loại này. Dựa trên kết quả làm việc của nhóm IRG, Tổ chức ISO quốc tế sẽ cấp kí mã cho từng chữ một, sau khi đã giao cho các nhóm công tác chuyên trách rà xét cẩn thận.

Trên cơ sở một kho chữ vuông biểu ý được chuẩn hóa và được thống nhất cấp mã quốc tế như vậy, các nhà công nghệ trong lĩnh vực in ấn và thông tin có thể sẽ sáng chế ra những thiết bị và những chương trình thích hợp để sử dụng rộng rãi chúng trong mọi lĩnh vực tạo lập, lưu trữ và trao đổi thông tin.
 

3.

Ðể thực hiện các mục tiêu trên đây, chương trình nghị sự của nhóm IRG bao gồm một loạt các nội dung công việc sau đây mà mỗi thành viên trong nhóm đều phải góp phần thực hiện:

3.1.

Xác định đối tượng chữ được đưa vào kho chữ chung. Cần phải phân biệt mấy khía cạnh khác nhau về đối tượng "nhập kho":

  1. Chữ và biến thể của chữ. Các đơn vị chữ vuông riêng biệt đại diện cho các ngữ tố khác nhau đương nhiên sẽ là đối tượng hàng đầu của việc nhập kho chữ chung. Tuy nhiên, để đáp ứng những nhu cầu khác nhau, đôi khi là rất tế nhị trong thông tin trên mặt chữ, người ta không ngần ngại thu nạp vào kho chữ chung này cả những dị thể hay biến thể của một đơn vị văn tự, và sẵn sàng cấp cho chúng những kí mã khác nhau. Bởi vậy mà ở đây không có sự "phân biệt đối xử" chữ phồn thể với chữ giản thể, mặc dầu các chữ Hán giản thể không xếp chen lẫn với chữ Hán phồn thể, mà đều xếp nối vào sau toàn bộ các chữ phồn thể của cùng một bộ thủ.
     
  2. Bộ thủ và bộ kiện của chữ. Mới đầu, các thành viên nhóm IRG chỉ quan tâm đưa các chữ vuông nguyên vẹn vào kho chữ chung. Về sau, người ta thấy cần thiết phải lập một danh sách riêng cho 214 bộ thủ truyền thống (theo Khang Hi tự điển). Bên cạnh đó còn xác lập một danh sách gồm 116 các biển thể hay dị thể của các bộ thủ, gọi là "bộ kiện" (CJK Radical Supplement). Các bộ thủ và bộ kiện này đều được cấp mã quốc tế như những kí tự riêng biệt.

Các biến dạng của chữ và bộ thủ tùy theo thể loại thư pháp (Triện, Lệ, Hành, Thảo v.v.) dĩ nhiên sẽ không làm thành đối tượng nhập kho để mã hóa, bởi vì đó đều là những gì mà phần mềm của máy tính điện tử có thể xử lí được trên cơ sở một dạng chữ minh xác và chuẩn mực đã được cấp mã.
 

3.2.

Phân chia lớp hạng ưu tiên để nhập chữ vuông biểu ý vào kho. Trên đại thể, nhóm IRG đã phân biệt các lớp hạng sau đây:

  1. Cần ưu tiên đưa vào kho và cấp mã đối với những chữ hiện đang còn được sử dụng phổ biến ở các nưóc trong khu vực đồng văn Hán tự. Ðó là những chữ thuộc lớp A.
     
  2. Thứ đến là những chữ đang được các nước trong khu vực sử dụng nhưng không thường xuyên và ít phổ biến. Ðây là những chữ thuộc lớp B, sẽ được chuẩn hóa và đưa vào kho để lập mã sau khi đã lập mã xong cho các chữ thuộc loại A nói trên. Những chữ Nôm do người Việt tự tạo trên đại thể là thuộc vào lớp hạng B này.
     
  3. Những chữ cổ hoặc thuần túy địa phương, chỉ đôi khi xuất hiện trong những văn bản hạn hẹp, được xếp vào lớp hạng C. Những chữ thuộc lớp hạng này sẽ được chiếu cố xem xét đến để nhập kho cấp mã, sau khi đã lập mã xong cho các lớp chữ A và B, mà vẫn còn chỗ cho chúng trong bảng mã chữ vuông chung.
     

3.3.

Xác định nguồn chữ để đưa vào kho chữ chung. Các nước thành viên của IRG đã nhất trí như sau:

  1. Ðối với chữ Hán nguyên gốc, lấy Tự điển Khang Hi (in lần thứ 7 tại Bắc Kinh) làm nguồn chính. Và tự điển này cũng là căn cứ để tham chiếu các tự điển và tư liệu làm nguồn khác của tất cả các nước thành viên IRG.
     
  2. Ðối với chữ Hán được sử dụng ở các quốc gia, thì dựa theo sự lựa chọn và đề nghị của các nước thành viên hữu quan, nhưng phải được rà xét và thông qua tại các hội nghị của nhóm IRG. Hầu hết những chữ Hán có mặt trong trong các bộ tự điển sau đây đã được IRG thừa nhận cho vào kho chữ chung và được cấp mã theo lớp hạng A:- Hanyu Dazidian của Trung Quốc (in lần thứ nhất).- Daikanwa Jiten của Nhật Bản (in lần thứ 9).- Daejaweon của Hàn Quốc (in lần thứ nhất).- Tự điển chữ Nôm (Sài Gòn, 1971) và Bảng tra chữ Nôm (Hà Hội, 1976) của Việt Nam.
     
  3. Ðối với những chữ vuông được các quốc gia tự tạo ra để dùng cho tiếng bản ngữ, thì ngoài những tự điển ở (b), còn có thể sử dụng thêm các nguồn tư liệu khác nhau. Việc bổ sung này được đặt ra từ đầu năm 1998, khi kho chữ được mở rộng sang lớp hạng B và C. Danh sách các tư liệu này do từng nước đề nghị và được nhóm IRG thống nhất chấp nhận vào tháng 5-1998, gồm 107 tên tư liệu, trong đó có 40 tác phẩm bằng chữ Nôm do Việt Nam đề nghị. 
     

3.4.

Xác lập quy tắc mã hóa và thể thức lập bảng chữ vuông chung.

  1. Quy tắc mã hóa. Mỗi nước thành viên IRG, sau khi thu thập các chữ vuông cần lập bảng chữ đề nghị nhập kho, trong đó mỗi chữ phải được mã hóa theo hệ mã nội bộ và sắp xếp theo một thứ tự nhất định. Ví dụ: với chữ Nôm ba chúng ta cấp mã nội bộ (V-code) là V0-354F, được xác định là thuộc bộ "nhất" (vì chữ "tam" thuộc bộ "nhất"), với 6 nét (không tính bộ thủ), như vậy chiếu vào Khang Hi tự điển thì chữ Nôm này sẽ được định vị là 0078.131 (nghĩa là nó được xếp tiếp theo sau chữ thứ 13 ở trang 78 của tự điển này). Theo đó, chữ Nôm này sẽ được đề nghị cấp mã trong bảng mở rộng Extension B là 2-0027 và đồng thời là mã quốc tế (Unicode) trong ISO/IEC-10646.
     
  2. Thể thức lập bảng. Tất cả những chữ do các nước thành viên đề nghị, sau khi đã được IRG chấp thuận, thì được sắp xếp vào một bảng chữ chung, mà thực chất đó là một cuốn tự điển thu nạp toàn bộ các chữ vuông đã qua chuẩn hóa và được cấp mã quốc tế. Tập chữ này được gọi là SuperCJK, được bắt đầu soạn thảo từ đầu năm 1998, qua hàng chục lần điều chỉnh và bổ sung, đến cuối năm 2000 với bảng SuperCJK 11.1, tổng số chữ vuông được thu nạp và cấp mã quốc tế là 70205 chữ (trong đó có 9299 chữ do Việt Nam cung cấp). Trong tập SuperCJK này, các chữ được xếp thứ tự theo bộ thủ và theo mã số Khang Hi đã được định vị, và mỗi chữ đều được ghi rõ mã nội bộ, mã quốc tế như trên đã trình bày.
     

4.

Chữ Hán vốn đã phức tạp và đa dạng, mà chữ vuông theo kiểu Hán tự được sử dụng ở các nước trong khu vực lại càng đa dạng và phức tạp hơn. Làm việc với một khối lượng chữ đồ sộ mà lại phức tạp và đa dạng như thế, quả thực là vô cùng lí thú và cũng vô cùng... vất vả. Công việc này không những đòi hỏi khả năng chuyên môn cao trong lĩnh vực văn tự học và tin học, mà cũng cần đến một tinh thần nghiêm túc, chu đáo và nhẫn nại trên từng nét chữ, từng con số từ lúc bắt đầu cho đến khi kết thúc công việc đặt ra theo mục tiêu đã định. Trên từng khâu công việc cụ thể, có sự khác biệt trong cách xử lí giữa các thành viên, và cũng không tránh khỏi những thiếu sót và sơ suất khi soạn thảo, thẩm định và in ấn các hình chữ và mã chữ. Do đó trong các phiên họp chính thức cũng như thông qua thư từ điện tử, giữa các thành viên IRG luôn luôn có sự trao đổi, thảo luận, bổ sung, điều chỉnh. Và nhiều khi cũng phải có sự nhân nhượng lẫn nhau để có thể đạt tới một giải pháp chung được đa số chấp nhận. Ðiều này thường xảy ra khi gộp hay tách các hình chữ, khi quy bộ thủ hoặc tính đếm số nét cho từng trường hợp cụ thể. Riêng đối với chữ Nôm của Việt Nam, thì đây là lần đầu tiên được đem ra đối chiếu từng chữ một với chữ vuông biểu ý của các nước trong khu vực đồng văn Hán tự. Trong khi đó thì việc nghiên cứu cơ bản về chữ Nôm còn chưa thật sâu sắc, cũng như bản thân chữ Nôm hầu như chưa được thực sự chuẩn hóa trong lịch sử phát triển của mình. Bởi vậy mà đã có không ít vấn đề phải xem xét và xử lí một cách kịp thời để không cản trở tiến độ chung của công việc.

Hoạt động của nhóm IRG trong Tổ chức ISO quốc tế diễn ra đều đặn và khẩn trương từ đầu thập niên cuối cùng của thế kỉ XX đến nay, đã trải qua 18 phiên họp chính thức và một số kì họp dành riêng cho nhóm biên tập các bảng chữ. Trong đó, thành viên Việt Nam đã tham gia gần đủ các phiên họp chính thức, chỉ trừ phiên họp thứ 5 (IRG#5) họp tại Hàn Quốc (tháng 11/1995) là không có mặt đại diện của Việt Nam. Ðiều đáng tiếc là chính trong kì họp này, đề nghị đổi tên gọi bảng chữ tổng hợp "CuperCJK" thành "CuperCJKV" do Việt Nam nêu ra từ trước đó đã bị bỏ qua (vì không có thành viên Việt Nam tại kì họp để bảo vệ đề nghị họp lí này). Tuy nhiên, đây cũng chỉ là chuyện tên gọi, còn thực chất thì trong các bảng tổng hợp kho chữ của IRG vẫn dành riêng cho chữ Nôm một cột V bên cạch các cột của K (Korea) J (Japan), G (guobiao- Trung Quốc), T (Taiwan), H (Hong Kong). Và khi bảng chữ không chia cột, thì các kí hiệu V, J, K, v.v. cũng được ghi rõ ở ô chữ được mã hóa.
 

5.

Trong suốt quá trình tham gia chương trình hoạt động cùng nhóm IRG, các chuyên gia Việt Nam đã lần lượt soạn thảo 4 bảng chữ Nôm chuẩn để cung cấp cho IRG với ý thức tranh thủ đưa chữ Nôm vào kho chữ chung ISO/IEC-10646 càng nhiều càng tốt (mà cái ý thức này thì các thành viên khác trong nhóm IRG cũng không thua kém, vì quyền lợi lâu dài của đất nước và dân tộc mình). Các bảng chữ Nôm chuẩn của Việt Nam lần lượt được đánh số là V0, V1, V2, V3 (và hiện đang gấp rút hoàn thành thêm bảng V4 và V5):

  • V0: Ðây là bộ mã chuẩn 16-bit chữ Nôm do Ban Kĩ thuật Công nghệ Thông tin tổ chức soạn thảo, Tổng cục Tiêu chuẩn Ðo lường Chất lượng xét duyệt và được Bộ Khoa học Công nghệ và Môi trường công bố năm 1993 (TCVN 5773:1993). Với bộ mã chuẩn chữ Nôm này, Việt Nam đã đăng kí tham gia chương trình nghị sự của nhóm IRG vào dịp nhóm này họp thường kì lần thứ 2 tại Hà Nội đầu năm 1994. Bảng chữ Nôm chuẩn này gồm 2357 chữ, trong đó có hơn 70% là chữ Nôm không trùng hình với chữ Hán.
     
  • V1: Cũng là bộ mã chuẩn 16-bit chữ Nôm do Ban Kĩ thuật Công nghệ thông tin tổ chức biên soạn, Tổng cục Tiêu chuẩn Ðo Lường Chất lượng xét duyệt và Bộ Khoa học Công nghệ Môi trường công bố năm 1995 (TCVN 6056:1995). Bộ chữ này thu thập tất cả 3361 chữ Nôm hoàn toàn trùng hình với chữ Hán (có mặt trong Khang Hi tự điển).

    Trong suốt các phiên họp và các cuộc tiếp xúc với đồng nghiệp các nước trong nhóm IRG từ năm 1995 đến 1997 các chuyên gia Việt Nam đã cố gắng cộng tác để đưa các chữ Nôm trong 2 tập chữ trên đây vào kho chữ vuông chung ISO/IEC-10646. Sau khi rà xét đối chiếu lại giữa V0 và V1, thấy có 38 chữ trùng lặp phải loại bỏ. Số còn lại của cả hai bảng chữ, có 3897 chữ được chính thức đưa vào ISO/IEC-10646 từ giữa năm 1997. Sau đó còn có thêm 128 chữ Nôm cũng được cấp mã trong bảng chữ mở rộng Extension A của IRG. Như vậy là từ cuối năm 1997, có 4025 chữ Nôm (trùng hình với chữ Hán) được đề nghị cấp mã ISO/IEC-10646. Kết quả này được khẳng định tại cuộc họp thường kì IRG#10 tại thành phố Hồ Chí Minh tháng 12/1997. Ðến đây, nhóm IRG cũng kết thúc giai đoạn I của chương trình, chủ yếu dành cho việc xem xét cấp mã cho các chữ vuông thuộc lớp hạng A.

    Từ năm 1998, nhóm IRG chuyển sang giai đoạn II là giai đoạn xem xét và cấp mã cho các chữ thuộc lớp hạng B. Ðây là dịp chữ Nôm thuần Việt có nhiều khả năng được chấp nhận hàng loạt vào kho chữ chung, vì những chữ trùng hình với chữ Hán về cơ bản đã được thu nạp rồi. Vả lại không gian mã hóa mới dành cho giai đoạn II là rất lớn (đến 64565 vị trí mã), cho nên hầu như không phải tranh chấp ưu tiên cấp mã nữa. Việc soạn thảo và phê duyệt các tập chữ vuông chuẩn ở từng nước thành viên trong giai đoạn này cũng được đơn giản hơn về mặt thủ tục, Nguồn chữ không nhất thiết phải là các tự điển, mà có thể là nhiều ấn phẩm khác nhau. Theo đó, các chuyên gia ở Viện Hán Nôm và Viện Công nghệ Thông tin đã khẩn trương soạn thảo thêm 2 tập mã chữ Nôm chuẩn để làm việc với nhóm IRG trong giai đoạn mới:
     
  • V2: Tập chuẩn chữ Nôm này do Viện Nghiên cứu Hán Nôm xét duyệt và gửi tới nhóm IRG ngày 17/4/1998. Cũng như hai tập chữ V0 và V1, nguồn chữ mà V2 thu thập vẫn là hai bộ tự điển chữ Nôm đã nói ở trên (Sài Gòn, 1971 và Hà Nội, 1976). Tập chữ Nôm này gồm 3371 chữ, trong đó có 844 chữ là bổ sung vào những vị trí tương ứng trong Extension A (trùng với chữ Hán và chữ các nước khác, đã được cấp mã), còn lại 2527 chữ (hầu hết là chữ thuần Nôm) là đăng kí cấp mã trong bảng Extension B.
     
  • V3: Tập chuẩn này cũng do Viện Nghiên cứu Hán Nôm xét duyệt và gửi tới nhóm IRG ngày 7/5/1998. Tất cả 849 chữ hầu hết là thuần Nôm được thu thập vào tập chuẩn này là lấy từ 40 tác phẩm và tự điển khác nhau.

    Sau 2 năm làm việc tiếp theo (đầu năm1998 đến cuối năm 2000), có thêm 5274 chữ Nôm nữa (chủ yếu từ V2, V3 và một phần còn lại của V0 và V1) được thu nạp vào Extension A và Extension B của IRG để cấp mã ISO/IEC-10646. Tổng cộng lại, như trên đã nói, đến cuối năm 2000 trong bảng tổng hợp CuperCJK-11.1 (in ngày 21/11/2000) có mặt tất cả 9299 chữ mang tên Việt Nam (với kí hiệu V0, V1, V2, V3). Trong đó có 4232 chữ là những chữ Nôm không trùng hình với chữ Hán.

    Tuy nhiên, nhóm IRG không muốn dừng tại đây, mà tiếp tục khuyến khích các nước thành viên cung cấp thêm các tập chữ thuộc lớp hạng C, và cả những chữ còn bỏ sót, để lập thêm Extension C. Tất cả các nước thành viên đều hưởng ứng khuyến nghị này và bắt đầu từ cuộc họp nhóm IRG#17 (6/2001 tại Hong Kong) đã đăng kí thêm chữ của họ. Các chuyên gia Việt Nam hiện đang khẩn trương hoàn thành tập chuẩn V4, gồm hơn 2500 chữ thuần Nôm, trong đó có khoảng 400 chữ Nôm Tày (không trùng với chữ Hán và chữ Nôm Việt, thu thập từ công trình nghiên cứu văn hóa Tày của Giáo sư Nguyễn Văn Huyên và Từ điển chữ Nôm Tày của Triều Ân). Cùng với tập mã chữ Nôm V4, tập mã chữ Nôm V5 cũng đang được chuẩn bị nhằm bổ sung vào CuperCJK mã Việt Nam cho gần 1000 chữ Nôm trùng hình với các nước khác. Công việc rà xét và cấp mã cho chúng sẽ được nhóm IRG thực hiện trong thời gian 2002-2003. Như vậy, nếu mọi việc tiến triển như dự kiến, thì cuối năm 2003, tổng số chữ Nôm của Việt Nam hội nhập vào kho chữ vuông biểu ý của khu vực và quốc tế với mã của ISO/IEC-10646 sẽ lên tới con số hơn 12000 chữ (khoảng 50% là chữ thuần Nôm, không trùng hình với chữ vuông của các nước khác).
     

6.

Với số lượng hơn 12000 chữ Nôm được chuẩn hóa và cấp mã quốc tế như vậy, hoàn toàn có thể xúc tiến việc chế tạo ra các phông chữ Nôm để ứng dụng cho các phần mềm máy vi tính, từ đó có thể thực hiện được việc phiên chuyển, tái tạo hoặc tạo lập các văn bản chữ Nôm, truyền đạt và truy cập các thông tin dưới dạng chữ Nôm qua máy tính điện tử.

Trong khi các tổ chức, các công ti tin học và công nghệ thông tin lớn ở nước ta chưa thực sự lưu tâm đến những vấn đề như thế, thì từ nhiều năm nay, một số tổ chức và công ti nước ngoài đã quan tâm đến những triển vọng như vậy đối với chữ Nôm, song song với quá trình hội nhập chữ Nôm vào kho chữ vuông biểu ý của khu vực và quốc tế. Thông qua những mối quan hệ chuyên môn đạt được giữa các chuyên gia Việt Nam là thành viên của nhóm IRG (Giáo sư Nguyễn Quang Hồng và Kĩ sư Ngô Trung Việt) với một số đồng nghiệp nước ngoài, đến cuối năm 2000 đã có hai cơ sở nước ngoài tự nguyện thực hiện bước đầu vẽ phông cho chữ Nôm. Ðó là Hội Văn Tự Kính ở Tokyo (Nhật Bản) và Công ti DynaLab của Ðài Loan (đóng tại Thượng Hải). Toàn bộ 9299 chữ Nôm có mặt trong CuperCJK đã được cả hai cơ sở này vẽ phông đầy đủ theo các chuẩn mực đặt ra cho chữ vuông biểu ý nói chung. Với điều kiện kĩ thuật và kinh nghiệm vẽ chữ còn rất hạn chế ở nước ta hiện nay, khó lòng có thể thực hiện được tốt một công việc đồ sộ và phức tạp như vậy. Tuy nhiên, với cả 2 bộ phông chữ Nôm này, vẫn cần được rà soát một cách cẩn thận và tiếp tục gia công, chỉnh lí cho hoàn thiện hơn nữa.

Sau khi đã có được những bộ phông chữ Nôm hoàn chỉnh rồi, thì một công việc phức tạp đặt ra cho các chuyên gia chữ Nôm và chuyên gia tin học là làm sao tạo ra được các chương trình ứng dụng chúng, chuyển các phông chữ Nôm đó thành các đĩa mềm có thể cài đặt vào máy vi tính để sử dụng chữ Nôm như hiện nay người ta đã sử dụng được đối với chữ Hán. Một hướng xử lí thích hợp đối với chữ Nôm trong công việc này là sử dụng âm đọc của chữ Nôm theo chữ Quốc ngữ hiện hành để làm "chìa khóa" mở gọi một chữ nào đó khi cần thiết. Tính phức tạp của cách xử lí này là mỗi chữ Nôm thường có nhiều âm đọc khác nhau, và ngược lại, một âm đọc có thể tương ứng với nhiều chữ Nôm khác nhau. Xác lập cho đầy đủ và chính xác mối tương ứng giữa âm và hình của từng chữ Nôm là câu chuyện không đơn giản chút nào, mặc dù không phải là không thực hiện được (tương tự như người ta đã làm việc này đối với chữ Hán). Dĩ nhiên cũng có thể tìm kiếm những cách xử lí khác nữa để lập "chìa khóa" tra tìm chữ Nôm, như căn cứ vào bộ thủ hoặc theo các mô hình cấu tạo của chữ Nôm chẳng hạn, mặc dù cách này có thể còn rối ren hơn nhiều. Cũng cần nói thêm rằng, mặc dù hầu như toàn bộ số chữ Nôm đã và đang đi vào kho chữ vuông quốc tế là được thu thập từ các nguồn tư liệu chữ Nôm tiếng Việt, song có khá nhiều chữ Nôm Tày là trùng hình với chữ Nôm Việt (và cả với chữ Hán). Bởi vậy, nếu đối với những chữ trùng hình như thế cũng tiến hành xác lập các âm đọc tương ứng trong tiếng Tày, thì cùng với những chữ thuần Nôm Tày trong V4 đang được đăng kí cấp mã, ở một mức độ đáng kể cũng có thể lợi dụng vốn chữ Nôm Việt đã có cho tiếng Tày.

Như có thể thấy, chữ Nôm của Việt Nam đã có được những bước đi vững chắc trên đường hội nhập với khu vực và thế giới. Con đường tin học hóa chữ Nôm bước đầu đã được khai thông, Và từ đây, từ đầu thế kỉ mới chúng ta có thể nghĩ tới và nhanh chóng thực hiện những bước tiếp theo để hệ thống văn tự cổ truyền này chẳng những sẽ được bảo tồn vững chắc, mà còn có khả năng đi vào cuộc sống mới, thực sự làm một chiếc cầu nối quá khứ với hiện tại và tương lai của các dân tộc Việt Nam.

Giáo sư Nguyễn Quang Hồng
 

Tài liệu tham khảo chính:

1. Các tài liệu chính thức của Nhóm IRG từ 1994 đến cuối 2000.
2. Các tập mã chữ Nôm của Việt Nam cung cấp cho Nhóm IRG từ 1994 đến cuối 2000.
3. Các bản báo cáo của thành viên Việt Nam về các cuộc họp chính thức của Nhóm IRG từ 1994 đến cuối năm 2000.
4. Nguyễn Quang Hồng, Ngô Thanh Nhàn, Ðỗ Bá Phước, Ngô Trung Việt. Chữ Nôm: văn hóa cổ truyền và thông tin hiện đại. Tạp chí "Ngôn ngữ", Hà Nội, 1999, N4.