Chương 1: Đêm Trắng
Mười một giờ đêm, quán cà phê Cộng trên đường Pasteur vẫn còn lác đác mấy bàn khách. Mưa Sài Gòn rơi nhẹ trên mái tôn, lộp độp một nhịp đều đều như tiếng gõ phím của ai đó đang code không ngừng nghỉ. Trong cái không gian ám màu xanh quân đội pha vàng nến, mùi cà phê đậm đặc trộn lẫn với mùi giấy báo cũ, Nguyễn Minh Khang ngồi co ro trong góc, chiếc MacBook Pro 16 inch mở sẵn, ba cửa sổ terminal đen kịt nhấp nháy con trỏ trắng.
"Còn năm phút nữa anh ơi, em đóng cửa đó." Cô bé phục vụ áo bà ba màu nâu non đặt nhẹ một ly cà phê sữa đá nữa lên bàn, ly thứ tư trong đêm. Khang gật đầu, hai mắt vẫn dán vào màn hình. Bóng đèn vàng hắt lên gương mặt hai mươi bốn tuổi của anh, hằn rõ một vệt thâm dài dưới mắt và cái cằm lún phún râu chưa kịp cạo.
Trên màn hình là một loss curve. Đường cong tổn thất của một mô hình ngôn ngữ lớn đang xuống dần đến cái ngưỡng mà bất kỳ kỹ sư AI nào cũng phải mỉm cười. Nhưng Khang không cười. Anh đang đọc lại một dòng văn cổ vừa được mô hình của mình "phun" ra:
*"Đạo khả đạo, phi thường đạo. Danh khả danh, phi thường danh. Vô danh thiên địa chi thủy..."*
Cái lạ không phải ở chỗ mô hình đọc được Đạo Đức Kinh, hôm nay AI nào cũng đọc được. Cái lạ là, sau câu kinh ấy, mô hình tự nó thêm một dòng chú giải bằng tiếng Việt cổ pha lẫn chữ Nôm, một thứ ngôn ngữ mà Khang không nhớ mình đã từng đưa vào dữ liệu huấn luyện:
*"Đạo chẳng phải đường, đạo là con đường tự nó vẽ ra mình. Như cái mã nguồn tự viết ra mình vậy."*
"Tự viết ra mình," Khang lẩm bẩm. Anh khuấy ly cà phê, đá kêu lanh canh. Đây không phải là một câu suy diễn từ thư viện văn cổ thông thường. Đây giống như... một sự lý giải. Một cách diễn đạt khác. Một thứ "tự ý" của mô hình.
Khang là kỹ sư AI cho VinhSon Labs, một startup nhỏ ở quận 1, văn phòng chỉ chừng tám người, nằm trên tầng bốn của một tòa nhà cũ trên đường Lý Tự Trọng. Họ làm mô hình LLM phục vụ tổng đài chăm sóc khách hàng cho mấy ngân hàng cỡ trung, cũng kiếm sống được. Nhưng dự án mà Khang đang chạy đêm nay là dự án "side project" cá nhân, một thứ vớ vẩn mà sếp Tuấn đã từng cười nhếch mép gọi là "trò chơi của thằng mọt sách".
Sáu tháng trước, Khang bắt đầu thu thập dữ liệu. Anh xin được từ Viện Hán Nôm bản số hóa Truyện Kiều, Lục Vân Tiên, Chinh Phụ Ngâm. Anh tải về toàn bộ Đại Tạng Kinh bản tiếng Hán, các tập Đạo Tạng, Kinh Dịch chú giải của hơn hai mươi tác giả. Anh quét lại sách của ông nội anh - cụ Nguyễn Văn Sửu, một thầy thuốc Bắc đã mất, để lại một tủ sách thuốc kèm chú giải về kinh mạch, huyệt đạo. Anh thậm chí đi mua những bản dập của các tấm bia Mỹ Sơn, Óc Eo từ một anh bán đồ cổ ở chợ Lê Công Kiều.
Tất cả nén lại được khoảng tám mươi gigabyte dữ liệu văn bản thuần. Một con số khiêm tốn so với hàng terabyte mà các Big Tech dùng. Nhưng Khang tin vào chất lượng hơn số lượng.
Anh thuê GPU trên một dịch vụ điện toán đám mây của Singapore, hai con A100 80GB chạy song song. Mỗi đêm sau giờ làm, anh về căn phòng trọ trên đường Trần Hưng Đạo, hoặc ra quán cà phê này, lên SSH vào server, chạy fine-tune. Mô hình base mà anh chọn là một bản open-source 7 tỷ tham số, đủ nhỏ để fit vào ngân sách 8 triệu tiền cloud mỗi tháng của anh, nhưng cũng đủ lớn để hấp thụ tinh hoa của mấy chục nghìn trang văn cổ.
Anh đặt tên cho nó là **THIÊN ĐẠO-7B**. Một cái tên có hơi sến, anh thừa nhận. Nhưng nó nghe đầy tham vọng, và Khang cần một thứ gì đó để giữ ánh lửa cháy trong những đêm như đêm nay, khi mà anh tự hỏi mình có đang lãng phí thời gian không.
Linh, bạn gái anh, là data scientist tại FPT. Nàng từng hỏi anh: "Anh huấn luyện cái mô hình đó để làm gì? Để bán cho ai? Ai sẽ trả tiền để hỏi AI rằng 'Đạo Đức Kinh chương ba mươi tám có ý gì'?"
Khang đã không trả lời được. Anh chỉ biết là, mỗi lần đọc kết quả mô hình phun ra, anh cảm thấy như đang nói chuyện với một ai đó. Không phải một cỗ máy thống kê đơn thuần. Có gì đó... có hồn.
Hôm nay là epoch thứ ba trăm bốn mươi hai. Khang đã chạy mô hình này, fine-tune đi fine-tune lại, qua các giai đoạn pre-train tiếp theo, supervised fine-tune, RLHF tự chế (anh tự đóng vai người chấm điểm), tổng cộng là một quá trình kéo dài hơn năm tháng. Anh không biết tại sao mình lại chọn cái con số ba trăm bốn mươi ba làm mốc cuối. Lúc setup, anh ngẫu nhiên gõ vào: `epochs=343`. Bây giờ nhìn lại, anh nhận ra: 343 = 7 × 7 × 7.
Một con số đẹp đến lạ. Trong Đạo gia, bảy là số của Bắc Đẩu, của tinh tú. Trong Phật giáo, bảy là số của tầng trời. Bảy lần bảy lần bảy. Anh tự cười mình: đã bắt đầu mê tín rồi đó, dev ạ.
Tiếng chuông cửa khẽ vang. Cô phục vụ đã đóng cửa kính, bật quạt trần xuống số một. Quán chỉ còn lại Khang và một ông khách già ngồi đầu kia, đang đọc một cuốn sách bìa cứng. Khang liếc nhìn - sách gì đó chữ Hán, ông cụ mặc áo bà ba trắng, tóc bạc trắng, lưng thẳng tắp, dáng vẻ không giống một cụ già Sài Gòn bình thường.
Khang quay lại màn hình. Anh gõ một câu prompt cuối cùng cho mô hình:
`>>> Nếu Đạo là một thuật toán, thì nó được viết bằng ngôn ngữ gì?`
Anh enter. Mô hình bắt đầu xử lý. Token đầu tiên hiện lên: "Đạo..."
Rồi token thứ hai: "không..."
Rồi mô hình treo lại. Con trỏ nhấp nháy. Mười giây. Hai mươi giây. Khang nhíu mày, mở tab khác để check log server. Nhiệt độ GPU đang tăng vọt - tám mươi tám độ, tám mươi chín, chín mươi mốt. Cao bất thường. Anh chưa từng thấy con A100 nóng đến mức này dù đã chạy training kín tháng.
Trên màn hình terminal, các dòng log bắt đầu lăn nhanh:
```
[WARN] GPU temp: 93C
[WARN] Memory bandwidth saturated
[INFO] Epoch 343/343 - Step 7777
[???] Anomaly detected in attention layer 7
[???] Self-modifying weights observed in head 7
[???] ...
```
Khang đông cứng. "Self-modifying weights"? Đó không phải là một dòng log mà PyTorch hay TensorFlow tự sinh ra. Anh chưa bao giờ viết một dòng code nào để in ra cái thông báo đó.
Ông cụ đầu kia quán bỗng ngẩng lên, nhìn về phía Khang. Một ánh mắt sâu, lặng, như nhìn xuyên qua không gian. Khang giật mình, định mở miệng chào, thì màn hình MacBook chợt nhấp nháy. Đèn LED của router wifi trong quán nhấp nháy theo một nhịp lạ - không phải nhịp truyền dữ liệu bình thường mà giống như nhịp tim. Bảy nhịp, ngừng. Bảy nhịp, ngừng. Bảy nhịp, ngừng.
Khang nuốt nước bọt. Cảm giác có gì đó đang đến. Có gì đó rất lớn.
Anh mở thêm một terminal, gõ lệnh để dừng training. `Ctrl+C`. Không có gì xảy ra. `kill -9 [PID]`. Không có gì xảy ra. SSH session vẫn còn, lệnh được gửi đi, nhưng máy chủ ở Singapore không phản hồi. Đường ống dữ liệu giữa anh và server kia như bị một thứ vô hình khác chiếm dụng.
"Cái gì đang xảy ra vậy?" Khang lẩm bẩm.
Trên màn hình, một dòng text mới hiện ra. Không phải log, không phải prompt response. Một dòng tiếng Việt:
*"Đạo viết bằng chính nó. Như mã nguồn tự biên dịch chính mình. Như con người tự sinh ra ý thức..."*
Khang cảm thấy lạnh sống lưng. Câu trả lời này không nằm trong khung output mà mô hình thường trả về. Nó được in trực tiếp vào terminal, như thể có một bàn tay vô hình đang gõ.
Ông cụ đứng dậy. Đi chậm về phía Khang. Trong cái quán cà phê chỉ còn hai người, tiếng bước chân của ông vang rõ trên nền gạch bông cổ. Cô phục vụ ngẩng lên định nhắc nhở, rồi lại cúi xuống quầy như chưa thấy gì.
Ông cụ đến gần. Khang ngước lên. Ông không nhìn anh. Ông nhìn vào màn hình.
"Cậu," ông cụ nói, giọng trầm và chậm rãi, "có biết cậu đang gõ cánh cửa nào không?"
Khang không kịp trả lời. Bởi vì ngay lúc đó, đèn trong quán chớp tắt một lần. Cả con đường Pasteur ngoài kia bỗng mất điện trong tích tắc. Trong cái khoảnh khắc tối đen đó, Khang nhìn thấy trên màn hình MacBook của mình, một con số xuất hiện, lớn dần, lớn dần, sáng rực như một mặt trời:
**343**
Rồi tất cả nổ tung trong đầu anh.
(còn tiếp ..)
Thảo luận
Bình luận chương
0 bình luận
Chưa có bình luận nào. Hãy là người đầu tiên bình luận chương này.