Thứ tư, 21/10/2020 | 22:43

Thứ tư, 21/10/2020 | 22:43

Kiến thức khoa học

Cập nhật 10:12 ngày 21/09/2020

Nghiên cứu mở ra khả năng kích hoạt gen của con người nhờ sử dụng công nghệ máy học

Gen của con người được cung cấp bởi thứ tự DNA chỉ đạo bởi bốn loại liên kết riêng lẻ khác nhau mã hóa bằng các mã gọi là A, C, G và T.
Gần 25% gen của chúng ta được phiên mã bởi các trình tự TATAAA, hay còn gọi là "hộp TATA". Ba phần tư còn lại được kích hoạt như thế nào vẫn còn là một bí ẩn.
Giờ đây, với sự trợ giúp của trí thông minh nhân tạo, các nhà nghiên cứu tại Đại học California San Diego (Mỹ) đã xác định được mã kích hoạt DNA được sử dụng ít nhất thường xuyên như hộp TATA ở người. Khám phá này gọi là vùng khởi động lõi hạ nguồn (DPR), có thể được sử dụng để kiểm soát kích hoạt gen trong các ứng dụng công nghệ sinh học và y sinh. 
Theo các nhà khoa học, công nghệ máy học đã giúp giải mã bài toán bí ẩn nằm trong DNA của chúng ta
Giáo sư James T. Kadonaga, Phòng Khoa học Sinh học Đại học UC San Diego, tác giả của báo cáo nghiên cứu cho biết: “Việc xác định DPR là bước quan trọng trong việc kích hoạt khoảng một phần tư đến một phần ba gen của con người. Khái niệm xung quan DPR từ trước đến nay vẫn là một bí ẩn. Giờ đây chúng ta đã có câu trả lời rõ ràng hơn nhờ sự trợ giúp của công nghệ máy học."
Năm 1996, Kadonaga và các đồng nghiệp nghiên cứu ruồi giấm và xác định được một trình tự kích hoạt gen mới, được gọi là DPE (tương ứng với một phần của DPR), cho phép các gen được bật khi không có hộp TATA. Tới năm 1997, họ tìm thấy một chuỗi giống DPE duy nhất ở người. Tuy nhiên, kể từ thời điểm đó, việc giải mã chi tiết và mức độ phổ biến của DPE trên con người vẫn vô cùng khó nắm bắt. Chỉ có hai hoặc ba trình tự giống DPE hoạt động được tìm thấy trong hàng chục nghìn gen của con người. 
20 năm sau, giáo sư Kadonaga đã làm việc với nhóm nhà nghiên cứu trí tuệ nhân tạo, trong đó có tiến sĩ gốc Việt Long Vo ngoc, nhằm tận dụng sức mạnh công nghệ nhằm tìm lời giải cho bài toán này.
Theo báo cáo, các nhà nghiên cứu đã tạo ra một nhóm 500.000 phiên bản ngẫu nhiên của chuỗi DNA và đánh giá hoạt động DPR của từng chuỗi. Từ đó, 200.000 phiên bản đã được sử dụng để tạo ra một mô hình học máy có thể dự đoán chính xác hoạt động DPR trong DNA của con người.
Họ đã tạo ra một mô hình giống như một cách mới để xác định chuỗi hộp TATA. Mô hình hình này được thử nghiệm bằng cách xác định kết quả của hàng nghìn chuỗi hộp TATA, sau đó đem so sánh với kết quả thực tế. Kết quả, dự báo đưa ra bởi mô hình học máy chính xác đến "đáng kinh ngạc", theo như lời giáo sư Kadonaga.
Những kết quả này cho thấy rõ ràng sự tồn tại của DPR trong gen người. Hơn nữa, tần suất xuất hiện của DPR dường như ngang bằng tần suất hộp TATA. 
Ngoài ra, nhóm nghiên cứu đã quan sát thấy sự đối ngẫu giữa DPR và TATA. Các gen được kích hoạt với hộp TATA thiếu DPR và ngược lại.
Theo giáo sư Kadonaga việc tìm ra sáu cơ sở chuỗi hộp TATA rất đơn giản. Với 19 cơ sở, việc bẻ khóa mã DPR khó khăn hơn nhiều. “Chuỗi DNA được phiên mã bởi DPR thường chứa thông tin ẩn do đó chúng ta hầu như không thể xác định được. Tuy nhiên với mô hình học máy, điều này trở nên khả thi hơn", ông cho biết. 
Trong tương lai, việc ứng dụng trí tuệ nhân tạo để phân tích DNA sẽ giúp tăng khả năng hiểu và kiểm soát việc kích hoạt gen trong tế bào người. Giáo sư Kadonaga cho biết kiến ​​thức này rất hữu ích trong công nghệ sinh học và khoa học y sinh.
Hương Giang biên dịch 
Tổng số lượt truy cập :
  • 1
  • 7
  • 4
  • 5
  • 8
  • 3
  • 1
lên đầu trang