Sinh học là môn học về sự sống, muôn màu muôn vẻ. Tin học nói chung chỉ biết có số không và số một, không có gì khô khan hơn. Hiện nay đại đa số những người làm tin học không biết gì đến sinh học, và đa số người làm sinh học cũng chỉ dùng máy tính như một dụng cụ để viết bài hay tính toán.
Thế nhưng chỉ cần lật xem những tạp chí phổ biến khoa học trong thời gian vừa qua cũng thấy không hiếm những thông tin hay bài báo nói về những khảo cứu vận dụng cả hai ngành khoa học - công nghệ nói trên. Thí dụ một số tựa như: “Sự thành hình ngành y khoa xi-be”, L'avènement de la cybermédecine, La Recherche, tháng 2.2000; “Phải chăng ngày mai sẽ có loài vật nhân tạo?”, Les animaux artificiels sont-ils pour demain?, La Recherche, tháng 10.1998; “Từ Sinh học tới Tin học”, De la Biologie à l'Informatique, La Recherche, tháng 2.1999; “Tính toán bằng ADN”, Calculer avec l'ADN, Pour la Science, tháng 10.1998; vân vân, không thể kể hết. Người ta luôn luôn gặp những thuật ngữ mới (vì mới quá, xin phép không dịch vì đây là công việc mà ngay những người trong nghề cũng phải bàn cãi cẩn thận), như Biopuce, Biocomputer, Pilule électronique, Algorithme génétique, mạng nơron... cũng không thể kể hết.
Tin sinh học (bioinformatics) là một lĩnh vực khoa học sử dụng các công nghệ của các ngành toán học ứng dụng, tin học, thống kê, khoa học máy tính, trí tuệ nhân tạo, hóa học và hóa sinh (biochemistry) để giải quyết các vấn đề sinh học. Một thuật ngữ thường được dùng thay thế cho tin sinh học là sinh học tính toán (computational biology). Tuy nhiên, tin sinh học thiên về việc phát triển các giải thuật, lý thuyết và các kĩ thuật thống kê và tính toán để giải quyết các bài toán bắt nguồn từ nhu cầu quản lý và phân tích dữ liệu sinh học. Trong khi đó, sinh học tính toán thiên về kiểm định các giả thuyết (hypothesis) được đặt ra của một vấn đề trong sinh học nhờ máy tính thực nghiệm trên dữ liệu mô phỏng, với mục đích chính là phát hiện và nâng cao tri thức về sinh học (ví dụ: dự đoán mối quan hệ tương tác giữa các protein, dự đoán cấu trúc bậc 2 phân tử của protein, v.v.).
Tin sinh học hiện tại và trong tương lai gần
Tổ chức Lương thực Thế giới sử dụng tin sinh học để phát triển các ứng dụng giúp chống lại các bệnh truyền nhiễm (ví dụ như cúm gà) và để chống lại các đợt bùng phát và lây lan virus. Tập hợp và xử lý dữ liệu nhằm mục đích xây dựng kiến thức để chiến đấu chống lại sự lây lan của bệnh tật. Tại Hà Lan, Học viện Veterinair Central (Wageningen UR) gần đây đã sử dụng các kỹ thuật này để xác định và phân tích trình tự bộ gen để có thể để xác định sự lây nhiễm virut H5N8 giữa các trang trại gia cầm khác nhau. Các nhà khoa học cũng có thể dự báo thời tiết cục bộ (chính xác lên đến 200 ha) bằng cách sử dụng hàng triệu quan sát thời tiết và mặt đất hàng ngày. Nông dân có thể sử dụng thông tin này để xác định khi nào sẽ là thời điểm tốt nhất để gieo hạt, canh tác hoặc thu hoạch. Quan sát thời tiết cục bộ trong một số tháng cũng có thể được sử dụng để ước tính năng suất của một mảnh đất cụ thể. Gia súc có thể được gắn chip và kết nối với internet (và ngân hàng dữ liệu) để theo dõi sức khỏe của chúng, góp phần tăng sản lượng.
Tin sinh học trong tương lai xa
Khi việc trao đổi thông tin giữa các nước trở nên nhanh và dễ dàng hơn, sẽ có thể phát hiện các đợt dịch bệnh ngay tại giai đoạn đầu và phác ra được một bức tranh tổng thể về (các) nguyên nhân một cách nhanh chóng và tốt hơn. Dữ liệu được thu thập cũng có thể sử dụng để phân tích rủi ro hoặc dự đoán về tương lai. Sự kết hợp giữa tin sinh học và các công nghệ khác được kỳ vọng sẽ khiến cho sản xuất bền hơn. Chất lượng cây trồng sẽ được cải thiện, sản xuất sẽ tăng lên và sức đề kháng của cây trồng chống lại bệnh tật, côn trùng và thuốc diệt cỏ sẽ tăng lên.
Trong bối cảnh đó, lĩnh vực tin sinh học có thể làm được những gì? Có lẽ, điều hợp lý nhất là một mô hình giáo dục, đào tạo và hỗ trợ mới cho phép các nhà khoa học sống ở các nước thu nhập thấp có thể phân tích lại dữ liệu -omics công khai bằng phương pháp tin sinh học và từ đó tăng cường nghiên cứu và xuất bản khoa học trong nước. Có một may mắn là cơ sở hạ tầng máy tính đầy đủ và kết nối internet tốc độ cao thường có sẵn trong các bộ phận khoa học và kỹ thuật máy tính của các tổ chức giáo dục trong LMIC và LIC. Hiện tại, các tài nguyên này hiếm khi được sử dụng để phân tích tin sinh học vì các nhà khoa học máy tính đang lại không được đào tạo về Tin sinh học. Trong khi đó, các nhà nghiên cứu trong các tổ chức ít nguồn lực có thể sử dụng tài nguyên đám mây để phân tích các bộ dữ liệu lớn, giúp giảm bớt gánh nặng hậu cần cho việc lắp ráp một cơ sở hạ tầng điện toán hiệu năng cao.