Việc nghiên cứu và phân nhóm các ngôn ngữ thế giới dựa trên những nguyên tắc khoa học nhất định. Có hai xu hướng phân loại ngôn ngữ hiện nay được sử dụng trong ngôn ngữ học: phân loại theo nguồn gốc và phân loại theo loại hình. Việc phân loại ngôn ngữ theo nguồn gốc liên quan trực tiếp với số phận lịch sử của các ngôn ngữ và các chủ nhân (dân tộc) sử dụng chúng.
- Ngôn ngữ trên thế giới phát triển cùng với lịch sử tiến hóa của loài người từ thị tộc đến các bộ lạc, đến khi các dân tộc ra đời và phát triển. Trong lịch sử phát triển của ngôn ngữ, vào 1 thời điểm nhất định, cùng với sự phân vùng về địa lí và lãnh thổ một ngôn ngữ có thể chia tách thành các ngôn ngữ. Các ngôn ngữ ngày càng cách xa nhau và trở thành ngôn ngữ độc lập nhưng vẫn mang dấu tích của ngôn ngữ gốc (ngôn ngữ mẹ). Quan hệ giữa các ngôn ngữ trong một họ và với ngôn ngữ mẹ là quan hệ nguồn gốc. Ngôn ngữ học ngày nay xác định nhiều họ ngôn ngữ và phân loại theo nguồn gốc.
- Ngôn ngữ trên thế giới phân chia thành các ngữ hệ lớn. Phương pháp để phân chia đó là phương pháp so sánh lịch sử, so sánh các từ, các dạng thức của từ só sự giống nhau, gần nhau về ý nghĩa và hình thức âm thanh, ngữ pháp để xác định mối quan hệ thân thuộc giữa các ngôn ngữ. Ví dụ các bảng so sánh dưới đây để thấy sự gần nhau giữa tiếng Việt và tiếng Mường, do đó chúng cùng thuộc một ngữ hệ, cùng dòng và cùng nhánh ngôn ngữ:
Tiếng Việt Tiếng Mường Tiếng Việt Tiếng Mường
Gà ca bảy pảy
Gái cái bay păn
Gạo cáo mắm bắm
Gốc cốc muối bói
Ba pa măng băng
Bốn pốn may bal
Việt trứng tr o trả tre...
Mường tlấng tleo tlả tle...
Việt Mường h t Môn Khmer
Nước dak dak dak tuk
Tay thai si tai dăy
Ba... pa... pa... pi bây...
- Về phương diện ngữ âm, từ vựng một số từ tiếng Việt, tiếng Mường, tiếng Chứt, Môn và Khmer có điểm gần nhau nên chúng cùng ngữ hệ.
Từ sự tương đồng có quy luật trên là cơ sở để các nhà nghiên cứu ngôn ngữ phân loại các ngôn ngữ theo quan hệ họ hàng, gần gũi nhau.
a. Tiêu chí ngữ âm
Khi chia tách thành các ngôn ngữ, mặt ngữ âm của ngôn ngữ mẹ cũng dần dần biến đổi trong các ngôn ngữ cùng họ, nhưng là sự biến đổi có quy luật, theo mối quan hệ hệ thống.
b. Tiêu chí từ vựng - ngữ nghĩa
- Từ là đơn vị cơ bản của HT ngôn ngữ. Lớp từ được hình thành từ lịch s xa xưa. Từ biểu hiện nội dung, khái niệm, đối tượng (gọi tên SVHT).
- Từ có chức năng định danh gắn các SVHT trong đời sống. Một tiêu chí phân loại từ cần so sánh các từ về âm thanh và ngữ nghĩa để rút ra những điểm giống và khác nhau theo quy luật của chúng. Nên lấy lớp từ cơ bản để so sánh, đối chiếu. Ví dụ bảng 3 so sánh ý nghĩa các từ cùng chỉ 1 SVHT của các ngôn ngữ.
c. Tiêu chí ngữ pháp
Ngữ pháp là một tiêu chí để phân loại nguồn gốc ngôn ngữ, bao gồm: các hiện tượng ngữ pháp, phạm trù ngữ pháp, hình thức ngữ pháp những sự tương ứng về ngữ pháp có giá trị xác định nguồn gốc vì lĩnh vực ngữ pháp thường ổn định, các ngôn ngữ ít có sự vay mượn về ngữ pháp.
- Cần phân biệt hiện tượng giống nhau do nguồn gốc thân thuộc và giống nhau do vay mượn: Khi phân loại, các nhà nghiên cứu ngôn ngữ chọn lớp từ vựng cơ bản, từ gốc của ngôn ngữ. Đó là các từ chỉ họ hàng thân thuộc, số từ, đại từ, những từ chỉ bộ phận cơ thể con người, gọi tên một số động thực vật và công cụ quen thuộc và thường là từ đơn.
- Cần phải loại hiện tượng giống nhau do nguồn gốc và hiện tượng giống nhau do ngẫu nhiên: Khi phân loại, các nhà nghiên cứu ngôn ngữ đã tìm sự giống nhau có quy luật và lập thành hệ thống giữa các ngôn ngữ được so sánh;
- Không nên tuyệt đối hóa sự so sánh: Ngôn ngữ là một hiện tượng xã hội luôn biến đ i và phát triển để dần hoàn thiện hơn, phục vụ nhu cầu giao tiếp của con người. Các nhà NC ngôn ngữ dùng hương pháp lịch sử - so sánh để phân loại đã dựa vào sự tương ứng giữa các ngôn ngữ có tính quy luật về mặt ngữ âm chứ không nhất thiết phải tuyệt đối hóa sự giống nhau. Vì các âm vị có sự thay đổi một vài thuộc tính nào đó (ví dụ tiếng Việt – tiếng Mường). Về mặt ngữ nghĩa, các từ có thể bị phân hóa theo quy luật đa nghĩa. Ví dụ: tiếng Slavơ có các tiếng gorod, grad, grod (thành phố). Vì thế, không nên tuyệt đối hóa sự so sánh. Các nhà NC ngôn ngữ d ng phương pháp lịch s - so sánh để xác định nguồn gốc lịch sử các ngôn ngữ và quy luật phát triển lịch sử của chúng.
Sử dụng phương pháp lịch sử - so sánh, các nhà NC ngôn ngữ chia ngôn ngữ thành các ngữ hệ. Một ngữ hệ ngôn ngữ được gọi là một họ ngôn ngữ, đó là ngôn ngữ cùng một ngôn ngữ mẹ. Các họ chia thành các dòng, các dòng chia thành các nhánh có thể biểu thị mô hình sau:
Ngữ hệ (họ ngôn ngữ c ng ngôn ngữ mẹ) -> các dòng -> nhánh.
Theo cách phân chia các nhà NC ngôn ngữ thì ngôn ngữ trên thế giới có khoảng trên 20 họ. Một số họ chủ yếu sau:
a. Họ Ấn – Âu:
- Dòng Ấn Độ: gồm ngôn ngữ Hin đu (là ngon ngữ quốc gia n Độ), Urơdu (ngôn ngữ quốc gia akixtan); engali, Lakhađơ, Xingan, Nepali…
- Dòng Irăng: Batư, astô (ngôn ngữ quốc gia Apganixtan), Tagic, amia
- Dòng Slavơ: nhánh đông gồm Nga, Ucraina, Beelarust; nhánh nam gồm Bungari, Xlôven, Makêđôn…nhánh tây gồm Tiếng Tiệp, Slôvac, Kasubô,…
- Dòng Ban tích: Litva, Latvia
- Dòng Giecman: nhánh bắc gồm Đan mạch, Thụy Điển, Nauy, Aixlen… Các dòng khác: ooman, Khitơ, Hi Lạp, Anbani, Acmêni….
b. Họ Kapkadơ:
- Dòng tây: Apkhadơ, Abađin..
- Dòng nascơ
- Dòng Kactơven…
c. Họ Ugo – Phần Lan:
- Dòng Ugo
- Dòng Phần Lan
d. Hộ Mông Cổ
e. Họ Thổ Nhì Kì: Ngôn ngữ Th Nhì Kì, Adecbaidiăng...
f. Họ Hán - Tạng:
- Dòng Hán- Thái: tiếng Hán, Dungan, Thái, Lào, Choang, Tày, N ng, Sán Chỉ, La Hay, Cao Lan…
- Dòng Tạng – Miến: Tạng, Miến Điện, Hà nhì, La Hủ, Lô Lô, hai Xà ở miền Bắc Việt Nam
- Dòng Mèo – Dao: Mào, Dao, a Thẻn ở miền Bắc Việt Nam.
g. Họ Môn Khơ- mer: (còn gọi là Ngữ hệ Nam hương)
- Mun đa, Xantali, Kho, Khumagic
- Khơ –me,
- Môn gồm: Việt, Mường, Khme, Katu…