logo

Cách nhận xét biểu đồ histogram


1. Khái niệm biểu đồ histogram

     Biểu đồ phân bố tần số (còn được gọi là biểu đồ phân bố mật độ, biểu đồ cột) dùng để đo tần số xuất hiện của một vấn đề nào đó, cho ta thấy rõ hình ảnh sự thay đổi, biến động của một tập dữ liệu.

     Biểu đồ này do nhà thống kê người pháp, Andre Michel Guerry giới thiệu trong buổi thuyết trình vào năm 1833 để mô tả sự phân tích của ông về số liệu tội phạm theo từng tiêu chí giúp người nghe dễ dàng hình dung vấn đề.

     Trong biểu đồ phân bố tần số, trục hoành biểu thị các giá trị đo; trục tung biểu thị số lượng các chi tiết hay số lần xuất hiện; bề rộng của mỗi cột bằng khoảng phân lớp; chiều cao của mỗi cột nói lên số lượng chi tiết (tần số) tương ứng với mỗi phân lớp.

     Ba đặc trưng quan trọng của biểu đồ phân bố tần số là tâm điểm, độ rộng, độ dốc.

Có một vài thuật ngữ liên quan tới histogram.

+ Một lớp (class) là các giá trị dữ liệu trong một khoảng nào đó được dùng để xây dựng biểu đồ tần suất. Mỗi cột trong biểu đồ thể hiện cho một lớp

+ Độ rộng của lớp chính là độ rộng của cột trong biểu đồ.

+ Độ rộng dãi dữ liệu là sai khác giữa giá trị lớn nhất và nhỏ nhất.


2. Tác dụng của biểu đồ histogram

     Cung cấp thông tin trực quan về biến động của quá trình, tạo hình đặc trưng "nhìn thấy được" từ những con số tưởng chừng vô nghĩa. là công cụ hữu ích khi cần phân tích dữ liệu lớn.

     Thông qua hình dạng phân bố so sánh được các giá trị tiêu chuẩn với phân bố của biểu đồ, tổ chức có thể kiểm tra và đánh giá khả năng của các yếu tố đầu vào, kiểm soát quá trình, phát hiện sai sót.

Biểu đồ tần suất cho chúng ta biết bốn vấn đề sau:

- Giá trị thường xuất hiện nhất (mode)

- Mức độ thường xuất hiện của mỗi giá trị

- Hình dạng của phần bố

- Mối quan hệ giữa dữ liệu và các giới hạn yêu cầu

Ví dụ:

Cách nhận xét biểu đồ histogram

Hình vẽ trên thể hiện một biểu đồ tần suất hoàn chỉnh. Biểu đồ tần suất này thiể hiện số lượng ngày cần để một đơn hàng tới được khách hàng. Biểu đồ bao gồm các dữ liệu được lấy trong một tháng.

Từ biểu đồ ta có thể dễ dàng thấy được giá trị xuất hiện thường xuyên nhất trong tháng, đó là giá trị cao nhất trong biểu đồ và được gọi là “mode”. Trong ví dụ này mode là 15 ngày. Biểu đồ tần suất còn cho thấy sự thay đổi của số ngày cho mỗi đơn hàng, cụ thể là số ngày thay đổi từ 11 ngày (giá trị nhỏ nhất) đến 19 ngày (giá trị lớn nhất). Khoảng dao động của ngày được tính bằng:

Overall Range = Maximum Value – Minimum Value

Biểu đồ tần suất cũng cho biết ước lượng về hình dạng phân bố. Ví dụ trên cho thấy biểu đồ có dạng hình chuông: Giá trị thường xuyên xuất hiện ở giữa biểu đồ, càng ra xa hai phía thể hiện các giá trị ít xuất hiện hơn.

Biểu đồ tần suất còn cho chúng ta so sánh kết quả đạt được với các giới hạn yêu cầu. Ví dụ, giả sử giới hạn cho phép của thời gian giao hàng là 15 ngày ± 3 ngày. Điều này có nghĩa là thời gian giao hàng chỉ được phép trong khoảng từ 12 cho tới 18 ngày kể từ khi đơn hàng được đặt. Từ biểu đồ ta có thể thấy rằng có một số đơn hàng không đạt được yêu cầu này


3. Các bước cơ bản để thiết lập biểu đồ phân bố.

Bước 1: Thu thập giá trị các số liệu. Đếm lượng số liệu (n). n > 50 mới tốt.

Bước 2: Tính toán các đặc trưng thống kê.

- Xác định độ rộng của toàn bộ số liệu

R=Xmax-Xmin

- Xác định số lớp (k) và độ rộng (h) của một lớp.

Số lớp (số khoảng) là một số nguyên, thường được ước lượng bằng nhiều công thức khác nhau dựa vào kinh nghiệm và tùy thuộc vào đặc điểm của hiện tượng nghiên cứu. 

Theo Douglas C.Montgomery: k =√n 

Độ rộng của một lớp (h): h = R/k

 để thuận tiện cho việc tính toán, h thường được làm tròn số (theo hướng tăng lên) và khi đó số lớp (k) cũng thay đổi theo.

 - Xác định biên độ trên (BĐT) và Biên độ dưới (BĐD) của các lớp.

+ Lớp đầu tiên. 

  BĐD1 = Xlow

Xlow: giá trị thuận tiện nhỏ hơn Xmin một ít.

Xlow = Xmin - h/2

BĐT1 = BĐD1 + h

+ Lớp thứ hai.

BĐD2 = BĐT1

BĐT2 = BĐD2 + h

Tiếp tục như thế cho những lớp tiếp theo cho tới lớp cuối cùng chứa giá trị đo lớn nhất.

- Lập bảng tần suất.

Tính giá trị trung tâm của từng lớp.

 Xoi = (BĐDi + BĐTi)/2

Đếm số dữ liệu xuất hiện trong mỗi lớp.

Bước 3: Vẽ biểu đồ phân bố tần số.

 Đánh dấu trục hoành theo thang giá trị số liệu, trục tung theo thang tần số (số lần hoặc phần trăm số lần xuất hiện). Vẽ các cột tương ứng với các giới hạn của lớp, chiều cao của cột tương ứng với tần số lớp.


4. Cách đọc biểu đồ phân bố tần số.

   Có 2 phương pháp cơ bản về cách đọc biểu đồ tần số.

- Cách thứ nhất: dựa vào dạng phân bố

Biểu đồ phân bố thường có dạng phân bố đối xứng, hình chuông. Chính vì thế, hình dạng, "độ trơn" của biểu đồ được dùng để đánh giá khả năng của quá trình nhằm phát hiện ra những nguyên nhân đặc biệt đang tác động đến quá trình từ đó đưa ra các điều chỉnh, cải tiến cụ thể cho quá trình.

Dưới đây là một số dạng cơ bản của biểu đồ phân bố.

Cách nhận xét biểu đồ histogram (ảnh 2)

- Cách thứ hai: So sánh các giá trị tiêu chuẩn với phân bố của biểu đồ. Ta đưa ra các so sánh tỉ lệ phế phẩm so với tiêu chuẩn; giá trị trung bình có trùng với đường tâm của hai giới hạn không; hình dạng biểu đồ lệch qua phải hay qua trái từ đó đưa ra quyết định làm giảm sự phân tán hay xét lại tiêu chuẩn.

Cách nhận xét biểu đồ histogram (ảnh 3)

 5. Ví dụ về nhận xét biểu đồ histogram

  Chúng ta thu thập dữ liệu của 100 ngày đi làm, thời gian lái xe đến văn phòng như sau:

Cách nhận xét biểu đồ histogram (ảnh 4)

   Dữ liệu cho thấy rằng chuyến lâu nhất là 32 phút, chuyến nhanh nhất là 15 phút. Trừ hai chuyến kể trên thì tất cả rơi vào giữa 15 và 25 phút. 

   Từ đó ta xác định được biểu đồ phân bố tần số như sau:

Cách nhận xét biểu đồ histogram (ảnh 5)

Ví dụ: Nhằm xác định chính xác các kích thước của vật liệu kim loại có liên quan tới quá trình công nghệ gia công nhiệt đang sử dụng, bộ phận kỹ thuật tiến hành ghi chép hệ số biến dạng của vật liệu kim loại trong quá trình nhiệt luyện lấy 100 mẫu, thu được các số liệu như sau:

Cách nhận xét biểu đồ histogram (ảnh 6)

Đơn vị: % biến dạng.

Yêu cầu: vẽ biểu đồ phân bố tần số và cho nhận xét.

Bài làm:

Ta có: Xmax = 1.8

          Xmin  = 0.1

R = Xmax - Xmin = 1.7

k = 10

h = 0.17

Khi đó: 

Cách nhận xét biểu đồ histogram (ảnh 7)

Như vậy là có 11 lớp > Đếm số dữ liệu trong mỗi lớp.

Cách nhận xét biểu đồ histogram (ảnh 8)

Từ các dữ liệu trên ta vẽ được biểu đồ dưới đây.

Cách nhận xét biểu đồ histogram (ảnh 9)

Nhận xét:

Đây là biểu đồ dạng răng cưa.

icon-date
Xuất bản : 15/06/2021 - Cập nhật : 02/08/2023