Tài liệu Tin học ứng dụng trong CNSHTP: TIN HỌC ỨNG DỤNG 
TRONG CNSHTP
Mục tiờu 
 Giỳp sinh viờn độc lập trong nghiờn cứu
khoa học, cú khả năng xử lý số liệu
thường gặp trong điều tra, nghiờn cứu
trong cụng nghệ sinh học thực phẩm
 Trang bị cho sinh viờn kỹ năng sử dụng
phần mềm tin học trong việc giải quyết
xử lý, trỡnh bày số liệu và giải quyết một
số bài toỏn trong cụng nghệ
Tài liệu tham khảo 
 Nguyễn Ngọc Kiểng, Thống kờ học trong 
nghiờn cứu khoa học, NXB Giỏo dục, 1996.
 Lờ Đức Ngọc, Xử lý số liệu và kế hoạch húa 
thực nghiệm, Khoa Húa, ĐHQGHN, 2001.
 Nguyễn Cảnh, Quy hoạch thực nghiệm, NXB 
Đại học Quốc gia, 2004
 Phan Hiếu Hiền, Phương phỏp bố trớ nghiệm 
và xử lý số liệu, NXB Nụng nghiệp, 2001 
Noọi dung
1. Tin học ứng dụng trong CNSHTP
2. Mụ tả đại lượng thống kờ bằng phần 
mềm tin học
3. Mụ tả dữ kiện thớ nghiệm bằng phần 
mềm tin học
4. Bố trớ thớ nghiệm nghiờn cứu thực phẩm
5. Xử lý số liệu thớ nghiệm kiểu hoàn toàn 
ngẫu nhiờn bằng phần mềm Statgraphics
Noọi dung
6. Xử lý số...
                
              
                                            
                                
            
 
            
                 297 trang
297 trang | 
Chia sẻ: Khủng Long | Lượt xem: 1285 | Lượt tải: 0 
              
            Bạn đang xem trước 20 trang mẫu tài liệu Tin học ứng dụng trong CNSHTP, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
TIN HỌC ỨNG DỤNG 
TRONG CNSHTP
Mục tiêu 
 Giúp sinh viên độc lập trong nghiên cứu
khoa học, cĩ khả năng xử lý số liệu
thường gặp trong điều tra, nghiên cứu
trong cơng nghệ sinh học thực phẩm
 Trang bị cho sinh viên kỹ năng sử dụng
phần mềm tin học trong việc giải quyết
xử lý, trình bày số liệu và giải quyết một
số bài tốn trong cơng nghệ
Tài liệu tham khảo 
 Nguyễn Ngọc Kiểng, Thống kê học trong 
nghiên cứu khoa học, NXB Giáo dục, 1996.
 Lê Đức Ngọc, Xử lý số liệu và kế hoạch hĩa 
thực nghiệm, Khoa Hĩa, ĐHQGHN, 2001.
 Nguyễn Cảnh, Quy hoạch thực nghiệm, NXB 
Đại học Quốc gia, 2004
 Phan Hiếu Hiền, Phương pháp bố trí nghiệm 
và xử lý số liệu, NXB Nơng nghiệp, 2001 
Nội dung
1. Tin học ứng dụng trong CNSHTP
2. Mơ tả đại lượng thống kê bằng phần 
mềm tin học
3. Mơ tả dữ kiện thí nghiệm bằng phần 
mềm tin học
4. Bố trí thí nghiệm nghiên cứu thực phẩm
5. Xử lý số liệu thí nghiệm kiểu hồn tồn 
ngẫu nhiên bằng phần mềm Statgraphics
Nội dung
6. Xử lý số liệu thí nghiệm kiểu khối ngẫu 
nhiên đầy đủ bằng phần mềm Statgraphics
7. Xử lý số liệu thí nghiệm kiểu bình phương 
Latin bằng phần mềm Statgraphics
8. Xử lý số liệu thí nghiệm đa yếu tố bằng phần 
mềm Statgraphics
9. Xử lý số liệu thí nghiệm hồi quy và tương 
quan tuyến tính bằng phần mềm Statgraphics
10. Giải một số bài tốn cơng nghệ bằng phần 
mềm EXCEL
1. Tin học ứng dụng trong CNSHTP
 Tin học ứng dụng trong nghiên cứu thực 
phẩm
 Phần mềm ứng dụng trong bảng tính
 Phần mềm ứng dụng trong xử lý thống 
kê
 Phần mềm ứng dụng trong biểu diễn 
cơng thức hĩa học
1.1 Tin học ứng dụng trong nghiên cứu 
thực phẩm
Trong mọi ngành khoa học thực nghiệm:
 thực tế
 thí nghiệm kết quả bằng số
Kết quả bằng số:
 là giá trị của một biến ngẫu nhiên
 phụ thuộc vào nhiều yếu tố
 ước lượng được qui luật phụ thuộc
(nghiên cứu trên một tập hợp mẫu với độ
tin cậy nào đĩ)
Xử lý số liệu
 dữ liệu thơ - tính tốn, sắp xếp - dữ liệu
tinh
 làm cơ sở cho việc diễn giải, phân tích
thống kê
1.2 Phần mềm ứng dụng trong bảng tính
 Phần mềm bảng tính EXCEL
 Tạo biểu bảng số liệu
 Biễu diễn số liệu dưới dạng biểu đồ
 Xử lý thống kê số liệu nghiên cứu
Bảng phân phối tần số
 Sắp xếp, trình bày dữ liệu một cách cĩ hệ
thống
 Phân chia dữ liệu thành từng nhĩm khác
nhau
 Căn cứ để hình thành biểu đồ phân phối
tần số
Sơ đồ tổng quát của bảng phân phối 
tần số
Trị số của biến 
(Xi)
Tần số (số lần xuất 
hiện của trị số - fi)
X1 f1
X2 f2
Xk fk
Sơ đồ tổng quát của bảng phân phối 
tần số
điểm số sinh viên
1 2
2 4
10 9
Sơ đồ tổng quát của bảng phân phối 
tần số
Năng 
suất 
Tần 
số
Tần số 
tương 
đối (%)
Tần số 
tích 
lũy
Tần số tương 
đối tích lũy 
(%)
152 7 17,5 7 17,5
159 19 47,5 26 65,0
166 8 20 34 85,0
173 6 15 40 100
40
Biểu đồ trong thống kê
 Biểu diễn tồn bộ số liệu
 Thể hiện nét đặc trưng của tập hợp số liệu
 Biểu diễn mối quan hệ giữa tính trạng
nghiên cứu và chỉ tiêu theo dõi
Biểu đồ phân phối tần số
 Biểu đồ cột
 Trình bày số quan sát lớn
 Cĩ thể trình bày tần số tương đối, tần số
tích lũy, tần số tương đối tích lũy
Biểu đồ phân phối tần số
Biểu đồ phân phối tần số
7
19
8
6
0
5
10
15
20
1152 159 166 173
Biểu đồ tần số tích lũy
7
26
34
40
0
5
10
15
20
25
30
35
40
45
150 155 160 165 170 175
Biểu đồ tần số tương đối tích lũy
17,5
65
85
100
0
20
40
60
80
100
120
150 155 160 165 170 175
Biểu đồ hộp
 Khảo sát sơ lược dữ liệu
 Tổng quát về phân phối của mẫu/ tổng
thể
 thể hiện ví trí tập trung, phân tán, bất
thường
Biểu đồ hộp
Biểu đồ hộp
 Khối hộp ‘box’ kéo dài từ giá trị phân vị
¼ đến giá trị phân vị ¾ , khoảng 50% giá
trị nẳm trong ‘box’
 Đường thẳng đứng ở vị trí trung bị mẫu,
chia dãy số liệu thành 2 phần bằng nhau,
nếu mẫu phân bố đối xứng thì đường này
nằm gần trung tâm của khối hộp
Biểu đồ hộp
 Dấu + ở vị trí trung bình của mẫu
 Sự khác biệt đáng kể giữa trung bình và
trung vị cho thấy cĩ một vài số liệu cĩ
khả năng gây ra sai số làm phân bố của
mẫu bị lệch
 Đoạn thẳng hai đầu gọi là ‘whisker’ nối
từ giá trị cực tiểu đến điểm phân vị ¼ và
từ điểm phân vị ¾ đến giá trị cực đại
Biểu đồ điểm
1.3 Phần mềm ứng dụng trong xử lý thống 
kê
 Phần mềm xử lý thống kê Statgraphics
 Thao tác cơ bản trong phần mềm
 Xử lý thống kê số liệu nghiên cứu
 Thao tác sao chép kết quả xử lý vào 
phần mềm văn bản WORD
1.4 Phần mềm ứng dụng trong biểu diễn 
cơng thức hĩa học
 Phần mềm ChemWindow
 Thao tác cơ bản trong phần mềm
2. Mơ tả đại lượng thống kê bằng phần 
mềm tin học
 Phân tích thống kê
 Đại lượng đo lường xu hướng trung bình
 Đại lượng đo lường sự biến thiên
 Xác định các đại lượng thống kê bằng 
phần mềm tin học
2.1 Phân tích thống kê
 Các con số tĩm lược thơng tin định lượng
 Phương pháp tính tốn để giúp chúng ta
tĩm lược hoặc khái quát hố thơng tin
 Kỹ thuật giúp quyết định vấn đề như phân
tích phương sai, tương quan hồi qui, trắc
nghiệm, 
Hạn chế của thống kê
 Sử dụng thống kê phải biết rành về lĩnh
vực chuyên mơn của người nghiên cứu
 Thống kê chỉ là phương tiện, cơng cụ
 Thống kê trình bày những số liệu hoặc
hiện tượng rời rạc một cách hệ thống hơn,
chứ khơng nĩi được bản chất của sự việc
 Thống kê khơng thay thế được cho suy
nghĩ và kết luận của người nghiên cứu
Thống kê mơ tả
 Là một trong những bước đầu tiên để
phân tích vấn đề và thực hiện một quyết
định.
 Gồm các tính tốn cơ bản mang tính chất
mơ tả như trung bình, phương sai, độ
lệch chuẩn,  nhằm tổng kết về kết quả
của thí nghiệm.
Thống kê mơ tả
 Phương pháp tĩm lược thơng tin để làm
cho chúng trở nên dễ hiểu tức giảm một
số lớn các số liệu phức tạp thành một số
nhỏ hơn gồm các giá trị tĩm tắt
 Mơ tả mối quan hệ giữa các biến số
Thống kê suy diễn
 Khái quát hố thơng tin của một mẫu cho
tồn dân số của mẫu tức là chỉ đo đếm
trên một tiểu tập hợp rồi suy luận cho
tồn bộ với một độ tin cậy nào đĩ
 Cung cấp kỹ thuật để kiểm tra trên một
mẫu và sử dụng thơng tin này để suy
rộng ra các đặc tính của tồn bộ dân số
2.2 Đại lượng đo lường xu hướng trung 
bình
 Mốt (mode)
 Trung vị (median)
 Trung bình cộng (average)
 Trung bình nhân (geometric mean)
Mode: (Mo)
 Là giá trị xuất hiện nhiều nhất trong một
biến số
Ví dụ: Phân phối xác suất: 5, 6, 7, 7, 8, 8, 8,
9, 10 cĩ mode là 8
 Dùng để đo độ tập trung
 Khơng phụ thuộc vào giá trị ở 2 đầu của
dãy số
Mode: (Mo)
 Biến số đơn thức là biến số khi gần như
mọi trường hợp đều tập trung về một giá
trị
 Biến số nhị thức là biến số khi gần như cĩ
hai hay nhiều trường hợp nhất và gần như
tương đương nhau
Số trung vị: (Me)
 số nằm ở chính giữa khi dãy số xếp từ
nhỏ - lớn
 Là giá trị chia đơi tổng số các giá trị của
biến số thành 2 phần bằng nhau
 cho kết quả nhanh về ước lượng trung
bình.
Trung bình cộng 
 Cộng các giá trị của các trường hợp và
chia cho tổng trường hợp
 Trường hợp dị biệt cĩ thể làm trung bình
mất đi tính đại diện
 Tổng các độ lệch giữa các giá trị với
trung bình luơn bằng 0
 Tổng các độ lệch bình phương cĩ giá trị
nhỏ nhất
X
Trung bình cộng 
 Đại diện cho cả một tập hợp lớn số liệu
 Nêu lên đặc điểm chung nhất của hiện
tượng
 Dùng để so sánh các hiện tượng khơng cĩ
cùng qui mơ
X
Trung bình cộng số học
n
X
X
n
i
i
 1
Trung bình cĩ trọng số
 Là trường hợp đặc biệt của trung bình số
học khi gía trị của biến xuất hiện nhiều
lần
 k
i
i
k
i
ii
f
fX
X
1
1
Trung bình của dữ liệu phân nhĩm cĩ 
khoảng cách
 mi là trị số giữa của nhĩm i
 fi tần số của nhĩm i
 k
i
i
k
i
ii
f
fm
X
1
1
Trung bình nhân (trung bình hình học) 
GM 
 Căn bậc n cho n giá trị
 Thay cho trung bình cộng trong trường
hợp dãy số liệu cĩ phân phối lệch (giá trị
đột biến)
n
nXXXGM ....21
Phần tư vị (quartile)
 Xếp dữ kiện từ nhỏ đến lớn, chia dãy n dữ 
kiện làm 4 phần
 Phần tư vị dưới (low quartile): lấy giá trị 
của đơn vị ở vị trí ¼ (25%) dãy dữ kiện.
 Phần tư vị trên (upper quartile): lấy giá trị 
của đơn vị ở vị trí ¾ (75%) dãy dữ kiện. 
2.3 Đại lượng đo lường sự biến thiên
 Phương sai
 Độ lệch chuẩn
 Hệ số biến dị
 Độ lệch
 Độ nhọn
Phương sai (variance) 
 Phương sai là trung bình của các độ lệch
bình phương giữa các giá trị so với giá trị
trung bình.
N
X i 
2
2 )( 
Phương sai
 Tính giá trị trung bình
 Trừ giá trị trung bình cho từng giá trị
(hiệu số)
 Bình phương từng hiệu số
 Cộng các hiệu số được bình phương
 Lấy tổng của các hiệu số bình phương
chia tổng giá trị
Ý nghĩa của phương sai
 Nếu các giá trị được phân phối một cách
dàn trãi trên diện rộng và cách xa trung
bình thì độ lệch sẽ lớn và phương sai sẽ
rất lớn
 Nếu các giá trị quần tụ gần giá trị trung
bình thì độ lệch sẽ nhỏ và phương sai sẽ
nhỏ.
Độ lệch chuẩn (standard deviation)
 Biểu thị mức độ phân tán (cùng bản chất
của tính trạng)
 Độ lệch càng lớn mức độ phân tán càng
cao, tính đại diện trung bình càng nhỏ
Độ lệch chuẩn
 Là căn bậc hai của phương sai
N
X i 
2)( 
Mơ tả biến thiên
 Mơ tả biến thiên chính là đo lường sự
khác biệt của các giá trị với một giá trị
chuẩn nào đĩ tức là điểm trung bình
Mơ tả biến thiên
Nhĩm 1 (tương 
đối đồng nhất)
Nhĩm 2 (giữa 2 
xu hướng)
Nhĩm 3 (tương 
đối khác biệt)
64 44 34
68 63 58
70 80 90
71 91 101
69 74 79
66 56 46
Trung bình 68 Trung bình 68 Trung bình 68
Mơ tả biến thiên
Nhĩm 1 (tương đối 
đồng nhất)
Nhĩm 2 (giữa 2 xu 
hướng)
Nhĩm 3 (ttương đối 
khác biệt)
64 44 34
68 63 58
70 80 90
71 91 101
69 74 79
66 56 46
Trung bình 68 Trung bình 68 Trung bình 68
p.Sai 6,8 290,80 686,80
Mơ tả biến thiên
Nhĩm 1 (tương đối 
đồng nhất)
Nhĩm 2 (giữa 2 xu 
hướng)
Nhĩm 3 (tương đối 
khác biệt)
64 44 34
68 63 58
70 80 90
71 91 101
69 74 79
66 56 46
Trung bình 68 Trung bình 68 Trung bình 68
p.Sai 6,8 290,80 686,80
SD 2,61 SD 17,05 SD 26,21
Mơ tả biến thiên
 Thơng thường làm trịn giá trị của độ lệch
chuẩn và phương sai ở chữ số thập phân
thứ 2
 Biến thiên càng lớn thì độ lệch chuẩn và
phương sai càng lớn
 Khi viết báo cáo kết quả phân tích thống
kê, thường dùng độ lệch chuẩn
Hệ số biến dị
 So sánh mức độ phân tán của các tính
trạng cĩ bản chất khác nhau
%100
X
SDCV 
Độ lệch (skewness)
 Là tiêu chuẩn đánh giá tính đối xứng của
số liệu
 Độ lệch = 0 (đối xứng)
 Độ lệch > 0 (các giá trị cĩ xu hướng tập
trung về phía bên phải của đồ thị)
 Độ lệch < 0 (các giá trị cĩ xu hướng tập
trung về phía bên trái của đồ thị)
Độ nhọn (kurtosis)
 Là tiêu chuẩn để xác định hình dạng của
phân bố đối xứng.
 Độ nhọn = 0 (phân bố chuẩn)
 Độ nhọn > 0 (phân bố cĩ đồ thị nhọn hơn
phân bố chuẩn)
 Độ nhọn < 0 (phân bố cĩ đồ thị bẹt hơn
phân bố chuẩn)
2.4 Xác định các đại lượng thống kê bằng 
phần mềm tin học
 Phần mềm EXCEL
 Phần mềm STATGRAPHICS
3. Mơ tả dữ kiện thí nghiệm bằng phần 
mềm tin học
 Mơ tả dữ kiện
 Phương pháp xử lý số liệu ban đầu
 Xử lý số liệu của thí nghiệm so sánh 2 
mẫu bằng phần mềm STATGRAPHICS
3.1 Mơ tả dữ kiện 
 Hai biến số cĩ giá trị trung bình như 
nhau nhưng độ phân tán khơng giống 
nhau
 Độ phân tán cho biết thơng tin để đánh 
giá độ tin cậy của giá trị tập trung
Các đặc trưng thống kê thường dùng 
trong mơ tả dữ kiện
Các giá trị của một biến số cĩ sự phân phối
là phân tán hay tập trung.
 Giá trị đồng nhất (các giá trị của một biến
số cĩ xu hướng quần tụ)
 Giá trị khơng đồng nhất (các giá trị của
một biến số cĩ xu hướng phân tán)
Các đặc trưng thống kê thường dùng 
trong mơ tả dữ kiện
 Trung bình mẫu ước lượng giá trị trung
tâm của phân bố
 Độ lệch chuẩn của mẫu liên quan đến sự
phân tán của số liệu
Các đặc trưng thống kê thường dùng 
trong mơ tả dữ kiện
 Trung bình mẫu và Độ lệch chuẩn chỉ cĩ
giá trị đại diện cho mẫu khi mẫu cĩ phân
phối chuẩn
 Độ lệch (skewness) và độ nhọn (kurtosis)
dùng để kiểm tra mẫu cĩ phân bố chuẩn
hay khơng
Mẫu và dân số
 Dữ liệu của dân số là những dữ liệu liên
quan đến mọi trường hợp
 Dữ liệu của mẫu đại diện cĩ thể khái
quát cho tồn bộ dân số
Mẫu (sample)
 Được chọn ngẫu nhiên từ dân số
 Mẫu là một phần và là đại diện của dân
số.
 Phân tích mẫu cĩ thể suy ra các đặc tính
của dân số với một mức độ tin cậy xác
định nào đĩ
Mẫu ngẫu nhiên
 Mẫu lấy từ dân số mà các đơn vị đều cĩ
cơ hội đồng đều nhau, nĩ mang tính
khách quan trong thu thập dữ kiện
Dân số (population)
 Là tập hợp những thơng tin về người, sự 
vật hoặc sự việc riêng biệt kết hợp với 
nhau trên cơ sở một đặc điểm chung nào 
đĩ mà người nghiên cứu đang quan tâm. 
 Là tập hợp tồn bộ các đối tượng nghiên 
cứu, điều tra, khảo sát. 
Dân số
 Thường rất lớn và khơng thể kiểm tra hết
 Muốn biết thơng tin về dân số chỉ cĩ thể
đo đếm trên một tiểu tập hợp gọi là mẫu
Biến số
 Là một đặc trưng mà giá trị của nĩ khác
nhau tùy theo trường hợp
 Tùy nhu cầu nghiên cứu mà cĩ thể tạo ra
các biến số mới
 đặc trưng quan sát mà cuộc nghiên cứu
quan tâm đến,
 cĩ 02 loại biến số (liên tục, rời rạc)
Biến số liên tục
 Là các số nguyên dương và thập phân.
 Các số đo về chiều dài, trọng lượng, thể
tích, ...
Biến số rời rạc
 Là các số nguyên dương.
 Các biến biểu thị tính chất hay số đếm
Đơn vị 
 đối tượng cụ thể để đo đếm và thu nhập
dữ kiện.
 Một mẫu thăm dị sẽ cĩ nhiều đơn vị.
 Đơn vị thống kê là một phần tử của một
tập hợp mẫu thống kê điều tra khảo sát.
Phương sai của mẫu
 Cơng thức đo lường biến thiên của mẫu
(phương sai)
 n-1 gọi là bậc tự do của phương sai
1
)( 22
 
n
XX
S i
Phương sai của mẫu
 Đối với một phương sai, cĩ n-1 các độ
lệch cĩ thể biến đổi một cách tự do một
khi chúng đã được nhận biết, độ lệch sau
cùng chắc chắn sẽ được xác định.
 Vì vậy cĩ n-1 bậc tự do
Độ lệch chuẩn
 độ lệch chuẩn liên quan đến mẫu
1
)( 2
 
n
XX
S i
Điểm số chuẩn hoá
 Được dùng để đo lường độ lệch của một
điểm số nào đĩ khi được so sánh với
trung bình bằng độ lệch chuẩn.
Điểm số chuẩn hoá
 Chuyển một điểm số nào đĩ thành một
điểm số chuẩn hố theo cơng thức:
S
XXZ ii
Điểm số chuẩn hoá
Điểm của sinh 
viên lớp A
= , 1 00
6
6
6
8187
iZ
Điểm của sinh
viên lớp B
= , 1 75
4
7
4
7683
iZ
Biến số chuẩn hố
 Là biến số mà các điểm số của nĩ đều
được chuyển thành điểm số chuẩn hố
 Tổng các điểm số chuẩn hố bằng 0
 Tổng bình phương của các điểm số chuẩn
hố luơn bằng n là tổng số trường hợp
trong mẫu
Sai biệt chuẩn
 độ lệch chuẩn của một phân phối mẫu
quan trọng đến mức phải đặt cho nĩ một
tên gọi riêng là sai biệt chuẩn (standard
error) được viết là:
x
Sai biệt chuẩn
 Là sai số của số trung bình (sai số chọn
mẫu)
 Cĩ đơn vị như số trung bình
 Biểu thị mức độ đại diện của mẫu đối với
dân số
Sai biệt chuẩn
 SE lớn biểu thị mức độ đại diện của mẫu
đối với dân số nhỏ và ngược lại
 Biểu thị mức độ tin cậy của mẫu
 Ước lượng số trung bình của tổng thể
Sai biệt chuẩn
 Sai biệt chuẩn của trung bình là tồn bộ
độ lệch chuẩn của phân phối mẫu của các
trung bình của tồn bộ mẫu cĩ kích cỡ
nhất định trong dân số, được tính bằng
cơng thức:
nx
 
Khoảng tin cậy
 Trung bình của một dân số cĩ thể được
tìm ra ở phía dưới và hoặc phía trên của
trung bình mẫu, do đĩ bên cạnh biết được
trị trung bình của mẫu cần phải biết
khoảng tin cậy.
Khoảng tin cậy
 Chính sai biệt chuẩn sẽ cho biết khoảng
tin cậy.
 Khoảng tin cậy 95%
Khẳng định với độ chắc chắn rằng 95%
trung bình của dân số sẽ nằm trong
khoảng này
)96,1( xX 
Khoảng tin cậy
 Tương tự 99%:
)58,2( xX 
Mơ tả dữ kiện 
 Phân phối dân số 
 Phân phối mẫu 
 Phân phối chuẩn
Phân phối dân số
 là phân phối của những điểm số trong một
dân số
Phân phối mẫu
 là phân phối của những điểm số trong một
mẫu cĩ kích cỡ nhất định
 là phân phối của một thống kê nào đĩ của
tất cả các mẫu cĩ cùng một kích cỡ trong
dân số
Phân phối chuẩn
 Khi vẽ biểu đồ tương quan giữa tần số và
kết quả thu nhận, hình dạng đường cong
thơng thường cĩ dạng hình chuơng gọi là
phân phối chuẩn
Phân phối chuẩn
 Là một phân phối đối xứng cĩ dạng hình
chuơng, biểu diễn bằng phương trình:
2
22 2/)( 
xeY
 Hai phân phối chuẩn với độ lệch chuẩn
khác nhau:
độ lệch chuẩn nhỏ cho phép khái quát hố
những kết quả của mẫu cho tồn dân số
với độ tin cậy cao
Phân phối chuẩn
99,7%
68%
95%
0 +1-1 +2-2-3 +3
Phân phối chuẩn
Trong một phân phối chuẩn, khoảng:
 68% số liệu trong khoảng X ±SD
 95% số liệu trong khoảng X ±2SD
 99% số liệu trong khoảng X ±3SD
Phân phối chuẩn
Trong một phân phối chuẩn:
 Cĩ 95% số trường hợp nằm trong độ lệch 
chuẩn ±1,96 so với giá trị trung bình
 Cĩ 99% số trường hợp nằm trong độ lệch
chuẩn ±2,58 so với giá trị trung bình
3.2 Phương pháp xử lý số liệu ban đầu
 Gọi a là trị thực của đại lượng đo, X là 
kết quả đo
 Sai số tuyệt đối (X-a) cĩ thể gồm 3 
thành phần là sai số hệ thống, sai số thơ, 
sai số ngẫu nhiên
Sai số hệ thống
 Sai số hệ thống là sai số khơng đổi hoặc 
thay đổi theo một qui luật nhất định. 
 Sai số hệ thống cĩ thể hiệu chỉnh được
Sai số thơ
 Sai số thơ là sai số do bất cẩn, trục trặc 
kỹ thuật, thay đổi điều kiện đột ngột, 
Đặc điểm đơn lẻ, cĩ trị số tuyệt đối 
lớn hoặc nhỏ một cách bất thường. 
 Cần loại bỏ các số đo chứa sai số thơ để 
khỏi ảnh hưởng khơng trung thực đến 
kết quả chung
Sai số ngẫu nhiên
 Sai số ngẫu nhiên là sai số khơng thể 
tiên đốn được cụ thể, do rất nhiều nhân 
tố cĩ tác dụng nhỏ khơng thể tách riêng 
hoặc tính riêng. 
 Sai số ngẫu nhiên là sai số mà người làm 
thí nghiệm khơng thể loại bỏ được, phải 
chấp nhận
3.3 Xử lý số liệu của thí nghiệm so sánh 2 
mẫu bằng phần mềm STATGRAPHICS
 Bố trí thí nghiệm so sánh 2 mẫu
 Xử lý số liệu của thí nghiệm so sánh 2 
mẫu bằng phần mềm STATGRAPHICS
 Giả thuyết khơng Ho (Null Hypothesis)
giả thuyết được đặt ra từ đầu với mục
đích trắc nghiệm xem nĩ đúng hay sai
dựa vào kết quả thí nhgiệm
 Giả thuyết chọn lựa H1 (Alternative
Hypothesis) Là giả thuyết ngược lại Ho
nghĩa là khi bác bỏ Ho thì chấp nhận H1
Bố trí thí nghiệm so sánh 2 mẫu
Xử lý số liệu của thí nghiệm so sánh 2 
mẫu bằng phần mềm STATGRAPHICS
 Nhập dữ liệu
 Chọn lệnh xử lý
 Đọc kết quả
 Chép kết quả vào WORD
4. Bố trí thí nghiệm nghiên cứu thực phẩm
 Khoa học thực phẩm
 Các dạng nghiên cứu thực phẩm
 Các bước trong nghiên cứu thực nghiệm
 Khái quát về thí nghiệm nghiên cứu
 Kiểu bố trí thí nghiệm trong nghiên cứu 
thực nghiệm
4.1 Khoa học thực phẩm
 Nghiên cứu các tác động qua lại của các 
yếu tố ảnh hưởng đến chất lượng thực 
phẩm 
 Kỹ thuật thực phẩm liên quan đến qui 
trình, thiết bị, con người, vi sinh vật
 Giải quyết vấn đề: Chất lượng, An tồn, 
Kỹ thuật chế biến
4.2 Các dạng nghiên cứu thực phẩm
 Bố trí thí nghiệm bảo quản & chế biến 
sản phẩm thực phẩm 
 Phân tích diễn biến chất lượng qua thời 
gian bảo quản
 Điều tra các yếu tố vật lý, hĩa học, sinh 
học ảnh hưởng đến chất lượng sản 
phẩm, đánh giá hiệu quả của biện pháp 
xử lý, khắc phục
4.3 Các bước trong nghiên cứu thực 
nghiệm
 Xác định nhiệm vụ, đối tượng, dân số
 Tính tốn số lượng đơn vị cần thu thập 
theo qui định thống kê
 Thu thập dữ kiện
 Lưu trữ và xử lý số liệu
 Phân tích kết quả và viết báo cáo
Xác định nhiệm vụ, đối tượng, dân số
 Trước khi tiến hành thu thập dữ kiện, 
phải hiểu mình muốn biết gì khi điều tra 
nghiên cứu.
 xác định nhiệm vụ là việc hàng đầu 
trước khi thu thập dữ kiện. 
Tính tốn số lượng đơn vị cần thu thập 
theo qui định thống kê
 Việc xác định dung lượng mẫu cần thiết 
cho cuộc điều tra cĩ ảnh hưởng đến kết 
quả đánh giá và suy diễn kết luận về 
quần thể thơng qua tập hợp mẫu.
 Thu thập khơng đủ số lượng đơn vị cho 
mẫu điều tra sẽ làm lệch sự suy diễn, phi 
khoa học và dẫn đến sự ngộ nhận gây ra 
những hậu quả khơng lường được 
Thu thập dữ kiện
 Khi điều tra nghiên cứu, phải thực hiện 
việc thu thập dữ kiện. 
 Trong khi thu thập dữ kiện phải thực 
hiện việc ghi chép thơng qua các bảng 
ghi số liệu khảo sát. 
Lưu trữ và xử lý số liệu
Hình thức, phương pháp lưu trữ dữ kiện thu 
thập ngồi hiện trường hay kết quả phân 
tích trong phịng thí nghiệm đa dạng tùy 
theo mục đích điều tra nghiên cứu:
 Dưới dạng bảng tính 
 Dưới dạng cơ sở dữ liệu 
 Lưu trữ trực tiếp vào phần mềm xử lý 
thống kê. 
Phân tích kết quả và viết báo cáo
Một bảng thống kê kết quả chủ yếu gồm 
các thành phần sau:
 Tựa đề của bảng 
 Các đầu đề dữ kiện
 Nguồn gốc dữ kiện
4.4 Khái quát về thí nghiệm nghiên cứu
 Thí nghiệm
 Quan sát
 Yếu tố
 Nghiệm thức
 Đơn vị thí nghiệm (ĐVTN)
 Sai số thí nghiệm
 Sai số lấy mẫu
 quan sát hiện tượng trong điều kiện cĩ 
kiểm sốt
 yếu tố quan sát được cho thay đổi (nồng 
độ, độ dài thời gian, các hợp chất khác 
nhau, ...) và các trường hợp thay đổi được 
gọi tên bằng các nghiệm thức khác nhau. 
Thí nghiệm
 Những nguyên nhân khác khơng thuộc về 
các mục tiêu thí nghiệm cĩ thể ảnh hưởng 
đến kết quả được giữ ở mức bình thường 
và đồng nhất trong các nghiệm thức. 
 Nguyên tắc chung của thí nghiệm là trên 
cơ sở quan sát và đánh giá các nghiệm 
thức, chọn ra nghiệm thức tối ưu và suy 
diễn, kết luận
Thí nghiệm
 để thu đạt những kết quả mới
 để xác nhận hay bác bỏ kết quả thí 
nghiệm trước
Thí nghiệm
Thí nghiệm khảo sát ảnh hưởng của các 
chất phụ gia đến độ chắc sản phẩm:
Lặp lại A B C D
1 55 45 65 25
2 50 40 60 55
3 65 35 55 50
4 40 65 65 40
Quan sát
 là phương pháp dùng giác quan, thiết bị 
 để ghi nhận hiện tượng
Yếu tố
 là một biến số ảnh hưởng đến kết quả thu 
được
 là tập hợp nhiều nghiệm thức cùng một 
đặc tính 
Nghiệm thức
 Nghiệm thức là tình trạng khác nhau của 
một yếu tố mà muốn nghiên cứu. 
 Nghiệm thức cĩ thể là nồng độ hĩa chất, 
giống vi sinh, thời gian xử lý, ...
 Số liệu thu thập từ thí nghiệm sẽ tăng lên 
rất nhiều nếu áp đặt nhiều nghiệm thức và 
thiếu hiểu biết cơ bản về yếu tố nghiên 
cứu.
Nghiệm thức
 Hiểu biết về nguyên liệu thí nghiệm hay 
mức độ ảnh hưởng của yếu tố cĩ thể hạn 
chế các nghiệm thức khơng cần thiết. 
 Hiểu biết về tác động của nồng độ của 
một hĩa chất, chỉ cần đặt các nghiệm thức 
trong phạm vi nồng độ tối thiểu và nồng 
độ tối đa cần thiết. 
Nghiệm thức
 tập hợp các điều kiện áp dụng cho các 
ĐVTN
 cĩ thể là mức của một yếu tố hay đối 
chứng 
Đơn vị thí nghiệm (ĐVTN)
 Đơn vị thí nghiệm là đơn vị cơ bản về 
mặt hình thức khi tổ chức một thí nghiệm. 
Đơn vị thí nghiệm (ĐVTN)
 là một thí nghiệm của sơ đồ bố trí 
 là đơn vị nhỏ nhất 
Sai số lấy mẫu
 là sự biến thiên giữa các đơn vị lấy mẫu
 trong cùng một đơn vị thí nghiệm 
Nguyên tắc bố trí thí nghiệm
 Nguyên tắc cơ bản
 Nguyên tắc không cơ bản
Nguyên tắc cơ bản
 lặp lại
 ngẫu nhiên
 kiểm sốt địa phương
Sự lặp lại
 Mỗi đơn vị thí nghiệm phải hiện diện 
nhiều lần trong một cuộc thí nghiệm, đĩ 
là sự lặp lại.
 Một lơ thí nghiệm khơng lặp lại khơng đo 
được sự biến thiên, từ đĩ khơng thể tính 
tốn được mức tin tưởng của các kết luận.
 Lặp lại càng nhiều, trung bình và sai số 
tiêu chuẩn tính cho mỗi nghiệm thức càng 
tin cậy. 
Sự lặp lại
 Thơng thường thực hiện việc lặp lại từ 4 ¸ 
10 lần tùy theo từng loại thí nghiệm. 
 Một thí nghiệm khơng lặp lại khơng phải 
là thí nghiệm mà chỉ là quan sát sơ bộ hay 
trình bày kết quả.
Sự lặp lại
 hơn 1 DVTN trong 1 nghiệm thức
 là tập hợp hồn chỉnh của các NT
Mục đích :
 thí nghiệm thống kê trở nên chính xác 
hơn
 giảm sai số một cách cĩ ý nghĩa
Ngẫu nhiên
 bảo đảm tính hiệu lực của sự đánh giá
 làm cơng bằng sự khác biệt giữa các 
nghiệm thức 
 cĩ thể tạo được từ các bảng số ngẫu 
nhiên 
Kiểm sốt địa phương
 là phân nhĩm, phân lơ, phân khối
 giảm sai số thí nghiệm
 cực đại sự khác biệt giữa các khối
 cực tiểu sự khác biệt bên trong khối
 nghiệm thức được bố trí ngẫu nhiên trong 
khối 
Nguyên tắc khơng cơ bản
 độ nhạy
 tính trực giao
 sự nhầm lẫn 
Những điều cần tuân thủ khi bố trí thí 
nghiệm
• Xác định mục tiêu nghiên cứu 
• Xác định các yếu tố thí nghiệm 
• Xác định các lơ TN, DVTN 
• Xác định sự quan sát 
• Xác định mẫu thí nghiệm 
• Thực hiện thí nghiệm, phân tích số liệu, 
giải thích và báo cáo kết quả 
Xác định mục tiêu nghiên cứu 
 Xác định phạm vi quần thể mà dự định 
sẽ áp dụng kết quả suy diễn từ cuộc thí 
nghiệm và lấy mẫu trong phạm vi của 
quần thể đĩ. 
Xác định mục tiêu nghiên cứu 
 Đặt ra các câu hỏi cần giải đáp, thường 
là tìm kết luận về nồng độ, kết luận về 
một giả thiết ảnh hưởng của một yếu tố.
Xác định mục tiêu nghiên cứu 
 vấn đề quan trọng của việc tổ chức 
nghiên cứu
 quyết đinh thành cơng, thất bại của 
nghiên cứu. 
 xuất phát từ địi hỏi của sản xuất
 cĩ đơn đặt hàng
 yêu cầu của cơ quan cấp kinh phí
Xác định các yếu tố thí nghiệm 
Số yếu tố: 
 một, hai, hay nhiều hơn 
 khơng nên quá nhiều yếu tố trong một 
thí nghiệm.
Bản chất của mỗi yếu tố: 
 định tính hay định lượng
 cố định hay ngẫu nhiên 
Xác định các yếu tố thí nghiệm 
Mức độ của mỗi yếu tố: 
 quan trọng cho yếu tố định lượng
 tổng nghiệm thức bằng tích số yếu tố với 
mức độ 
 các NT phải phân bố ngẫu nhiên vào các 
lơ TN 
Xác định các lơ TN, DVTN 
 mỗi nghiệm thức tương ứng với 1 lơ thí 
nghiệm.
 đơn vị thí nghiệm phải đồng nhất
 cần xác định số lặp lại hay ĐVTN cho 
mỗi NT
Xác định sự quan sát 
 quan sát được thực hiện để đánh giá ảnh 
hưởng
 NT xác định trước cũng như đơn vị đo 
lường
 trước khi phân tích phải kiểm chứng giả 
thuyết 
 số liệu quan sát khơng phù hợp với giả 
thuyết thì phải biến đổi số liệu. 
Xác định mẫu thí nghiệm 
Mẫu thí nghiệm:
 phải mang tính ngẫu nhiên
 mang tính đại diện
 tránh chọn mẫu theo chủ quan người 
nghiên cứu 
Thực hiện thí nghiệm, phân tích số liệu, 
giải thích và báo cáo kết quả 
a. Việc thực hiện thí nghiệm:
 tránh sai số khi thu thập các số liệu.
 tránh sai số khi sao chép
 kiểm tra số liệu sao chép.
 Kiểm tra các điều kiện nghiên cứu
Nguyên tắc khi thu thập số liệu
 Đo đếm kết quả đúng lúc và chính xác
 Chọn thời điểm đo hợp lý
 Hạn chế các điều kiện khách quan
 Loại bỏ các số liệu đột biến
Đo đếm kết quả đúng lúc và chính xác
 Cần phải thực hiện đo đếm một cách
đồng nhất giữa các nghiệm thức vì nếu
đo khơng đồng nhất sẽ làm tăng sự sai
biệt gây ra do các yếu tố khơng kiểm
sốt và làm tăng sai số thí nghiệm.
 Khi đo đếm phải dùng một thiết bị đồng
nhất, giữa các nghiệm thức phải cùng do
một người hay một nhĩm đo.
Chọn thời điểm đo hợp lý
 Thời điểm đo đếm cũng rất quan
trọng.
Hạn chế các điều kiện khách quan
 Thí nghiệm đặt trên đất hay trong đất
 Thí nghiệm liên quan đến chất lỏng
(nước thải)
 Lơ thí nghiệm đặt cạnh nhau cĩ thể bị
sai lệch do nước chảy lan sang ơ bên
cạnh.
 Ngồi ra giĩ, ánh sáng cĩ thể cĩ ảnh
hưởng đến kết quả.
Loại bỏ các số liệu đột biến
 Trong quá trình thí nghiệm kết quả đo
được đơi khi cĩ những giá trị đột biến
(tăng hoặc giảm) bất thường.
 Đối với những số liệu này chỉ ghi nhận
và tìm cách giải thích nĩ chứ khơng mơ
phỏng và sử dụng cho thí nghiệm.
Thực hiện thí nghiệm, phân tích số liệu, 
giải thích và báo cáo kết quả 
Khi xử lý số liệu thí nghiệm cĩ thể cĩ nhiều 
cách: 
 Sử dụng các phần mềm xử lý như 
Statgraphic, MSTATC, MINITAB, ... 
Cách này đơn giản, dễ sử dụng, ít bị 
nhầm lẫn trong tính tốn.
Thực hiện thí nghiệm, phân tích số liệu, 
giải thích và báo cáo kết quả 
 Sử dụng các bảng tính điện tử như
Lotus, Quattro, Excel, ... lập bảng tính
theo các cơ sở tốn học thống kê thích
hợp cho từng phương pháp.
 Cách này cĩ lợi cho các thí nghiệm địi
hỏi kiểu bố trí đặc biệt như kiểu lơ phụ,
khối đầy đủ.
Thực hiện thí nghiệm, phân tích số liệu, 
giải thích và báo cáo kết quả 
b. Phân tích số liệu và giải thích kết quả:
 là quan trọng nhất trong nghiên cứu suy 
diễn 
 phân tích kết quả thu thập trước khi 
ngưng TN
Thực hiện thí nghiệm, phân tích số liệu, 
giải thích và báo cáo kết quả 
 phân tích số liệu phải phù hợp với mơ
hình tốn
 kết quả phải được giải thích trong điều
kiện TN
Thực hiện thí nghiệm, phân tích số liệu, 
giải thích và báo cáo kết quả 
 phân tích số liệu phải phù hợp với mơ 
hình tốn 
 kết quả phải được giải thích trong điều 
kiện TN 
 các so sánh trung bình giữa các 
nghiệm thức
 sự tương tác giữa các yếu tố 
4.5 Kiểu bố trí thí nghiệm trong nghiên 
cứu thực nghiệm
 Phương pháp bố trí thí nghiệm
 Kiểu bố trí thí nghiệm
Phương pháp bố trí thí nghiệm
 Lập kế hoạch các bứơc cần tiến
hành để thu thập số liệu khoa
học cho vấn đề đang nghiên cứu
 Bố trí thí nghiệm giúp tìm ra ảnh
hưởng của các yếu tố liên
quan đến đại lượng đang được
quan tâm
 Yếu tố thí nghiệm
 Kiểu bố trí thí nghiệm
Bố trí thí nghiệm
 Thí nghiệm một yếu tố
 Thí nghiệm nhiều yếu tố
Yếu tố thí nghiệm
Thí nghiệm một yếu tố
 cĩ một yếu tố chính thay đổi
 các yếu tố khác được giữ cố định 
Thí nghiệm một yếu tố
 Thí nghiệm trong đĩ chỉ xem xét và đi
đến kết luận đối với giả thiết về một yếu
tố, các yếu tố khác cĩ ảnh hưởng đến kết
quả đều phải được thực hiện đồng nhất
trong các đơn vị thí nghiệm gọi là thí
nghiệm một yếu tố.
Thí nghiệm nhiều yếu tố
 Thí nghiệm nhiều yếu tố được tổ chức 
để nghiên cứu ảnh hưởng của hai hay 
nhiều yếu tố cùng lúc 
 Hồn tồn ngẫu nhiên (CRD - Completely 
randomized design)
 Khối ngẫu nhiên đầy đủ (RCBD -
Randomzied complete block design)
 Bình phương Latinh (LSD - Latin 
Squared design)
Kiểu bố trí thí nghiệm
 Kiểu thí nghiệm hồn tồn ngẫu nhiên 
(CRD -Completely randomized design)
 Xử lý số liệu thí nghiệm kiểu hồn tồn 
ngẫu nhiên bằng phần mềm Statgraphics
5. Xử lý số liệu thí nghiệm kiểu hồn tồn 
ngẫu nhiên bằng phần mềm Statgraphics
 NT phân phối ngẫu nhiên hồn tồn
 kiểu thí nghiệm cơ bản, dễ phân tích và 
bố trí.
 điều kiện ngoại cảnh, vật liệu ĐVTN 
đồng nhất
 ít xảy ra trong thực tế sản xuất
 thích hợp trong phịng thí nghiệm
5.1 Kiểu thí nghiệm hồn tồn ngẫu nhiên 
(CRD -Completely randomized design)
 mềm dẻo về số nghiệm thức và số lần lặp 
lại.
 số lần lặp lại cĩ thể khác nhau ở các 
nghiệm thức 
 phân tích thống kê đơn giản
Thuận lợi:
 sai số TN gồm sự biến thiên giữa các 
ĐVTN
 địi hỏi vật liệu làm thí nghiệm phải đồng 
nhất
Bất lợi:
 Phân tích phương sai
 Ước lượng và kiểm định giả thiết thống 
kê
 So sánh trung bình giữa các nghiệm thức
 Phân tích, đánh giá kết quả và trình bày 
báo cáo thí nghiệm
 Xử lý số liệu thí nghiệm kiểu hồn tồn 
ngẫu nhiên bằng phần mềm Statgraphics
5.2 Xử lý số liệu thí nghiệm kiểu hồn tồn 
ngẫu nhiên bằng phần mềm Statgraphics
Phân tích phương sai
 ANOVA đo lường sự khác biệt chung
giữa các trị trung bình mà khơng đo
lường sự khác biệt giữa các trị trung bình
cụ thể nào đĩ
Ước lượng và kiểm định giả thiết 
thống kê
 Cơ sở lý thuyết của ước lượng điểm và 
ước lượng khoảng tin cậy 
 Trắc nghiệm giả thiết thống kê
Cơ sở lý thuyết của ước lượng điểm và 
ước lượng khoảng
 Nghiên cứu trên mẫu
 Muốn biết những đặc trưng của mẫu là 
của tổng thể, cần phải ước lượng
 Thơng thường ước lượng số trung bình và 
tỷ lệ trung bình của tổng thể
 Thơng báo trung bình của tổng thể là một 
giá trị cụ thể 
 Mỗi mẫu là ước lượng điểm của trung 
bình tổng thể
 Biến thiên từ mẫu này đến mẫu khác là 
khác nhau nên ước lượng điểm ít chính 
xác
Ứớc lượng điểm
 Sau khi xây dựng được hàm hồi
quy giữa x và y, sử dụng nó để
phát triển một ước lượng điểm
của giá trị trung bình y đối với
giá trị x nhất định hoặc dự đoán
một giá trị nhất định của y tương
ứng với một giá trị nhất định
của x. 
Ứớc lượng điểm
 Tuy nhiên, ước lượng điểm không
cung cấp một thông tin nào về
độ chính xác có liên quan đến
một ước lượng.
 Vì thế cần phải phát triển một
ước lượng khoảng.
Ứớc lượng điểm
Có hai kiểu ước lượng khoảng:
 ước lượng khoảng tin cậy (khoảng
tin cậy của giá trị trung bình ytb
đối với giá trị cụ thể của x) 
 ước lượng khoảng dự đoán (ước
lượng khoảng của 1 giá trị y nhất
định đối với một giá trị x nhất
định)
Ước lượng khoảng tin cậy
Sử dụng hàm hồi quy ước
lượng để ước lượng và dự
đoán
y = f(x) 
Giới hạn khoảng
tin cậy
Giới hạn khoảng
dự đoán
Khoảng tin cậy, khoảng dự đoán của y tương ứng với giá trị
Trắc nghiệm giả thiết thống kê
 Kiểm định ý nghĩa thống kê là khẳng
định mối quan hệ tìm thấy được trong
các dữ liệu của mẫu cũng cĩ thể được
tìm thấy trong dân số
 Cần phải xác định được xác xuất (cơ
may) để tìm ra được mối quan hệ trong
mẫu khi quan hệ đĩ khơng cĩ trong dân
số.
Trắc nghiệm giả thiết thống kê
 Xác xuất để tìm ra một quan hệ trong
mẫu nghiên cứu được gọi là mức ý nghĩa
của quan hệ.
 Mức ý nghĩa thể hiện từ 0 đến 1
 Xác xuất càng nhỏ thì cơ may xuất hiện
càng ít và ngược lại
Kiểm định ý nghĩa thống kê
 Theo qui ước, một xác xuất p
(probability) ≤ 0,05 là đủ lý lẻ để kết
luận với ý nghĩa thống kê một quan hệ
nào đĩ.
 Mức ý nghĩa thống kê được thể hiện
bằng biểu thức p<0,05 p<0,01 hoặc
p<0,001
So sánh trung bình giữa các nghiệm 
thức
 Sau khi phân tích ANOVA với kết quả
cĩ ảnh hưởng của yếu tố thí nghiệm đến
chỉ tiêu quan sát, cần phải so sánh tất cả
các cặp trung bình của các nghiệm thức
 Trắc nghiệm LSD (least significant
difference)
Multiple Range Tests for dochac by tylebanhmi
--------------------------------------------------------------------------------
Method: 95,0 percent LSD
kichco Count Mean Homogeneous Groups
--------------------------------------------------------------------------------
2 3 1,54367 X
4 3 1,663 X
6 3 1,75867 X
--------------------------------------------------------------------------------
Contrast Difference +/- Limits
--------------------------------------------------------------------------------
2 - 4 *-0,119333 0,112609
2 - 6 *-0,215 0,112609
4 - 6 -0,0956667 0,112609
--------------------------------------------------------------------------------
* denotes a statistically significant difference.
So sánh trung bình giữa các nghiệm 
thức
Phân tích, đánh giá kết quả và trình bày 
báo cáo thí nghiệm
 Kết quả phân tích xử lý số
liệu giúp quyết định đúng đắn
vấn đề đang nghiên cứu để có
những cải tiến thích hợp
Phân tích, đánh giá kết quả và trình bày 
báo cáo về thí nghiệm 
Tham số
thống
kê
Tỷ lệ bánh mì vụn (%)
2 4 6
n 3 3 3
X ,1 54a ,1 66b ,1 75b
SD ,0 08 ,0 03 ,0 04
(a, b chỉ sự khác biệt có ý nghĩa thống kê ở mức tin cậy %)95
Ý nghĩa của phân tích phương sai
 ANOVA cho phép đánh giá những mức
ý nghĩa thống kê của những khác biệt
giữa các trị trung bình
 Phân tích phương sai cho phép khai thác
một cách đầy đủ các đặc tính tốn học
của biến và giúp tìm ra ý nghĩa thống kê
của những khác biệt giữa 3 trị trung bình
trở lên.
Phân tích phương sai dựa trên các giả 
định
 Chọn mẫu ngẫu nhiên
 sự độc lập giữa các trung bình
 Biến phụ thuộc cĩ phân phối chuẩn trong
dân số
Thành phần bảng phân tích phương sai
Analysis of Variance
-----------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------
Between groups 2,82137 3 0,940456 8,62 0,0069
Within groups 0,872533 8 0,109067
-----------------------------------------------------------------
Total (Corr.) 3,6939 11
Nguồn biến 
thiên
Tổng bp 
(SS)
bậc tự do
(df)
Phương sai 
(MS)
F
Giữa các 
nghiệm thức
SSnt k - 1 SSnt / dfnt MSnt/MSe
Trong nội bộ 
nghiệm thức 
(sai số)
SSe n – k SSe/ dfe
tổng SST n – 1 SSt/ dfT
Thành phần bảng phân tích phương sai
Biến thiên của biến độc lập:
 Biến thiên mà quan sát được giữa các
nhĩm trong biến độc lập (between
groups)
 Biến thiên mà quan sát được trong từng
nhĩm của biến độc lập hay gọi là biến
thiên trong nội bộ của nhĩm (within
groups)
Total sum of squares
 Tổng các độ lệch bình phương chung
(total sum of squares) cho biết mức độ
biến thiên của các điểm số so với trung
bình chung
2)(  TiT XXSS
Within-groups sum of squares
 Tổng các độ lệch bình phương trong nội
bộ nhĩm (within-groups sum of squares)
cho biết mức độ biến thiên của các điểm
số so với trung bình của nhĩm nội bộ
2)(  Gie XXSS
Between-groups sum of squares
 Tổng các độ lệch bình phương giữa các
nhĩm (between-groups sum of squares)
đo lường độ biến thiên giữa các trị trung
bình của các nhĩm so với trung bình
chung:
SSnt=SST-SSe
Bậc tự do:
 Bậc tự do chung dfT= n-1 (n tổng số
trường hợp)
 Bậc tự do giữa các nhĩm dfnt= k-1 (k là
số giá trị của biến độc lập)
 Bậc tự do nội bộ nhĩm dfe= n-k
Phương sai chung
1
)( 2
n
XX
MS TiT
Phương sai trong nội bộ nhĩm
kn
XX
MS Gie 
2)(
Phương sai giữa các nhĩm
SSnt/(k-1)
 F tính = MSnt/MSe
Ví dụ: Độ chắc sản phẩm ứng các chất 
phụ gia thể hiện bảng:
Lặp lại A B C D tổng
1 55 45 65 25
2 50 40 60 55
3 65 35 55 50
4 40 65 65 40
5 60 45 65
tổng 270 230 310 170 980
ANOVA - analysis of variance
Nguồn biến 
thiên
Tổng bp 
(SS)
bậc tự do
(df)
Phương sai 
(MS)
F
Giữa các 
nghiệm 
thức
SSnt J - 1 = 
4 – 1 = 3
1057,632/3 = 
352,33
352,33/99,67 
= 3,535
Trong nội 
bộ 
nghiệm 
thức (sai 
số)
SSe n – j = 19 – 4 = 15 1495/15 = 
99,67
tổng SSt n – 1 = 19 – 1 = 
18
2552,632/18 = 
141,81
Tra bảng Fisher, với 3 bậc tự do ở tử và 15 
bậc tự do ở mẫu, được: 
F0,05 = 3,29
F0,01 = 5,42
với Ftính = 3,535 > 3,29 kết luận cĩ khác 
biệt ở 95%
Xử lý số liệu thí nghiệm kiểu hồn tồn 
ngẫu nhiên bằng phần mềm Statgraphics
 Nhập dữ liệu
 Chọn lệnh xử lý
 Đọc kết quả
 Chép kết quả vào WORD
 Kiểu thí nghiệm khối ngẫu nhiên đầy đủ 
(RCBD - Randomzied complete block 
design)
 Xử lý số liệu thí nghiệm kiểu khối ngẫu 
nhiên đầy đủ bằng phần mềm 
Statgraphics
6. Xử lý số liệu thí nghiệm kiểu khối ngẫu 
nhiên đầy đủ bằng phần mềm Statgraphics
 điều kiện ngoại cảnh khơng được kiểm 
sốt
 Điều kiện ngoại cảnh tác động làm sai số 
của thí nghiệm tăng lên
6.1 Kiểu thí nghiệm khối ngẫu nhiên đầy đủ
 ĐVTN của NT hiện diện trong cùng khối
 Đơn vị thí nghiệm trong khối chịu ảnh 
hưởng như nhau
 Các NT bố trí ngẫu nhiên vào các ĐVTN
 Làm giảm sai số ngẫu nhiên giữa các khối
 Tạo cơ hội đồng đều hơn khi so sánh các 
nghiệm thức
Phải bố trí làm sao giảm được ảnh 
hưởng của yếu tố ngoại cảnh:
 Các đơn vị thí nghiệm phải được giữ cùng 
1 điều kiện
 Nếu cĩ thay đổi phải thay đổi trên tồn 
khối
Lưu ý:
 Mỗi NT hiện diện 1 lần trong mỗi khối
 Mỗi khối cĩ đầy đủ tất cả các nghiệm 
thức 
 Dễ dàng tính kết quả.
 Chính xác hơn kiểu hồn tồn ngẫu nhiên.
 Khơng bị hạn chế ở số nghiệm thức hay 
số khối. 
Thuận lợi:
 Khi cĩ nhiều biến thiên giữa các đơn vị 
thí nghiệm trong một khối sẽ cĩ sai số thí 
nghiệm lớn
Bất lợi:
 Phân tích phương sai
 So sánh trung bình giữa các nghiệm thức
 Xử lý số liệu thí nghiệm kiểu khối ngẫu 
nhiên đầy đủ bằng phần mềm 
Statgraphics
6.2 Xử lý số liệu thí nghiệm kiểu khối ngẫu 
nhiên đầy đủ bằng phần mềm Statgraphics
Xử lý số liệu thí nghiệm kiểu khối ngẫu 
nhiên đầy đủ bằng phần mềm Statgraphics
 Nhập dữ liệu
 Chọn lệnh xử lý
 Đọc kết quả
 Chép kết quả vào WORD
 Kiểu thí nghiệm bình phương Latin (LSD 
- Latin Squared design)
 Xử lý số liệu thí nghiệm kiểu bình 
phương Latin bằng phần mềm 
Statgraphics
7. Xử lý số liệu thí nghiệm kiểu bình 
phương Latin bằng phần mềm Statgraphics
 Các vật liệu trên đơn vị thí nghiệm khơng 
đồng nhất
 Thí nghiệm cĩ tác động của hai yếu tố 
ngoại cảnh.
 Số lần lặp lại bằng số nghiệm thức 
 Số đơn vị thí nghiệm bằng số nghiệm 
thức bình phương.
7.1 Kiểu thí nghiệm bình phương Latin 
 Đơn vị thí nghiệm được xếp theo hình 
vuơng cĩ hàng và cột
 Mỗi hàng và mỗi cột đều cĩ đủ các 
nghiệm thức
 Mỗi nghiệm thức xuất hiên 1 lần trong 
mỗi hàng và cột
7.1 Kiểu thí nghiệm bình phương Latin
 Phân tích phương sai
 So sánh trung bình giữa các nghiệm thức
 Xử lý số liệu thí nghiệm kiểu bình 
phương Latin bằng phần mềm 
Statgraphics
7.2 Xử lý số liệu thí nghiệm kiểu bình 
phương Latin bằng phần mềm Statgraphics
Xử lý số liệu thí nghiệm kiểu bình phương 
Latin bằng phần mềm Statgraphics
 Nhập dữ liệu
 Chọn lệnh xử lý
 Đọc kết quả
 Chép kết quả vào WORD
8. Xử lý số liệu thí nghiệm đa yếu tố bằng 
phần mềm Statgraphics
 Trường hợp cần nghiên cứu ảnh hưởng 
của nhiều yếu tố đến kết quả
 Trong thí nghiệm nhiều tố, khơng chỉ 
biết ảnh hưởng của từng yếu tố mà cịn 
cĩ tác dụng tương hỗ của giữa các yếu tố 
 Tương tác là tác dụng cĩ thêm vì ảnh 
hưởng đồng thời của 1 hoặc nhiều yếu tố
Phân tích phương sai đa biến
 Phân tích phương sai cho đa biến độc lập
(nhiều yếu tố-multifactor analysis of
variance ) cho phép xem xét cùng một
lúc tác động của nhiều biến độc lập và
tác động của sự kết hợp giữa các biến
này với biến phụ thuộc
Xử lý số liệu thí nghiệm 2 yếu tố bằng phần 
mềm Statgraphics
 Nhập dữ liệu
 Chọn lệnh xử lý
 Đọc kết quả
 Chép kết quả vào WORD
9. Xử lý số liệu thí nghiệm hồi quy và 
tương quan tuyến tính bằng phần mềm 
Statgraphics
 Khái niệm hồi quy và tương quan
 Hồi quy và tương quan tuyến tính đơn 
biến
 Hồi quy và tương quan tuyến tính đa
biến
 Xử lý số liệu thí nghiệm hồi quy và 
tương quan tuyến tính bằng phần mềm 
Statgraphics
9.1 Khái niệm hồi quy và tương quan
 Phân tích hồi qui
 Đồ thị phân tán
 Phân tích tương quan
 Trong nhiều trường hợp cĩ hai hoặc
nhiều biến số cĩ quan hệ thì việc tìm mơ
hình và giải thích mối quan hệ này là
quan trọng, sẽ giúp cho việc dự đốn, tối
ưu hoặc kiểm sốt quá trình
Phân tích hồi qui
 giả sử biến phụ thuộc y cĩ quan hệ với n
biến độc lập, thì mối quan hệ được biểu
diễn bởi một mơ hình tốn học gọi là
phương trình hồi qui:
y = f(x1, x2, xn)
Phân tích hồi qui
 Thơng thường việc phân tích ANOVA
của một thí nghiệm giúp xác định yếu tố
nào là quan trọng, sau đĩ hồi qui giúp
xây dựng mơ hình định lượng giữa yếu
tố phụ thuộc với các yếu tố quan trọng
đĩ
Phân tích hồi qui
Đồ thị phân tán giúp nhìn thấy rõ mối quan hệ
giữa 2 biến
Biến độc lập
Biến phụ thuộc
0
Đồ thị phân tán
Biến 
độc lập
Biến phụ 
thuộc
0
Quan hệ dương
Đồ thị phân tán
Quan hệ dương là 
mối quan hệ mà 
trong đĩ các giá trị 
lớn nhất của một 
biến nào đĩ gắn kết 
với những giá trị lớn 
nhất của biến cịn lại.
 Quan hệ âm là mối
quan hệ mà trong đĩ
các giá trị lớn nhất
của một biến nào đĩ
gắn kết với những giá
trị nhỏ nhất của biến
cịn lại.
Đồ thị phân tán
0
Biến 
độc lập
Biến phụ 
thuộc
Quan hệ âm
 Quan hệ tương quan cong là những mối
quan hệ mà trong đĩ các trường hợp
mang những giá trị lớn và nhỏ trong
biến độc lập cũng cĩ những giá trị tương
ứng trong biến phụ thuộc
Đồ thị phân tán
 Mức độ của mối quan hệ được đo lường
bởi độ tập trung của các điểm dữ kiện trên
đường thẳng hồi qui trong đồ thị phân tán
Phân tích tương quan 
 Nếu các trường hợp tập trung gần đường
hồi qui sẽ cĩ mối quan hệ mạnh mẽ
 Nếu các trường hợp phân tán xa đường
hồi qui sẽ cĩ mối quan hệ yếu
Phân tích tương quan 
 Sự khơng thích hợp giữa dữ kiện và mục
đích
 Sự khái quát kết quả quá giới hạn
 Sử dụng số liệu từ các lần lặp lại riêng lẻ
thay vì sử dụng trung bình của các lần lặp
lại
Lạm dụng phân tích tương quan 
 sự diễn đạt kết quả của tương quan hồi
quy phụ thuộc rất lớn vào kiểu dữ kiện
đang sử dụng
Sự khơng thích hợp giữa dữ kiện và 
mục đích
 áp dụng hàm hồi quy ngồi phạm vi dữ
kiện đã được sử dụng của biến số là một
trong những lạm dụng thường xảy ra.
Sự khái quát kết quả quá giới hạn
 sử dụng kết quả phân tích hồi quy tương
quan như là một phương pháp thay thế
cho việc đo đếm thu thập số liệu, thay vì
đo đếm số liệu lại dùng hồi quy tương
quan để suy diễn số liệu cho một yếu tố
nào đĩ trong nghiên cứu
Sự khái quát kết quả quá giới hạn
khi phân tích tương quan hồi quy cho dữ
liệu từ các thí nghiệm lặp lại các nghiệm
thức cĩ 2 cách sử dụng dữ kiện:
 sử dụng dữ kiện từ các nghiệm thức riêng
lẻ
 sử dụng dữ kiện từ trung bình của các lần
lặp lại trong mỗi nghiệm thức.
Sử dụng số liệu từ các lần lặp lại riêng lẻ 
thay vì sử dụng trung bình của các lần lặp 
lại
 nên dùng dữ kiện từ trung bình của các
lần lặp lại trong mỗi nghiệm thức vì biến
thiên giữa các lần lặp lại khơng nên tham
gia vào đánh giá tương quan đang nghiên
cứu.
Sử dụng số liệu từ các lần lặp lại riêng lẻ 
thay vì sử dụng trung bình của các lần lặp 
lại
 Số liệu giả
 Ngộ nhận giữa nguyên nhân và hậu quả
 Phân biệt các nhĩm biến số trong phân
tích hồi qui và tương quan
Kiểu sai lệch khi diễn đạt kết quả của 
hồi quy đơn giản 
 số liệu mà phân bố của nĩ trong phạm vi
của biến độc lập hơi bất thường.
 dữ kiện chỉ tập trung ở hai cực cịn
khoảng giữa khơng cĩ, trong trường hợp
này xác lập hồi quy đơn thường cĩ kết
quả với hệ số tương quan cao.
Số liệu giả
 hệ số tương quan r cĩ ý nghĩa tức là hiện
diện một mối quan hệ nhân quả giữa hai
biến số.
 khi phân tích tương quan cĩ thể định
lượng mức độ kết hợp giữa hai đặc tính
cũng khơng thể và khơng nên đưa ra lý do
cho sự kết hợp đĩ.
Ngộ nhận giữa nguyên nhân và hậu quả 
9.2 Hồi quy và tương quan tuyến tính đơn 
biến
 Hồi qui và đường thẳng bình phương 
nhỏ nhất
 Đường thẳng hồi qui
 Mơ hình hồi qui
 Hàm hồi qui 
Biến phụ thuộc
0
Biến độc 
lập
Đường thẳng cực tiểu 
hố tổng các độ lệch 
bình phương giữa 
đường thẳng với các 
điểm số thuộc biến 
phụ thuộc
Hồi qui và đường thẳng bình
phương nhỏ nhất
 Đường thẳng hồi qui dự đốn một cách
chính xác điểm số trong biến phụ thuộc
của một trường hợp nào đĩ khi biết được
điểm số trong biến độc lập của trường
hợp đĩ
 Một đường thẳng mơ tả mối quan hệ nào
đĩ gọi là hồi qui tuyến tính
Đường thẳng hồi qui 
 Hàm số mô tả quan hệ giữa y
với x và sai số € được gọi là
mô hình hồi quy.
 Mô hình hồi quy tuyến tính đơn
có dạng: y = ß
1
x + ß
0
+ €
 Trong mô hình hồi quy tuyến tính
đơn, ß
1
và ß
0
là các tham số của
mô hình, € là biến ngẫu nhiên
biểu thị sai số của mô hình
Mô hình hồi qui 
 Một trong những giả định là
trị số kỳ vọng của € bằng
zero, nghĩa là E(€) = 0.
Mô hình hồi qui 
 Hàm số mô tả giá trị trung
bình của y có quan hệ với x
được gọi là hàm hồi quy.
 Hàm hồi quy đối với hồi quy
tuyến tính đơn có dạng: E(y)= ß
1
x
+ ß
0
Hàm hồi qui 
 Đồ thị của hàm hồi quy tuyến
tính đơn là một đường thẳng,
trong đó ß
0
là điểm chặn của
đường hồi quy, ß
1
là độ dốc của
đường hồi quy.
 Khi biết các tham số ß
1
và ß
0
có
thể sử dùng hàm hồi qui để tính
giá trị trung bình y đối với giá
Hàm hồi qui 
 Nhưng trong thực tế chưa biết các
tham số ß
1
và ß
0
, do đó chúng ta
phải ước lượng các tham số này
từ các quan sát mẫu.
Hàm hồi qui 
 Các thống kê mẫu b
1
và b
0
được
xem như là các ước lượng tương
ứng của ß
1
và ß
0
khi thay thế b
1
và
b
0
tương ứng cho ß
1
và ß
0
chúng ta
nhận được hàm hồi quy ước
lượng có dạng: y’ = b
1
x + b
0
Hàm hồi qui 
Với:
 b
0
là điểm chặn và b
1
là độ dốc
của đường hồi quy ước lượng,
 y’ là giá trị ước lượng (kỳ
vọng) của y tương ứng với một
giá trị x nhất định.
Hàm hồi qui 
 Các tham số b
1
và b
0
được tính theo
phương pháp bình phương nhỏ nhất.
 Phương pháp bình phương nhỏ nhất
sử dụng các số liệu của mẫu
để tính các tham số b
1
và b
0
của
hàm hồi quy ước lượng.
Hàm hồi qui 
 Bản chất của phương pháp này là
làm nhỏ nhất tổng bình phương
các sai lệch giữa giá trị của
biến yi và giá trị ước lượng của
biến yi’
Hàm hồi qui 
 Để tổng các (yi-yi’)2 nhỏ nhất thì b1
và b
0
được tính theo công thức:
Tính các thơng số của đường thẳng hồi 
quy 
 21 )(
))((
tbi
tbitbi
xx
yyxx
b
tbtb xbyb 10 
 n = tổng số quan sát.
 xi = giá trị của biến độc lập
tương ứng với quan sát i.
 yi = giá trị của biến phụ thuộc
tương ứng với quan sát i.
 xtb = giá trị trung bình của biến
độc lập.
y = giá trị trung bình biến phụ
Tính các thơng số của đường thẳng hồi 
quy
 Hệ số xác định là số đo mức
độ phù hợp của hàm hồi quy
ước lượng
 Hiệu số (yi-yi’) gọi là sai lệch của
quan sát i. 
Tính hệ số xác định r2
 Tổng bình phương các sai lệch hoặc
sai số (kí hiệu SSE) là một đại
lượng được tối thiểu hoá phương
pháp bình phương nhỏ nhất
Tính hệ số xác định r2
2)'( ii yySSE 
 Giá trị SSE đo đạc sai số khi sử
dụng hàm hồi quy ước lượng để
ước lượng các giá trị của biến
phụ thuộc yi ở mẫu.
Tính hệ số xác định r2
 Nếu sử dụng giá trị ytb của mẫu
để ước lượng yi thì sai số ước
lượng là: yi – ytb
 Đại lượng
được gọi là tổng bình phương toàn
bộ:
Tính hệ số xác định r2
  2)( tbi yy
  2)( tbi yySST
 SST đo đạc sự phân bố của các yi
xung quanh y tb
 SSE đo đạc sự phân bố của các yi
xung quanh y’
Tính hệ số xác định r2
 Để đo đạc giá trị y’ trên đường
hồi quy ước lượng cách xa y tb bao
nhiêu, thì dùng đại lượng tổng
bình phương do hồi quy:
Tính hệ số xác định r2
  2)'( tbyySSR
 Giữa SST, SSE và SSR có mối quan hệ:
= +SST SSR SSE 
Tính hệ số xác định r2
 Nếu tất cả các điểm quan sát yi
đều nằm trên đường y’ thì hàm
hồi quy ước lượng phù hợp hoàn
toàn.
 Điều này có nghĩa yi - yi’ = 0 hay SSE 
= 0, và vì SST = SSE + SSR nên để hàm
hồi quy ước lượng phù hợp hoàn
toàn thì / =SSR SST 1 
Tính hệ số xác định r2
 Như vậy, mức phù hợp của hàm
hồi quy ước lượng phụ thuộc
vào SSE lớn hay nhỏ.
 Tỷ số SSR/SST được gọi là hệ số xác
định, ký hiệu r 2
 r 2 lấy giá trị từ 0 đến .1 
Tính hệ số xác định r2
 hệ số xác định r2 cho biết số tỷ lệ sai biệt 
mà chúng ta đã giảm được khi dự đốn 
điểm số của biến phụ thuộc bằng cách 
dựa vào điểm số của biến độc lập
hungbienthienc
chuocgiaithibienthiendr 2
Tính hệ số xác định r2
 Căn bậc hai của hệ số xác định
được gọi là hệ số tương quan
(ký hiệu r)
 r lấy giá trị từ - 1 đến +1.
Tính hệ số tương quan (r)
 Hệ số tương quan r đo lường một cách
chính xác mức độ tập trung của các điểm
số trên suốt chiều dài của đường hồi qui
Tính hệ số tương quan (r)
 r = 0 thì x và y không có tương
quan
 r = -1 thì x và y có quan hệ tuyến
tính âm rất chặt chẽ, có nghĩa
các điểm quan sát nằm trên
đường thẳng có độ dốc âm.
 r = +1 thì x và y có quan hệ tuyến
tính dương rất chặt chẽ, có nghĩa
Tính hệ số tương quan (r)
Qui chiếu đánh giá r:
 0,0 < r < 0,3 tương quan yếu
 0,3 < r < 0,5 tương quan vừa
 0,5 < r < 0,7 tương quan tương đối chặt 
 0,7 < r < 0,9 tương quan chặt 
 0,9 < r < 1,0 tương quan rất chặt 
Tính hệ số tương quan (r)
 Trong hàm hồi quy tuyến tính
đơn, E(y)= ß
1
x + ß
0
nếu ß
1
= 0 thì E(y)= ß
0
trong trường hợp này ytb không
phụ thuộc vào x, 
 ngược lại nếu ß
1
≠ 0 thì x và y có
quan hệ với nhau. 
 Thực chất của kiểm định mức ý
nghĩa là kiểm định giả thiết H
0
: ß
1
= .
Kiểm định mức ý nghĩa
 Kiểm định t: là xác định hệ số
ß
1
có khác zero hay không.
 Kiểm định F: dựa trên phân bố
xác xuất F, được sử dụng để
kiểm định mức ý nghĩa trong hồi
quy
Kiểm định mức ý nghĩa
 Với hàm hồi quy tuyến tính một
biến, kiểm định F cũng đưa ra
cùng kết luận như kiểm định t,
nhưng hàm hồi quy đa tuyến tính
(từ hai biến độc lập trở lên) thì
chỉ có kiểm định F được sử
dụng.
Kiểm định mức ý nghĩa
 Những quan sát ngoại lai là
những số không phù hợp với
khuynh hướng biến đổi của các
tập hợp quan sát khác hoặc nằm
cách xa trị trung bình của các
quan sát khác.
 Để loại bỏ các số ngoại lai, có
thể sử dụng đồ thị phân tán
hoặc các sai lệch chuẩn.
Phân tích các sai lệch
 Nếu một quan sát phân tán xa trị
trung bình của các quan sát khác
thì sai lệch chuẩn của nó sẽ lớn
hơn về trị tuyệt đối.
 Nói chung, những giá trị quan sát
có sai lệch chuẩn lớn hơn +2 và
nhỏ hơn - 2 là những số ngoại lai
Phân tích các sai lệch
Hồi quy và tương quan phi tuyến tính 
đơn biến (Simple Nonlinear) 
Các tính trạng cĩ quan hệ với nhau theo 
những đường cong:
 Parabol (hàm bậc 2)
 Hình chữ S (hàm bậc 3)
Hồi quy và tương quan phi tuyến tính đơn biến 
(Simple Nonlinear) 
Polynomial Regression Analysis
-----------------------------------------------------------------------------
Dependent variable: y
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT 9,57463 4,72639 2,02578 0,0703
x -4,09341 4,62313 -0,885419 0,3967
x^2 2,12537 1,03897 2,04565 0,0680
-----------------------------------------------------------------------------
Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 215,755 2 107,878 31,20 0,0001
Residual 34,5773 10 3,45773
-----------------------------------------------------------------------------
Total (Corr.) 250,332 12
R-squared = 86,1875 percent
R-squared (adjusted for d.f.) = 83,4249 percent
y = 9,57463-4,09341*x + 2,12537*x^2
9.3. Hồi quy và tương quan tuyến tính đa
biến
 Mơ hình hồi qui mở rộng
 Hồi qui và tương quan bội
Đồ thị phân tán 3 chiều: Biến phụ thuộc
Mô hình hồi qui mở rộng
Biến phụ thuộc
Mặt phẳng hồi qui trong đồ thị 3 
chiều
 Phân tích hồi quy đa biến là
nghiên cứu biến phụ thuộc y có
quan hệ với 2 hay nhiều biến độc
lập hay không.
Hồi qui và tương quan bội
 Mô hình hồi quy đa biến có
dạng:
y = ßo + ß 1x 1 + ß 2x 2 +  + ßnxn + €, 
Với:
ßo ß 1 ß 2  ßn là các tham số
€ là sai số của mô hình.
Hồi qui và tương quan bội
 Trong phân tích hồi quy, biến phản
hồi thay thế cho biến độc lập,
 hồi quy đa biến tạo ra một mặt
phẳng, nên đồ thị của nó gọi
là mặt phẳng phản hồi
Hồi qui và tương quan bội
Hồi qui và tương quan bội
Mặt phẳng tương ứng
với E(y) = ßo + ß 1x 1 + ß 2x 2
Giá trị y khi x 
1
= x 
1
* và x
2
*
(y) khi xE 
1
= x 
1
* và x
2
*
ßo
đồ thị hàm hồi quy để phân tích hồi quy đa
 Hàm hồi quy đa biến có dạng: E(y)
= ßo + ß 1x 1 + ß 2x 2 +  + ßnxn
 Hàm hồi quy đa biến uớc lượng
có dạng:
y’ = b 
0
+ b 
1
x
1
+ b 
2
x
2
+  + b nxn
Hồi qui và tương quan bội
 Trong hồi quy tuyến tính đơn, hệ số
b
1
là ước lượng sự thay đổi của y
theo một đơn vị thay đổi của x. 
 Trong hồi quy đa tuyến tính, hệ số
bi là ước lượng sự thay đổi của y
tương ứng với một đơn vị thay
đổi của xi khi tất các biến độc
lập khác là hằng số.
Hồi qui và tương quan bội
 SST, SSR và SSE có mối quan hệ:
= +SST SSR SSE 
 SST là tổng bình phương toàn bộ:
Hồi qui và tương quan bội
  2)( tbi yySST
 Với SSE là tổng bình phương do sai số
 SSR là tổng bình phương do hồi quy
2)'( yySSE i 
  2)'( tbyySSR
 Hệ số xác định đa biến
giải thích tỷ lệ biến thiên của
biến phụ thuộc y. 
 Hệ số tương quan đa biến của mẫu
R giải thích cường độ quan hệ
giữa y với các biến độc lập.
Hồi qui và tương quan bội
SST
SSRR 2
 Hệ số tương quan bộ phận sẽ đo lường 
được mức độ và hướng của một quan hệ 
nào đĩ đồng thời vẫn kiểm sốt ảnh 
hưởng của một hay nhiều biến khác.
Mơ hình hồi qui đa biến (hồi qui bội):
 Là một thống kê đo lường ảnh hưởng 
chung (ảnh hưởng kết hợp) của một tổng 
thể các biến độc lập đối với một biến phụ 
thuộc
 Cho biết độ lệch giữa các điểm dữ kiện so 
với mặt phẳng hồi qui
 Luơn luơn là số dương (0 đến 1)
Hệ số tương quan bội
Y = a + b1X1 + b2X2
Y là điểm số được dự đốn của biến phụ thuộc
a giao điểm giữa mặt cắt trục của biến phụ thuộc
b1 độ dốc của mặt phẳng so với biến độc lập x1
X1 là điểm số của biến độc lập 1
b2 độ dốc của mặt phẳng so với biến độc lập x2
X2 là điểm số của biến độc lập 2
Phương trình hồi qui bội
 Là các hệ số hồi qui khơng chuẩn hố
 Là những độ dốc bộ phận 
 mơ tả sự thay đổi trong biến phụ thuộc 
gắn với sự gia tăng của một đơn vị nào 
đĩ trong biến độc lập X, đồng thời vẫn 
kiểm sốt được ảnh hưởng của biến độc 
lập cịn lại 
b1 và b2:
 Các biến độc lập cĩ quan hệ tuyến tính 
với biến phụ thuộc
 Các biến độc lập cĩ thể ảnh hưởng với 
biến phụ thuộc nhưng giữa chúng khơng 
cĩ tương tác thống kê
 Các biến độc lập trong mơ hình phải 
khơng cĩ tương quan mạnh mẽ với nhau
Điều kiện cần trong phân tích
hồi qui đa biến
 Trong hồi quy tuyến tính đơn, thống
kê t và F được dùng để kiểm
định sự tồn tại của mô hình.
 Hai kiểm định t và F có ý nghĩa
như nhau, nghĩa là cùng đưa ra
những kết luận giống nhau. 
Kiểm định mức ý nghĩa
 Nhưng trong hồi quy đa tuyến tính,
thống kê t và F được dùng với
ý nghĩa khác nhau: 
 Thống kê F được dùng để xác
định mô hình hồi quy đa tuyến
tính có tồn tại hay không, hay
giữa y với các xi có tồn tại
mối quan hệ hay không.
Kiểm định mức ý nghĩa
 Nếu kiểm định F chỉ ra mối quan
hệ giữa y với các xi có tồn tại
thực sự, thì tiếp theo kiểm định t
sẽ được sử dụng để xác định
từng biến độc lập có ý nghĩa
hay không.
Kiểm định mức ý nghĩa
 Kiểm định t riêng biệt được xây
dựng cho từng biến độc lập, nên
mỗi kiểm định t là một kiểm
định mức ý nghĩa riêng biệt.
Kiểm định mức ý nghĩa
Xử lý số liệu thí nghiệm hồi quy và tương 
quan tuyến tính bằng phần Statgraphics
 Xác định mơ hình tuyến tính
 Xác định mơ hình phi tuyến 
 Xác định mơ hình đơn biến
 Xác định mơ hình đa biến
 Xác định mơ hình bậc nhất
 Xác định mơ hình bậc cao
10. Giải một số bài tốn cơng nghệ bằng 
phần mềm EXCEL 
 Động hĩa học trong cộng nghệ 
 Tiêu diệt vi sinh vật trong xử lý nhiệt
 Kiểm sốt chất lượng trong sản xuất 
 Đánh giá cảm quan sản phẩm 
 Vận chuyển chất lỏng 
10.1 Động hĩa học trong cộng nghệ 
 Xác định hằng số tốc độ của phản ứng 
hố học bậc zero 
 Xác định hằng số tốc độ của phản ứng 
hố học bậc nhất 
 Xác định năng lượng hoạt hố của sự 
phân hủy vitamin trong quá trình bảo 
quản thực phẩm 
 Tốc độ của phản ứng enzyme xúc tác
10.2 Tiêu diệt vi sinh vật trong xử lý 
nhiệt
 Xác định giá trị D (thời gian tiêu diệt) từ 
số liệu vi sinh vật sống sĩt
 Yếu tố kháng nhiệt, giá trị z, trong chế 
biến nhiệt
 Lấy mẫu đảm bảo một lơ khơng bị 
nhiễm với nhiều hơn phần trăm cho 
trước
10.2 Tiêu diệt vi sinh vật trong xử lý 
nhiệt
 Xác định quá trình giết chết VSV đối 
với thực phẩm xử lý nhiệt
 Tính tốn thời gian chế biến nhiệt đối 
với thực phẩm với giá trị z ở 18oF 
 Xác định giá trị tiệt trùng đối với quá 
trình xử lý nhiệt 
10.3 Kiểm sốt chất lượng trong sản 
xuất 
 Biểu đồ kiểm sốt 
 Xác suất xảy ra trong phân phối chuẩn 
 Dùng phân phối nhị thức để xác định 
xác suất xảy ra 
 Xác xuất của khoảng khiểm khuyết 
trong mẫu từ lơ thí nghiệm lớn 
 Xác định giới hạn tin cậy đối với trung 
bình dân số sử dụng phân bố t 
10.4 Đánh giá cảm quan sản phẩm 
 Mơ tả thống kê của dân số ước tính từ 
dữ liệu cảm quan thu được đối với mẫu 
 Phân tích phương sai 1 yếu tố hồn tồn 
ngẫu nhiên 
 Phân tích phương sai đối với kiểu 2 yếu 
tố khơng lặp lại (1 yếu tố khối) 
 Sử dụng hồi qui tuyến tính trong phân 
tích dữ liệu cảm quan 
10.5 Vận chuyển chất lỏng 
 Đo độ nhớt của thực phẩm lỏng 
 Sử dụng ống Pitot để đo tốc độ nước 
trong ống 
            Các file đính kèm theo tài liệu này:
 tailieu.pdf tailieu.pdf