Giáo trình thống kê trong kinh doanh

Tài liệu Giáo trình thống kê trong kinh doanh: TRƯỜNG ĐẠI HỌC ĐÔNG Á KHOA KẾ TOÁN – TÀI CHÍNH GIÁO TRÌNH THỐNG KÊ TRONG KINH DOANH Biên soạn: Ths.Đoàn Thị Yến Nhi Đà Nẵng, năm 2011 CHƯƠNG 1 SƠ LƯỢC VỀ THỐNG KÊ HỌC 1.1. SƠ LƯỢC VỀ SỰ RA ĐỜI VÀ PHÁT TRIỂN CỦA KHOA HỌC THỐNG KÊ Trong cơ chế kinh tế thị trường, các nhà kinh doanh, nhà quản lý, nhà kinh tế có nhiều cơ hội thuận lợi cho công việc nhưng cũng có không ít thử thách. Vấn đề này đòi hỏi các chuyên gia đó phải nâng cao trình độ về thống kê. Đây là một trong những điều kiện tất yếu của kiến thức để cạnh tranh trên thương trường, là yếu tố cần thiết của vấn đề nghiên cứu xu hướng và dự báo về mức cung cầu, từ đó đưa ra các quyết định tối ưu trong các lĩnh vực hoạt động kinh doanh trong nền kinh tế hàng hóa và dịch vụ. Thuật ngữ “Thống kê” được sử dụng và  hiểu theo nhiều nghĩa. Thứ nhất, thống kê được hiểu là một hoạt động thực tiễn về việc thu thập, tích lũy, xử lý và phân tích các dữ liệu số. Những số liệu này đặc trưng về dân số, văn hoá, giáo dục và các hiện tượng ...

docx67 trang | Chia sẻ: ntt139 | Lượt xem: 1751 | Lượt tải: 2download
Bạn đang xem trước 20 trang mẫu tài liệu Giáo trình thống kê trong kinh doanh, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
TRƯỜNG ĐẠI HỌC ĐÔNG Á KHOA KẾ TOÁN – TÀI CHÍNH GIÁO TRÌNH THỐNG KÊ TRONG KINH DOANH Biên soạn: Ths.Đoàn Thị Yến Nhi Đà Nẵng, năm 2011 CHƯƠNG 1 SƠ LƯỢC VỀ THỐNG KÊ HỌC 1.1. SƠ LƯỢC VỀ SỰ RA ĐỜI VÀ PHÁT TRIỂN CỦA KHOA HỌC THỐNG KÊ Trong cơ chế kinh tế thị trường, các nhà kinh doanh, nhà quản lý, nhà kinh tế có nhiều cơ hội thuận lợi cho công việc nhưng cũng có không ít thử thách. Vấn đề này đòi hỏi các chuyên gia đó phải nâng cao trình độ về thống kê. Đây là một trong những điều kiện tất yếu của kiến thức để cạnh tranh trên thương trường, là yếu tố cần thiết của vấn đề nghiên cứu xu hướng và dự báo về mức cung cầu, từ đó đưa ra các quyết định tối ưu trong các lĩnh vực hoạt động kinh doanh trong nền kinh tế hàng hóa và dịch vụ. Thuật ngữ “Thống kê” được sử dụng và  hiểu theo nhiều nghĩa. Thứ nhất, thống kê được hiểu là một hoạt động thực tiễn về việc thu thập, tích lũy, xử lý và phân tích các dữ liệu số. Những số liệu này đặc trưng về dân số, văn hoá, giáo dục và các hiện tượng khác trong đời sống xã hội. Thứ hai, thống kê có thể hiểu là một môn khoa học chuyên biệt hay là một ngành khoa học chuyên nghiên cứu các hiện tượng trong đời sống xã hội nhờ vào mặt lượng của chúng. Như một công cụ, thống kê kinh doanh là các phương pháp quan trọng của việc lập kế hoạch và dự báo của các nhà kinh doanh, nhà quản trị, và các chuyên gia kinh tế. Giữa khoa học thống kê và thực tiễn có mối tương quan và liên hệ mật thiết. Khoa học thống kê sử dụng các số liệu thực tế từ các cuộc điều tra thống kê, tổng hợp chúng lại để phân tích, nhận định về hiện tượng nghiên cứu. Ngược lại, trong những hoạt động thực tiễn, lý thuyết khoa học thống kê được áp dụng để giải quyết cho từng vấn đề quản lý cụ thể. Thống kê có lịch sử phát triển qua nhiều thế kỷ. Sự xuất hiện và phát triển của nó là do nhu cầu thực tiễn của xã hội: Khi cần để tính toán dân số, đất đai canh tác, số gia súc, số tài sản, v.v... Những hoạt động này xuất hiện rất sớm ở Trung Quốc từ thế kỷ 23 trước công nguyên. Vào thời La mã cổ đại cũng diễn ra sự ghi chép, tính toán những người dân tự do, số nô lệ và của cải, Cùng với sự phát triển của xã hội, hàng hóa trong nước cũng như trên thị trường thế giới ngày càng tăng lên, điều này đòi hỏi phải có các thông tin về thống kê. Phạm vi hoạt động của thống kê ngày càng mở rộng, dẫn đến sự hoàn thiện của các phương pháp thu thập, xử lý và phân tích thống kê. Trong thực tế, các hoạt động đa dạng của thống kê được thể hiện nhờ vào sự tích hợp nhiều nguyên lý, từ đó khoa học thống kê được hình thành. Nhiều nhận định cho rằng: Nền tảng của khoa học thống kê được xây dựng bởi nhà kinh tế học người Anh_Wiliam Petty (1623 – 1687). Từ các tác phẩm “Số học chính trị”, “Sự khác biệt về tiền tệ” và một số tác phẩm khác nữa, K. Markc đã gọi Petty là người sáng lập ra môn Thống kê học. Petty đã thành lập một hướng nghiên cứu khoa học gắn với “Số học chính trị”. Một hướng nghiên cứu cơ bản khác cũng làm khoa học thống kê phát triển đó là hướng nghiên cứu của nhà khoa học người Đức G. Conbring (1606 – 1681), ông đã xử lý, phân tích hệ thống mô tả chế độ Nhà nước. Môn sinh của ông là giáo sư luật và triết học G. Achenwall (1719 – 1772) lần đầu tiên ở trường Tổng hợp Marburs (1746) đã dạy môn học mới với tên là “Statistics”. Nội dung chính của khóa học này là mô tả tình hình chính trị và những sự kiện đáng ghi nhớ của Nhà nước. Số liệu về Nhà nước được tìm thấy trong các tác phẩm của M.B. Lomonosov (1711 – 1765), trong đó các vấn đề đưa ra xem xét là dân số, tài nguyên thiên nhiên, tài chính, của cải hàng hóa, ... được minh họa bằng các số liệu thống kê. Hướng phát triển này của thống kê được gọi là thống kê mô tả. Sau đó, giáo sư trường Đại học Tổng hợp Gettingen_A. Sliser (1736 – 1809) cải chính lại quan điểm trên. Ông cho rằng, thống kê không chỉ mô tả chế độ chính trị Nhà nước, mà đối tượng của thống kê, theo ông, là toàn bộ xã hội. Xu hướng toán học trong thống kê được phát triển trong công trình nghiên cứu của Francis Galton (Anh, 1822 – 1911), K. Pearson (Anh, 1857 – 1936), V. S.Gosset (Anh, biệt hiệu Student, 1876 – 1937), R. A. Fisher (Anh, 1890 – 1962), M.Mitrel (1874 – 1948) và một số nhà toán học khác nữa, Góp phần quan trọng cho sự phát triển của thống kê là các nhà khoa học thực nghiệm. Ở thế kỷ XVIII, trong công trình khoa học của I.C. Kirilov (1689 – 1737) và V. N. Tatisev (1686 – 1750) thống kê chỉ được luận giải chủ yếu như một ngành khoa học mô tả. Nhưng sau đó, vào nữa đầu thế kỷ XIX, khoa học thống kê đã chuyển thành ý nghĩa nhận thức. V.S. Porosin (1809 – 1868) trong tác phẩm “Nghiên cứu nhận xét về nguyên lý thống kê” đã nhấn mạnh: “Khoa học thống kê không chỉ giới hạn ở việc mô tả”. Còn I.I. Srezenev (1812 – 1880) trong quyển “Kinh nghiệm về đối tượng, các đơn vị thống kê và kinh tế chính trị” đã nói rằng: “Thống kê trong rất nhiều trường hợp ngẫu nhiên đã phát hiện ra “Những tiêu chuẩn hoá”. Nhà thống kê học danh tiếng D.P. Jurav (1810 – 1856) trong nghiên cứu “Về nguồn gốc và ứng dụng của số liệu thống kê” đã cho rằng: “Thống kê là môn khoa học về các tiêu chuẩn của việc tính toán”. Trong nghiên cứu của giáo sư trường Đại học Bách khoa Peterbur A.A.Truprov (1874 – 1926), thống kê được xem như phương pháp nghiên cứu các hiện tượng tự nhiên và xã hội số lớn. Giáo sư I.U.E. Anson (1835 – 1839, trường Đại học Tổng hợp Peterbur) trong quyển “Lý thuyết thống kê” đã gọi thống kê là môn khoa học xã hội. Đi theo quan điểm này có nhà kinh tế học nổi tiếng A.I. Trurov (1842 – 1908) trong tác phẩm “Thống kê học” đã nhấn mạnh: “Cần nghiên cứu thống kê với qui mô lớn nhờ vào phương pháp điều tra dữ liệu với đầy đủ số lượng và yếu tố cần thiết để từ đó có thể miêu tả các hiện tượng xã hội, tìm ra quy luật và các nguyên nhân ảnh hưởng”. Còn nghiên cứu của nhà bác học A.A. Caufman (1874 – 1919) đã nêu lên quan điểm về thống kê như là “Nghệ thuật đo lường các hiện tượng chính trị và xã hội”. Như vậy, lịch sử phát triển của thống kê cho thấy: Thống kê là một môn khoa học, ra đời và phát triển nhờ vào sự tích lũy kiến thức của nhân loại, rút ra được từ kinh nghiệm nghiên cứu lý thuyết và thực tiễn, cho phép con người sử dụng để quản lý xã hội. Trong việc chuẩn bị nhằm có được thông tin chính xác, đầy đủ cho hoạt động kinh doanh của các nhà quản trị, chuyên viên kinh tế thì những chuyên viên này cần được trang bị tốt về kiến thức thống kê, bao gồm nhiều môn học. Trước hết, là môn Nguyên lý thống kê – Môn cơ sở để nghiên cứu, thống kê kinh tế xã hội. Ngoài ra cần môn Thống kê chuyên ngành, Thống kê doanh nghiệp – Là các phương pháp thống kê, đánh giá phân tích hoạt động kinh doanh của ngành và doanh nghiệp; môn Dự báo – Dùng dự báo hàng hóa, dịch vụ thị trường và các hiện tượng khác trong mối quan hệ phụ thuộc lẫn nhau. 1.2. CÁC ỨNG DỤNG CỦA THỐNG KÊ TRONG KINH DOANH Ứng dụng của thống kê trong kinh doanh là rất rộng rãi và thường xuyên nhưng có thể chia thành hai mảng lớn là: v Mô tả tóm tắt một khối lượng lớn dữ liệu có liên quan đến hoạt động kinh doanh như: khách hàng, nhu cầu thị trường, sản phẩm, giá cả, chính sách Marketing, thị phần, lao động Nhờ đó, làm bộc lộ bản chất của hiện tượng nghiên cứu. v Đưa ra các suy luận thống kê như ước lượng, kiểm định các giả thuyết, dự đoán các hiện tượng số lớn có liên quan đến hoạt động kinh doanh trên cơ sở lấy mẫu để giảm tối đa thời gian và chi phí nhằm bảo đảm tính kịp thời và hiệu quả trong kinh doanh. 1.3. MỘT SỐ KHÁI NIỆM THƯỜNG DÙNG TRONG THỐNG KÊ 1.3.1. Khái niệm thống kê Thống kê là hệ thống các phương pháp dùng để thu thập và xử lý dữ liệu nhằm phục vụ cho quá trình nghiên cứu và ra quyết định khi dữ liệu được thu thập trong điều kiện không chắc chắn. Cơ sở lý thuyết cho thống kê là lý thuyết xác suất và thống kê toán. Hiện nay thống kê đã được ứng dụng rộng rãi trong rất nhiều lĩnh vực như: thống kê dân số, thống kê xã hội, thống kê trong kinh doanh, thống kê bảo hiểm, thống kê trong giáo dục, thống kê trong sinh học, thống kê trong y học,Trong lĩnh vực kinh tế và kinh doanh, thống kê đóng vai trò là công cụ cơ bản để phân tích thực trạng tình hình thông qua dữ liệu thu thập và xử lý nhằm tìm hiểu bản chất và tính quy luật của hiện tượng trong những điều kiện không gian và thời gian cụ thể. 1.3.2. Tổng thể thống kê và đơn vị tổng thể thống kê 1.3.2.1.  Khái niệm ü  Tổng thể thống kê: Tổng thể thống kê là một tập hợp bao gồm các đơn vị (phần tử, yếu tố, sự vật,...) mà thống kê cần nghiên cứu mặt lượng của chúng. ü  Đơn vị tổng thể: Đơn vị tổng thể là các đơn vị cá biệt cấu thành tổng thể thống kê. Ví dụ: ·        Tập hợp các xí nghiệp công nghiệp ở một địa phương là một tổng thể thống kê, còn mỗi một xí nghiệp là một đơn vị tổng thể. ·        Mỗi người dân là một đơn vị tổng thể hợp thành tổng dân số. 1.3.2.2.  Các loại tổng thể thống kê ü  Dựa vào sự biểu hiện của đơn vị tổng thể, có các loại tổng thể sau: ·        Tổng thể bộc lộ: Gồm các đơn vị có biểu hiện rõ ràng, dễ xác định. ·        Tổng thể tiềm ẩn: Gồm các đơn vị không thể nhận biết một cách trực tiếp, ranh giới tổng thể không rõ. ü  Dựa vào tính chất cơ bản của các đơn vị có liên quan tới mục đích nghiên cứu, có các loại tổng thể sau: ·        Tổng thể đồng chất: Gồm các đơn vị giống nhau về các đặc điểm chủ yếu liên quan tới mục đích nghiên cứu. ·        Tổng thể không đồng chất: Gồm các đơn vị có đặc điểm chủ yếu khác nhau. ü  Dựa vào số đơn vị có trong tổng thể, có các loại tổng thể sau: ·        Tổng thể chung: Gồm tất cả các đơn vị của tổng thể thống kê. ·        Tổng thể bộ phận: Chỉ gồm một phần của tổng thể chung. ü  Trong thực tế, người ta còn phân biệt ra hai loại tổng thể thống kê: ·        Tổng thể hữu hạn (Limited Population): Là tổng thể chỉ có một số lượng đếm được các đơn vị thống kê. ·        Tổng thể vô hạn (Unlimited Population): Là tổng thể có một số lượng không thể đếm được các đơn vị  thống kê. 1.3.3. Tiêu thức thống kê Tiêu thức thống kê là các đặc điểm của các đơn vị tổng thể được ta chọn ra để nghiên cứu. Chẳng hạn khi nghiên cứu đặc điểm dân số, thường chọn các tiêu thức là: tên, tuổi, giới tính, dân tộc, tôn giáo, nghề nghiệp, trình độ văn hoá, tình trạng hôn nhân, Có 2 loại tiêu thức: ü  Tiêu thức định tính (tiêu thức thuộc tính): Là tiêu thức không thể biểu hiện trực tiếp bằng con số. ü  Tiêu thức định lượng (tiêu thức số lượng): Là tiêu thức có thể biểu hiện trực tiếp bằng con số. Các con số này được gọi là các lượng biến.  Lượng biến được chia ra 2 loại: ·        Lượng biến rời rạc: Là lượng biến mà các giá trị có thể có của nó là những số hữu hạn hay vô hạn, và có thể đếm được.  Ví dụ: Số sinh viên trong 1 trường đại học, số nhân khẩu trong 1 hộ gia đình, số thành phẩm nhập kho trong 1 ngày tại một phân xưởng, ·        Lượng biến liên tục: Là lượng biến mà các giá trị có thể có của nó có thể lấp kín một khoảng trên trục số. Ví dụ: Trọng lượng chiều cao của 1 học sinh, năng suất lao động của một công nhân 1.3.4. Chỉ tiêu thống kê Chỉ tiêu thống kê là biểu hiện khái quát đặc điểm về mặt lượng của toàn bộ tổng thể trong điều kiện không gian và thời gian nhất định. Có thể chia ra 2 loại chỉ tiêu: ü  Chỉ tiêu khối lượng: phản ánh khái quát đặc điểm về quy mô của tổng thể.  Ví dụ: Tổng dân số của một quốc gia, tổng quỹ lương của một công ty, khối lượng sản phẩm nhập kho, số lao động của một doanh nghiệp, ü  Chỉ tiêu chất lượng: phản ánh khái quát đặc điểm về tính chất, trình độ phổ biến, quan hệ so sánh trong tổng thể. Chỉ tiêu chất lượng thường mang ý nghĩa phân tích và là kết quả so sánh giữa các chỉ tiêu khối lượng. Ví dụ: Năng suất lao động trung bình của một công nhân, năng suất thu hoạch một loại cây trồng, tỷ lệ hộ nghèo tại một địa phương, 1.3.5. Thang đo trong thống kê Để lượng hoá các đặc trưng của các quan sát trên tổng thể nghiên cứu nhằm thuận tiện trong việc xử lý dữ liệu bằng các phương pháp thống kê, người ta tiến hành xây dựng thang đo khi thu thập dữ liệu. Vậy thang đo là công cụ dùng để mã hóa các biểu hiện khác nhau của tiêu thức nghiên cứu. Để có thể xử lý dữ liệu trên máy vi tính người ta thường mã hóa thang đo bằng các con số. Có thể chia ra 4 loại thang đo (xếp theo sự tăng dần khả năng diễn đạt thông tin của thang đo) là : ü  Thang đo định danh (Nominal scale): Là loại thang đo dùng để biểu hiện sự khác nhau về tên gọi, màu sắc, tính chất, đặc điểm, giữa các đơn vị của 1 tiêu thức định tính. Người ta thường quy ước dùng các con số 1,2,3, hay dùng các ký tự A,B,C,để biểu hiện thang đo định danh. Các con số của thang đo không nói lên quan hệ hơn kém, không thể tính toán trên những con số này. ü  Thang đo thứ bậc (Ordinal scale): Là loại thang đo dùng để biểu hiện sự khác nhau về mặt thứ bậc, giữa các đơn vị của 1 tiêu thức định tính hay 1 tiêu thức định lượng. Người ta thường quy ước dùng các con số 1,2,3, để biểu thị thứ bậc từ cao xuống thấp hay từ thấp lên cao. Như vậy, các con số của thang đo nói lên quan hệ thứ bậc hơn kém, nhưng không nói lên được khoảng cách giữa các thứ bậc. Có thể tính toán trên những con số này để biểu hiện đặc trưng chung của tổng thể một cách tương đối. ü  Thang đo khoảng (Interval scale): Là dạng đặc biệt của thang đo thứ bậc, trong đó mỗi thứ bậc sẽ có khoảng cách đều nhau. Thường sử dụng thang đo khoảng cho tiêu thức định lượng hay tiêu thức định tính. Người ta thường dùng 1 dãy các con số liên tục và đều đặn từ 1 đến 5, hay từ 1 đến 7, hay từ 1 đến 10 để biểu hiện các khoảng cách đều nhau giữa các thứ bậc; 2 con số ở 2 đầu dãy số biểu hiện 2 trạng thái đối nghịch nhau. Các con số của thang đo khoảng vừa nói lên quan hệ thứ bậc hơn kém, vừa nói lên khoảng cách giữa các thứ bậc. Có thể tính toán (cộng, trừ) trên những con số này, tuy nhiên không thể thực hiện được phép chia tỷ lệ giữa chúng bởi vì “giá trị 0” của thang đo không phải là 1 con số có ý nghĩa thật. ü  Thang đo tỷ lệ (Ratio scale) : Là một dạng đặc biệt của thang đo khoảng, trong đó trị số 0 của thang đo là 1 con số có ý nghĩa thật. Chỉ sử dụng thang đo này cho tiêu thức định lượng. Người ta thường biểu thị thang đo tỷ lệ bằng 1 dãy các con số thực của chính tiêu thức. Các con số của thang đo tỷ lệ vừa nói lên quan hệ thứ bậc hơn kém, vừa nói lên khoảng cách giữa các thứ bậc; vừa nói lên quan hệ so sánh về mặt tỷ lệ giữa chúng. Thang đo tỷ lệ biểu hiện được nhiều thông tin nhất trong hệ thống thang đo thống kê. CHƯƠNG 2 THỐNG KÊ MÔ TẢ DỮ LIỆU CHÉO Dữ liệu chéo mới thu thập được thường rất nhiều và lộn xộn. Chúng ta sẽ bị nhiễu loạn và rất khó nhận thức được điều gì hữu ích về hiện tượng trước một khối lượng lớn dữ liệu như vậy. Các phương pháp thống kê mô tả dữ liệu chéo sẽ giúp ta loại bỏ các nhiễu loạn và làm bộc lộ các đặc trưng cơ bản nhất, đáng quan tâm về hiện tượng nghiên cứu. 2.1. SẮP XẾP DỮ LIỆU Sắp xếp dữ liệu theo từng tiêu thức thường là công việc trước tiên giúp ta có cái nhìn khái quát về sự biến thiên của dữ liệu, phát hiện giá trị nhỏ nhất, giá trị lớn nhất, số lượng các giá trị theo từng tiêu thức. Qua đó, nhà thống kê có quyết định nên xử lý dữ liệu như thế nào cho phù hợp và đạt hiệu quả cao. 2.1.1. Cách thức sắp xếp dữ liệu Việc sắp xếp được tiến hành theo từng tiêu thức một. Với dữ liệu định tính trên thang đo định danh thì sắp xếp theo vần A, B, C hoặc theo số thứ tự danh định. Với dữ liệu định tính trên thang đo thứ bậc thì sắp xếp theo thứ bậc. Với dữ liệu định tính trên thang đo tỷ lệ hay khoảng thì sắp xếp theo độ lớn. Ví dụ: Dữ liệu về 20 khách hàng được sắp xếp sơ bộ theo tiêu thức độ tuổi có dạng như sau: Thứ tự khách hàng của dữ liệu ban đầu Độ tuổi Thứ tự khách hàng của dữ liệu ban đầu Độ tuổi 3 21 13 28 8 23 16 28 4 24 12 28 9 24 15 28 1 26 11 28 5 26 14 32 2 26 17 32 7 26 20 32 10 26 18 33 6 26 19 35 Bảng dữ liệu sắp xếp rút gọn của dữ liệu nói trên là như sau: Độ tuổi Số khách hàng 21 1 23 1 24 2 26 6 28 5 32 3 33 1 35 1 2.1.2. Biểu đồ nhánh và lá 2.1.2.1. Khái niệm Biểu đồ nhánh và lá là một hình thức trình bày dữ liệu bằng cách tách mỗi con số trong dữ liệu ra làm 2 phần: phần lá tương ứng với các chữ số ở bên phải, phần nhánh tương ứng với các chữ số bên trái. Việc phân chia ra 2 phần nhánh và lá chỉ có tính quy ước và có thể thay đổi linh hoạt theo đặc điểm của dữ liệu. Nếu phần lá quá dài, ta có thể tách phần nhánh ra làm 2 phần : nhánh trên và nhánh dưới để biểu đồ được cân đối hơn. Ví dụ: Với dữ liệu về mẫu là: 52, 53, 54, 54, 55, 55, 56, 59, 60, 60, 60, 60, 60, 60, 61, 61, 62, 62, 64, 65, 65, 66, 66, 66, 67, 68, 68, 71, 71, 72, 74, 75, 77, 78. Ta có thể trình bày dưới dạng biểu đồ nhánh và lá như sau: Nhánh Lá 5 2 3 4 4 5 5 6 9 6 0 0 0 0 0 0 1 1 2 2 5 6 6 6 7 8 8 7 1 1 2 4 5 7 8 Hoặc trình bày dưới dạng nhánh trên và nhánh dưới như sau: Nhánh Lá 5 2 3 4 4 5 5 5 6 9 6 0 0 0 0 0 0 1 1 2 2 4 6 5 6 6 6 7 8 8 7 1 1 2 4 7 5 7 8 2.1.2.2. Đặc điểm Là hình thức trình bày dữ liệu thích hợp đối với khối dữ liệu nhỏ. Biểu đồ nhánh và lá có dạng giống như biểu đồ phân phối tần số khi ta quay biểu đồ ngược chiều kim đồng hồ lên trên 1 góc 90 độ. Biểu đồ giúp ta quan sát chi tiết từng dữ liệu thu thập được trên từng đơn vị; giúp ta hình dung được đặc điểm phân phối của dữ liệu trên các đơn vị của tổng thể. 2.2. PHÂN TỔ THỐNG KÊ 2.2.1. Khái niệm, ý nghĩa của phân tổ thống kê a.       Khái niệm Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để tiến hành phân chia các đơn vị của tổng thể ra thành các tổ hoặc các tiểu tổ có tính chất khác nhau. Ví dụ:  ü  Căn cứ vào giới tính chia toàn bộ nhân khẩu ra thành 2 tổ: nam và nữ. ü  Căn cứ vào quy trình vận động tự nhiên của sản phẩm, người ta chia toàn bộ các hoạt động của nền kinh tế ra thành 3 khu vực: Khai thác, chế biến, dịch vụ. b.      Ý nghĩa Phân tổ thống kê có nhiều tác dụng có nhiều tác dụng quan trọng trong toàn bộ quá trình nghiên cứu thống kê: ü  Thường được sử dụng để phân loại các đơn vị điều tra ra thành các tổ khác nhau để tiến hành thu thập thông tin được thuận lợi. ü  Phân tổ thống kê là phương pháp cơ bản để tiến hành tổng hợp thống kê. ü  Phân tổ thống kê là phương pháp quan trọng của phân tích thống kê đồng thời là cơ sở để vận dụng các phương pháp thống kê khác. 2.2.2. Các nhiệm vụ của phân tổ thống kê Phân tổ thống kê giải quyết 3 nhiệm vụ cơ bản: a.      Phân chia hiện tượng kinh tế xã hội ra thành các loại hình KT_XH khác nhau Để thực hiện nhiệm vụ này, thống kê sử dụng phương pháp phân tổ phân loại. Khi tiến hành phân tổ phân loại trước hết, người ta căn cứ  vào tiêu thức thuộc về bản chất của hiện tượng để tiến hành phân chia các đơn vị hiên tượng ra thành các loại khác nhau về bản chất. Ví dụ:  Căn cứ vào chức năng và nguồn kinh phí cho các hoạt động, người ta chia toàn bộ các hoạt động trong nền kinh tế ra thành 6 khu vực thể chế (Tài chính, phi tài chính, nhà nước, hộ, quan hệ với nước ngoài, vô vị lợi). b.      Biểu hiện kết cấu của hiện tượng ü  Để thực hiện nhiệm vụ này thống kê sử dụng phương pháp phân tổ kết cấu. ü  Khi tiến hành phân tổ kết cấu trước hết người ta dựa trên căn cứ nào đó để chia tổng thể nghiên cứu ra thành các tổ khác nhau và sau đó tính toán tỷ trọng của mỗi tổ chiếm trong tổng thể. Ví dụ:  Cơ cấu kinh tế của địa phương A như sau: Khu vực GDP ( Tỷ đồng) Tỷ trọng Khai thác 20.000 20 % Chế biến 30.000 30 % Dịch vụ 50.000 50 % Tổng 100.000 100 % c.      Biểu hiện mối liên hệ giữa các hiện tượng và các tiêu thức ü   Để thực hiện nhiệm vụ này, thống kê sử dụng phương pháp phân tổ liên hệ. ü   Khi tiến hành phân tổ liên hệ, người ta phân biệt các tiêu thức liên hệ với nhau thành tiêu thức nguyên nhân và kết quả: ·        Tiêu thức nguyên nhân là tiêu thức gây ảnh hưởng. ·        Tiêu thức kết quả là tiêu thức chịu ảnh hưởng bởi tiêu thức nguyên nhân. ü   Tổng thể trước hết được phân tổ theo một tiêu thức (tiêu thức nguyên nhân) rồi sau đó tiếp tục tính trị số bình quân hoặc số tương đối riêng cho từng tổ đối với tiêu thức còn lại (tiêu thức kết quả), so sánh sự  biến thiên giữa hai tiêu thức để rút ra kết luận về sự tồn tại và tính chất của mối quan hệ. Ví dụ: Để nghiên cứu mối quan hệ giữa mức bón phân hữu cơ và năng suất lúa vụ đông xuân ở một nông trường trong năm 2007, người ta đã tiến hành phân tổ liên hệ như sau: (Tổng thể nghiên cứu : Diện tích trồng lúa) Mức bón phân (Tấn/ha) Diện tích lúa (Ha) Sản lượng (Tạ) Năng suất bình quân (Tạ/Ha) Dưới 2 100 6000 60 2-3 150 9300 62 3-4 300 19350 64.5 4-5 250 16750 67 5 trở lên 50 3500 70 Tổng 850 54900 64.6 à  Kết luận: Trong những điều kiện nhất định, mức bón phân càng tăng thì năng suất lúa càng cao. 2.2.3. Các vấn đề chủ yếu của phân tổ thống kê a.      Tiêu thức phân tổ ü  Là tiêu thức được lựa chọn làm căn cứ để tiến hành phân tổ thống kê. ü  Lựa chọn tiêu thức phân tổ là vấn đề quan trọng đầu tiên của phân tổ thống kê, cần phải được đề ra và giải quyết chính xác. Muốn lựa chọn tiêu thức phân tổ chính xác cần chú ý các vấn đề sau: ·        Phải dựa trên cơ sở phân tích lý luận hiện tượng xã hội, nắm vững bản chất của hiện tượng để lựa chọn tiêu thức bản chất nhất đáp ứng mục đích nghiên cứu. Ví dụ: Muốn phân tổ các doanh nghiệp công nghiệp ở 1 địa phương để nghiên cứu quy mô của chúng thì phải dựa vào trình độ công nghệ để lựa chọn tiêu thức phân tổ cho phù hợp trong số các tiêu thức sau: o   Số lao động o   Giá trị tài sản cố định o   Vốn sản xuất o   Giá trị sản xuất ·        Phải căn cứ vào điều kiện lịch sử cụ thể để lựa chọn tiêu thức phân tổ phù hợp với mục đích nghiên cứu.Ví dụ, để nghiên cứu về tình hình đời sống của nhân dân trước Cách mạng Tháng Tám thì tiêu thức phân tổ phù hợp là số ruộng đất sở hữu. Nhưng hiện nay tiêu thức đó không còn phù hợp. ·        Tùy theo đặc điểm của hiện tượng và mục đích nghiên cứu để quyết định chọn một hay một số tiêu thức phân tổ. Phân tổ theo một tiêu thức gọi là phân tổ giản đơn còn phân tổ theo nhiều tiêu thức gọi là phân tổ kết hợp. ü  Nói chung hiện tượng KT_XH thường là các hiện tượng phức tạp nên phân tổ kết hợp nhiều tiêu thức để cho phép nghiên cứu nhiều mặt của hiện tượng. Tuy nhiên, kết quả phân tổ rất phức tạp nên trên thực tế người ta thường kết hợp 2 hay 3 tiêu thức cho một phân tổ và thấy nếu không cần thiết thì có thể sử dụng nhiều bản phân tổ kết hợp với nhau. b.      Số tổ và khoảng cách tổ Số tổ cần thiết phụ thuộc vào tính chất của tiêu thức phân tổ. ü  Phân tổ theo tiêu thức thuộc tính: Trong trường hợp này các tổ được hình thành là do sự khác nhau của các hiện tượng kinh tế xã hội khác nhau tồn tại trong bản thân của hiện tượng. ·        Trường hợp giản đơn: Khi tiêu thức thuộc tính có ít dấu hiệu. Ví dụ : Giới tính (2), thành phần kinh tế (5), Trong trường hợp này, mỗi biểu hiện là cơ sở hình thành 1 tổ và trong thực tế số tổ đã có sẵn từ trước. ·        Trường hợp phức tạp: Khi tiêu thức thuộc tính có nhiều dấu hiệu. Ví dụ: Nghề nghiệp của nhân khẩu, công dụng của hàng hóa, Trong trường hợp này người ta tiến hành ghép nhiều biểu hiện vào 1 tổ hoặc ghép nhiều tổ nhỏ thành tổ lớn theo nguyên tắc các biểu hiện hoặc các tổ ghép lại với hau phải giống nhau về tính chất, về loại hình, về công dụng chủ yếu, Trên thực tế, phân tổ nhân khẩu  theo nghề nghiệp và phân tổ hàng hóa theo công dụng, người ta thường dựa vào danh mục nghề nghiệp và hàng hóa do nhà nước quy định. ü  Phân tổ theo tiêu thức số lượng: Trong trường hợp này các tổ được hình thành là do sự biến thiên về lượng biến của tiêu thức. ·        Trường hợp giản đơn: Khi lượng biến biến thiên ít như số nhân khẩu trong hộ gia đình, số máy do một công nhân đảm nhận,... Trong trường hợp này mỗi mức lượng biến là cơ sở để hình thành 1 tổ. ·        Trường hợp phức tạp: Khi lượng biến biến thiên nhiều như độ tuổi của nhân khẩu, thu nhập của người lao động, lợi nhuận của các doanh nghiệp, Trong trường hợp này người ta vẫn dựa vào quy luật lượng biến, chất biến để ghép nhiều mức lượng biến, chất biến vào một tổ, và khi đó, mỗi tổ sẽ bao gồm 1 phạm vi lượng biến với 2 giới hạn rõ rệt là giới hạn dưới và giới hạn trên. Trong đó: o    Giới hạn dưới là mức lượng biến nhỏ nhất của tổ, đó là mức lượng biến làm cho tổ được hình thành. o    Giới hạn trên là mức lượng biến lớn nhất của tổ, nếu vượt qua giới hạn này thì tính chất của hiện tượng thay đổi và chuyển sang tổ khác. Chênh lệch giữa giới hạn trên và giới hạn dưới gọi là trị số khoảng cách tổ. Gọi di  là trị số khoảng cách tổ của tổ. Nếu di = d ( ): Phân tổ có khoảng cách tổ đều. Nếu : di dj: Phân tổ có khoảng cách không đều Việc phân tổ có khoảng cách đều hay không đều còn tuỳ thuộc vào mục đích nghiên cứu và đặc điểm biến thiên lượng biến của tiêu thức. Làm sao để sự khác nhau về lượng giữa các tổ phải phản ánh sự khác nhau về chất của tổ đó. Ví dụ: Nghiên cứu ảnh hưởng của cơ cấu tuổi của dân số đối với quá trình tái sản xuất dân số. (Đơn vị tính: người) Phân tổ có khoảng cách tổ đều: Độ tuổi Số nhân khẩu nữ 0 - 4 15.000 5 - 9 45.000 10 - 14 56.000 15 - 19 56.000 80 trở lên 56.000 Tổng 228.000 Phân tổ có khoảng cách không đều: Độ tuổi Số nhân khẩu nữ 0-14 45.000 15-49 56.000 50 trở lên 56.000 Trong đó phân tổ có khoảng cách đều tương đối đơn giản và trị số khoảng cách tổ được xác định theo các công thức sau: + Đối với lượng biến rời rạc: + Đối với lượng biến liên tục: Trong đó: xmax , xmin :  là lượng biến lớn nhất, nhỏ nhất của tiêu thức nghiên cứu.                    n     là số tổ cần chia. v         Chú ý: F  Khi phân tổ tổng thể đối với trường hợp lượng biến rời rạc, có thể sử dụng công thức của trường hợp lượng biến liên tục nếu giới hạn trên và giới hạn dưới của các tổ trùng nhau. F  Ngoài trường hợp phân tổ có khoảng cách tổ khép kín còn có phân tổ có khoảng cách tổ mở, đó là trường hợp tổ đầu tiên không có giới hạn dưới và tổ cuối cùng không có giới hạn trên. c.      Các chỉ tiêu giải thích Trong phân tổ thống kê, sau khi đã xác định được số tổ cần thiết còn phải xác định các chỉ tiêu giải thích. Các chỉ tiêu giải thích giúp chúng ta thấy rõ các đặc trưng của toàn tổ cũng như của toàn tổng thể làm căn cứ so sánh từng tổ với nhau và tính toán các chỉ tiêu phân tích khác. Muốn chọn các chỉ tiêu giải thích cần chú ý các vấn đề sau: F  Phải căn cứ vào mục đích nghiên cứu và đặc điểm của hiện tượng để lựa chọn các chỉ tiêu giải thích cho phù hợp. F  Các chỉ tiêu giải thích phải có mối liên hệ với nhau, bổ sung nhau nhằm giúp việc nghiên cứu được sâu sắc. F  Các chỉ tiêu có tác dụng trong việc so sánh đối chiếu với nhau cần được sắp xếp gần nhau. Chẳng hạn chỉ tiêu tuyệt đối gần với chỉ tiêu tương đối, thực tế gần với kế hoạch. 2.3. BẢNG THÓNG KÊ VÀ ĐỒ THỊ THỐNG KÊ 2.3.1. Bảng thống kê 2.3.1.1. Ý nghĩa và tác dụng ü  Bảng thống kê là một hình thức trình bày các tài liệu thống kê một cách có hệ thống, hợp lý và rõ ràng nhằm nêu lên các đặc trưng về lượng của hiện tượng nghiên cứu. ü  Bảng thống kê giúp ta tổng hợp, phân tích và nhận định chung về hiện tượng nghiên cứu. 2.3.1.2. Cấu tạo chung của bảng thống kê ü  Về nội dung: gồm có chủ đề, phần giải thích và nguồn số liệu. ü  Về hình thức: Bảng thống kê bao gồm các hàng ngang, cột dọc, tiêu đề và các con số.      Mô hình chung của bảng thống kê như sau: Phần giải thích Các hàng của bảng Số hiệu các cột Hàng chung Cột chung Các cột của bảng Phần chủ đề Các chỉ tiêu giải thích ( Tên cột ) (1) (2) (3) () (n) Ví dụ:  Nghiên cứu ảnh hưởng của cơ cấu tuổi của dân số đối với quá trình tái sản xuất dân số. (Đơn vị tính: người) Độ tuổi Số nhân khẩu 0 - 4 16.000 5 - 9 44.000 10 - 14 55.000 15 - 19 57.000 80 trở lên 56.000 Tổng 229.000 2.3.1.3. Các loại bảng thống kê Bảng đơn giản: Là bảng trong đó phần chủ đề chỉ liệt kê các đơn vị, bộ phận của tổng thể. ü  Bảng phân tổ: Trong đó đối tượng nghiên cứu ghi trong phần chủ đề được chia thành các tổ theo một tiêu thức nào đó. ü  Bảng kết hợp: Là loại bảng trong đó đối tượng nghiên cứu ghi ở phần chủ đề được phân tổ theo hai ba tiêu thức kết hợp với nhau. 2.3.1.4. Những yêu cầu trong việc xây dựng bảng thống kê ü  Quy mô bảng không nên quá lớn (tức là không nên phân tổ kết hợp nhiều tiêu thức và quá nhiều chỉ tiêu). ü  Các tiêu đề và tiêu mục cần được ghi chính xác, ngắn gọn, dễ hiểu. ü  Các hàng và cột nên ký hiệu bằng chữ hoặc bằng số để thuận lợi cho việc trình bày hoặc giải thích nội dung. ü  Các chỉ tiêu cần được sắp xếp một cách hợp lý. ü  Phần ghi chú ở cuối bảng dùng để nói rõ nguồn tài liệu hoặc giải thích nội dung một số chỉ tiêu. Các qui ước thường dùng trong bảng thống kê: F Không có số liệu: trong ô ghi (-) F Số liệu còn thiếu: ba chấm (...) F Hiện tượng không liên quan: (x) 2.3.2. Đồ thị thống kê 2.3.2.1. Khái niệm Đồ thị thống kê là phương pháp dùng các hình vẽ hoặc đường nét hình học với các màu sắc thích hợp để trình bày đặc trưng về các mặt lượng của hiện tượng kinh tế xã hội. Ví dụ:  Có tài liệu về doanh thu của doanh nghiệp X như sau: Năm Chỉ tiêu 2002 2003 2004 2005 Doanh thu (triệu đồng) 100 120 180 200 Từ tài liệu trên, ta có thể biểu diễn bằng đồ thị như sau: 2.3.2.2. Đặc điểm của đồ thị thống kê ü  Bảng thống kê chỉ liệt kê số liệu còn đồ thị sử dụng số liệu kết hợp với hình vẽ, đường nét và màu sắc thích hợp để mô tả đặc trưng về mặt lượng của hiện tượng. ü  Đồ thị thống kê chỉ trình bày một cách khái quát các đặc điểm chủ yếu của hiện tượng. Tuy nhiên các đặc trưng và xu hướng của hiện tượng nghiên cứu thường được dễ thấy hơn nếu không chỉ để số liệu trong bảng thống kê mà còn được trình bày bằng đồ thị thống kê. 2.3.2.3. Quy tắc xây dựng đồ thị thống kê Đồ thị thống kê phải đảm bảo yêu cầu chính xác dễ xem dễ hiểu, ngoài ra còn phải thể hiện tính thẩm mỹ của nó.  2.3.2.4. Các loại đồ thị thống kê F Đồ thị thống kê có các loại sau: ü  Đồ thị so sánh ü  Đồ thị phát triển ü  Đồ thị kết cấu ü  Đồ thị thực hiện kế hoạch ü  Đồ thị liên hệ ü  Đồ thị phân phối F Căn cứ  vào các hình thức biểu hiện đồ thị thống kê có các loại sau: ·        Biểu đồ hình thanh ·        Biểu đồ hình tròn. ·        Đồ thị đường gấp khúc Ví dụ: Đồ thị biểu diễn cơ cấu tổng sản phẩm quốc nội (GDP) theo thành phần kinh tế: 2.4. MÔ TẢ THỐNG KÊ BẰNG CÁC SỐ ĐO ĐẶC TRƯNG 2.4.1. Số tuyệt đối trong thống kê 2.4.1.1. Khái niệm, đặc điểm, ý nghĩa a.                   Khái niệm Số tuyệt đối trong thống kê là mức độ biểu hiện quy mô, khối lượng của hiện tượng trong điều kiện thời gian và không gian nhất định. Ví dụ: ü  Số lượng công nhân trong danh sách của công ty A vào ngày 1/1/2006 là 580 người. ü  Giá trị gia tăng của công ty X trong quý I/2006 là 15 tỷ đồng. b.                  Đặc điểm Khác với các đại lượng tuyệt đối trong toán học có tính chất trừu tượng, các số tuyệt đối trong thống kê bao giờ cũng có nội dung kinh tế, chính trị, xã hội,... nhất định. Do đó, muốn có số tuyệt đối trong thống kê chính xác và có ý nghĩa thực tế cần phải xác định rõ nội dung mà chỉ tiêu cần phản ánh, đồng thời phải tổ chức điều tra, tính toán một cách khoa học. c.                  Ý nghĩa ü  Số tuyệt đối phản ánh quy mô khối lượng thực tế của hiện tượng trong điều kiện thời gian và không gian nhất định. Vì vậy thường được sử dụng để phản ánh các thành quả phát triển kinh tế, văn hoá, xã hội, các nguồn tài nguyên, các khả năng tiềm tàng trong nền kinh tế. ü  Số tuyệt đối là cơ sở đầu tiên của quá trình nghiên cứu thống kê, đồng thời là căn cứ để tính cá chỉ tiêu khác như số tương đối, số bình quân,... 2.4.1.2. Các loại số tuyệt đối Theo nội dung phản ánh, số tuyệt đối được phân thành hai loại: a.                  Số tuyệt đối thời kỳ Số tuyệt đối thời kỳ phản ánh quy mô, khối lượng của hiện tượng trong một độ dài thời gian nhất định. Đó là kết quả phát triển và tích luỹ của hiện tượng trong suốt cả thời kỳ nghiên cứu. Thời kỳ càng dài thì trị số của chỉ tiêu càng lớn và ngược lại. b.                  Số tuyệt đối thời điểm Số tuyệt đối thời điểm phản ánh quy mô, khối lượng của hiện tượng tại một thời điểm nhất định. Khác với số tuyệt đối thời kỳ, số tuyệt đối thời điểm chỉ phản ánh trạng thái của hiện tượng tại thời điểm nghiên cứu. Vì vậy, việc cộng dồn các số tuyệt đối thời điểm không có ý nghĩa thực tiễn. 2.4.1.3. Đơn vị tính số tuyệt đối Tuỳ theo đặc điểm của hiện tượng và mục đích nghiên cứu mà thống kê sử dụng loại đơn vị phù hợp, thích hợp để tính số tuyệt đối. Trong nghiên cứu thống kê thường sử dụng các loại đơn vị sau: a.      Đơn vị hiện vật: là loại đơn vị tính phù hợp với đặc điểm vật lý của hiện tượng. Ví dụ: kg, tạ, mét,...; người, cái, con,... Đơn vị kép: kw/h, tấn/km,... ü  Ưu điểm: Cho phép phản ánh lượng giá trị sử dụng thực tế chứa trong một lượng sản phẩm. ü  Nhược điểm: Không cho phép tổng hợp các sản phẩm khác nhau về giá trị sử dụng hay khác nhau về mức độ hoàn thành, về chất lượng. Để khắc phục một phần nhược điểm này và tổng hợp một phần sản phẩm có cùng giá trị sử dụng nhưng khác nhau về chất lượng hoặc mức độ hoàn thành, thống kê sử dụng đơn vị: hiện vật quy đổi (hiện vật tiêu chuẩn). Đơn vị hiện vật quy đổi là đơn vị hiện vật của một loại sản phẩm được chọn làm chuẩn để quy đổi các loại sản phẩm khác. Ví dụ: 1 kg mật = 3 kg sáp, 1 kg thóc = 3 kg khoai lang Để xác định hệ số quy đổi người ta dựa vào hàm lượng dinh dưỡng, công suất, chi phí sản xuất,... b.      Đơn vị thời gian lao động: (giờ công, ngày công, tháng công,...) thường được sử dụng để tính lượng lao động hao phí trong quá trình sản xuất sản phẩm hay hoạt động nghiệp vụ. ü  Nhược điểm: Phụ thuộc vào năng suất lao động nên hạn chế tính chất so sánh được. c.      Đơn vị tiền tệ: (đồng, rúp, đôla,...) thường được sử dụng để phản ánh giá trị của sản phẩm hoặc công việc. ü  Ưu điểm: Cho phép tổng hợp được tất cả các loại sản phẩm và các loại hoạt động. ü  Nhược điểm: ·        Che lấp lượng giá trị sử dụng chứa trong khối lượng sản phẩm hoặc công việc. ·        Phụ thuộc vào sự biến động giá cả sản phẩm và công việc do đó hạn chế tính chất so sánh được qua thời gian. Để khắc phục nhược điểm này người ta sử dụng giá cố định là giá thực tế ở một năm nào đó mà tình hình sản xuất và lưu thông tương đối ổn định, được sử dụng để tính toán cho các năm khác. 2.4.2. Số tương đối trong thống kê 2.4.2.1. Khái niệm, đặc điểm  và ý nghĩa a.                  Khái niệm Số tương đối trong thống kê biểu hiện quan hệ so sánh giữa hai mức độ nào đó của hiện tượng nghiên cứu. Có hai trường hợp so sánh: ü  So sánh mức độ của hai hiện tượng khác nhau nhưng có quan hệ với nhau. Ví dụ: ü  So sánh hai mức độ của một hiện tượng nhưng khác nhau về điều kiện thời gian và không gian. Ví dụ: b.                   Đặc điểm Số tương đối bao giờ cũng là kết quả so sánh giữa các mức độ đã có từ trước và bất kỳ số tương đối nào cũng đều có gốc để so sánh. Tuỳ theo đặc điểm, hiện tượng và mục đích nghiên cứu mà gốc so sánh được lựa chọn khác nhau. Do đó việc tính số tương đối trong nghiên cứu thống kê rất phong phú. Đồng thời việc tính số tương đối cần đảm bảo tính chất “so sánh” được. Nghĩa là các mức độ đem ra so sánh phải thống nhất về nội dung, phương pháp tính, phạm vi tính, ý nghĩa thực tế, c.                  Ý nghĩa Số tương đối có nhiều tác dụng trong nghiên cứu thống kê: ü  Được sử dụng khá rộng rãi để phản ánh các mối quan hệ so sánh, trình độ phát triển, trình độ liên hệ, trình độ phổ biến, ü  Là chỉ tiêu không thể thiếu trong công tác kế hoạch. ü  Số tương đối có tính chất phê phán trong khi đó số tuyệt đối mới chỉ khái quát quy mô, khối lượng thực tế của hiện tượng. ü  Có thể dùng để phản ánh một phần tình hình thực tế trong khi cần đảm bảo tính chất bí mật của các số tuyệt đối. 2.4.2.2. Các loại số tương đối Căn cứ vào nội dung và mục đích phân tích ta có các loại số tương đối như sau: a.                  Số tương đối động thái ( tĐT) Phản ánh sự biến động của hiện tượng qua thời gian, đó là kết quả so sánh giữa mức độ kì nghiên cứu với mức độ kì gốc.  Công thức tính: Trong đó: Y1 : mức độ kỳ nghiên cứu Y0 : mức độ kỳ gốc Ví dụ:       Sản phẩm sản xuất của xí nghiệp A qua 2 năm như sau: F Năm 2002 sản xuất 1000 tấn. F Năm 2003 sản xuất 1300 tấn. Tính  tĐT ?      b.                  Số tương đối kế hoạch Được dùng để lập kế hoạch và đánh giá tình hình thực hiện kế hoạch. Số tương đối kế hoạch bao gồm 2 loại: Số tương đối nhiệm vụ kế hoạch và số tương đối hoàn thành kế hoạch. ü  Số tương đối nhiệm vụ kế hoạch (tNV) Phản ánh mục tiêu đạt được trong kì kế hoạch. Đó là kết quả so sánh giữa mức độ kế hoạch đề ra trong kì nghiên cứu với mức độ kì gốc. Công thức tính: Trong đó: YKH : Mức độ kế hoạch đặt ra   ü  Số tương đối hoàn thành kế hoạch (tHT)  Phản ánh kết quả thực hiện kế hoạch, đó là kết quả so sánh giữa mức độ thực tế đạt được trong kỳ nghiên cứu với mức độ kế hoạch đề ra. Công thức tính: (+)   Mối liên hệ giữa số tương đối động thái và số tương đối kế hoạch: Số tương đối động thái bằng số tương đối nhiệm vụ kế họach nhân với số tương đối hoàn thành kế hoạch. Hay:                                Tác dụng: F Kiểm tra tính chất chính xác của số liệu đã xử lý. F Dùng để tính gián tiếp các số tương đối. Ví dụ 1: Một xí nghiệp có kế hoạch tăng sản lượng kỳ nghiên cứu so với kì gốc 10%. Trên thực tế, sản lượng kỳ nghiên cứu so với kỳ gốc tăng 15%. Tính tỉ lệ hoàn thành kế hoạch về sản lượng của xí nghiệp. Ví dụ 2: Một xí nghiệp có kế hoạch giá thành đơn vị sản phẩm kỳ nghiên cứu so với kì gốc giảm 5 %. Trên thực tế, giá thành đơn vị sản phẩm kỳ nghiên cứu so với kì gốc giảm 3 %. Tính tỉ lệ hoàn thành kế hoạch giá thành và cho biết xí nghiệp có hoàn thành kế hoạch không? c.                  Số tương đối kết cấu (tkc) Xác định tỷ trọng của mỗi bộ phận cấu thành tổng thể. Đó là kết quả so sánh giữa mức độ của một bộ phận so với mức độ của cả tổng thể. Công thức tính:                                             Trong đó:   yi      : là mức độ của bộ phận i      : là mức độ của tổng thể Ví dụ:  Giá trị sản xuất nông nghiệp của tỉnh B năm 2005 là 1600 tỷ đồng, trong đó ngành trồng trọt chiếm 1280 tỷ đồng và ngành chăn nuôi chiếm 320 tỷ đồng. Yêu cầu: Tính ra các số tương đối kết cấu. F Lưu ý Số tương đối kết cấu phải được tính ra dựa trên kết quả phân tổ khoa học. F Ý nghĩa ü  Dùng để phản ánh kết cấu tổng thể. Qua đó có thể phân tích được đặc điểm cấu thành của hiện tượng. ü  Nghiên cứu sự thay đổi kết cấu sẽ thấy được xu hướng phát triển của hiện tượng. d.                  Số tương đối không gian  Phản ánh chênh lệch giữa hai mức độ khác nhau trong tổng thể hoặc giữa hai mức độ của một hiện tượng nhưng khác nhau về điều kiện không gian. Ví dụ: So sánh giá cả của một loại hàng hoá giữa hai thị trường, so sánh khối lượng sản phẩm của hai xí nghiệp, so sánh dân số của hai địa phương, F Ý nghĩa       Dùng để phản ánh quan hệ so sánh. e.                  Số tương đối cường độ Phản ánh trình độ phổ biến của hiện tượng. Đó là kết quả so sánh mức độ của hai hiện tượng khác nhau nhưng có quan hệ với nhau. Ví dụ: F Lưu ý: Khi tính số tương đối cường độ điều chủ yếu là phải xem xét mối quan hệ thực tế giữa các chỉ tiêu kinh tế để giải quyết vấn đề so sánh cho phù hợp bảo đảm số tương đối cường độ tính ra có ý nghĩa thực tế. 2.4.2.3. Đơn vị tính số tương đối Là số lần, số phần trăm (%), số phần nghìn  (o/oo) về thực chất các hình thức trên không có gì khác nhau nhưng việc sử dụng hình thức nào còn tuỳ thuộc vào mức độ chênh lệch trong quan hệ so sánh nói chung, chênh lệch lớn dùng số lần, chênh lệch vừa dùng số  (%), chênh lệch bé dùng số phần nghìn (o/oo). Ngoài 3 hình thức căn bản nói trên, khi tính số tương đối cường độ, người ta còn sử dụng đơn vị ghép, đó là đơn vị được hình thành bởi đơn vị của hiện tượng đứng ở  tử số và mẫu số của số tương đối cường độ. Ví dụ:  Tỷ suất sinh chung ( người/1000 người), hệ số sinh lợi (đồng / 1000 đồng). 2.4.3. Số bình quân 2.4.3.1. Khái niệm, đặc điểm và  ý nghĩa  của số bình quân a.                  Khái niệm Số bình quân trong thống kê là mức độ biểu hiện trị số đại biểu theo một tiêu thức nào đó trong một tổng thể bao gồm các đơn vị cùng loại. Ví dụ:       Năng suất lao động bình quân 1 công nhân.                         Năng suất lúa thu hoạch bình quân,... b.                  Đặc điểm ü  Số bình quân có tính chất tổng hợp và khái quát rất cao, chỉ dùng một trị số để nêu lên mật lượng điển hình chung cho toàn bộ hiện tượng số lớn. ü  Số bình quân san bằng, bù trừ mọi chênh lệch giữa các đơn vị về trị số của tiêu thức nghiên cứu. c.                  Ý nghĩa ü  Số bình quân có nhiều tác dụng quan trọng về lí luận cũng như về thực tiễn. ü  Số bình quân được sử dụng rộng rãi để phản ánh đặc trưng chung cho cả tổng thể hiện tượng số lớn. Trong thực tế có rất nhiều chỉ tiêu kinh tế là số bình quân như: giá cả, giá thành, năng suất lao động, định mức sản xuất,... ü  Số bình quân thường được sử dụng để so sánh giữa các hiện tượng không cùng quy mô. Trong khi đó, việc so sánh giữa các số tuyệt đối không có ý nghĩa. ü  Số bình quân thường được sử dụng để nghiên cứu xu hướng phát triển cơ bản của hiện tượng qua thời gian nhằm loại trừ ảnh hưởng của các yếu tố ngẫu nhiên (số bình quân di động). ü  Số bình quân không chỉ dùng trong công tác thống kê mà còn được sử dụng phổ biến trong công tác kế hoạch, rất nhiều chỉ tiêu kế hoạch là số bình quân. Đồng thời trong phân tích tình hình thực hiện kế hoạch có thể sử dụng số bình quân làm cơ sở để phân biệt các đơn vị tiên tiến và lạc hậu cũng như phát hiện các khả năng tiềm tàng trong sản xuất, kinh doanh. ü  Số bình quân là cơ sở để vận dụng nhiều phương pháp nghiên cứu thống kê khác như: điều tra chọn mẫu, phân tích phương sai, hồi quy và tương quan. 2.4.3.2. Các loại số bình quân và phương pháp tính a.                  Số bình quân cộng (số bình quân số học) Số bình quân cộng là số bình quân được sử dụng khá phổ biến trên thực tế. Số bình quân này được tính bằng cách đem chia tổng tất cả các trị số của các đơn vị cho số đơn vị tổng thể. a1. Số bình quân cộng giản đơn Trường hợp ứng dụng đối với hiện tượng kinh tế - xã hội diễn ra đơn giản, mỗi lượng biến hay mỗi trị số của tiêu thức chỉ ứng với một đơn vị tổng thể - có nghĩa là lượng biến của tiêu thức không có tần số (chỉ gặp một lần trong tính toán). Công thức tính: Hay                             Trong đó: : Số bình quân cộng xi (i= ): Các mức lượng biến n: Tổng số đơn vị của tổng thể Ví dụ: Có tài liệu về tiền lương tháng của các công nhân trong một tổ sản xuất như sau: 500, 700, 750, 1000, 1200 (1000 đ) =  (1.000đ ) a2. Số bình quân cộng gia quyền Phương pháp được ứng dụng tính số bình quân đối với trường hợp hiện tượng kinh tế - xã hội có lượng biến diễn ra phức tạp: mỗi lượng biến xảy ra nhiều lần, tức mỗi lượng biến có tần số. Công thức tính: Hay                             Trong đó: xi : Các lượng biến. fi : Các tần số. Trong công thức trên, việc nhân các mức lượng biến với các tần số tương ứng gọi là gia quyền nhằm giữ vững vai trò của các mức lượng biến trong quá trình tính toán. Còn bản thân các tần số tham gia vào công thức gọi là quyền số (trọng số) của số bình quân. Ví dụ: Có tài liệu về năng suất lao động của công nhân trong một doanh nghiệp như sau: NSLĐ (kg) Số công nhân 200 50 300 70 400 80 500 60 Tổng cộng 260 Tính năng suất lao động bình quân một công nhân trong doanh nghiệp F Nhận xét: Số bình quân cộng giản đơn chỉ là một trường hợp đặc biệt của số bình quân cộng gia quyền đó là khi: fi = f = F Lưu ý: 1.      Khi tính số bình quân cộng có thể dùng quyền số là số tương đối kết cấu: = Đặt:      (Số tương đối kết cấu) Số bình quân cộng có thể được tính bởi công thức sau: Ví dụ: Có tài liệu về tình hình sản xuất lúa ở một nông trường như sau: Đội sản xuất Năng suất lúa bình quân (tạ/ha) Tỷ trọng diện tích lúa (%) I 60 20 II 65 50 III 62 30 Tính năng suất lúa bình quân của nông trường: 2.      Khi tính số bình quân cộng đối với dãy số lượng biến có khoảng cách tổ, ta phải lấy các trị số giữa làm mức lượng biến đại diện cho các tổ để làm căn cứ tính toán: Trong đó: xmin là giới hạn dưới của khoảng cách tổ                                           xmax là giới hạn trên của khoảng cách tổ                   Trị số giữa này được coi là lượng biến (xi) đại diện của mỗi tổ. Ví dụ: Có tài liệu về năng suất lao động của công nhân trong một công ty như sau: NSLĐ (m2) Số công nhân Trị số giữa 200 – 300 500 250 300 – 400 700 350 400 – 500 800 450 500 – 600 600 550 600 – 700 400 650 Tổng cộng 3000 Tính năng suất lao động bình quân một công nhân 3.      Đối với tổ mở (600 trở lên hoặc dưới 300) thì khoảng cách của các tổ này bằng khoảng cách ở tổ đứng gần nó nhất. b.                  Số bình quân điều hoà Phương pháp tính số bình quân về chỉ tiêu nghiên cứu thuộc hiện tượng kinh tế - xã hội thay thế cho phương pháp số học trong trường hợp dữ liệu tính toán không có tần số mà chỉ có số liệu tổng lượng biến của tổ hay bộ phận (gia quyền). b1. Số bình quân điều hoà gia quyền Về thực chất, số bình quân điều hoà vẫn có nội dung như số bình quân cộng tức là cũng đem các lượng biến của tiêu thức chia cho số đơn vị của tổng thể. Tuy nhiên trong trường hợp này, ta không có sẵn tài liệu về số đơn vị của tổng thể. Công thức tính: Hay                                   Trong đó:       Mi  : Các quyền số của số bình quân điều hoà (Mi = xi fi)                               xi    : Các lượng biến Ví dụ: Có tình hình sản xuất ở một công ty gồm ba xí nghiệp cùng sản xuất một loại sản phẩm như sau: Xí nghiệp Chi phí sản xuất (1000đ) Giá thành đơn vị sản phẩm (1000đ/kg) A 120.000 30 B 160.000 40 C 200.000 50 Tổng cộng 480.000 Tính giá thành đơn vị sản phẩm bình quân của công ty: b2. Số bình quân điều hoà giản đơn Đây là trường hợp đặc biệt của số bình quân điều hoà gia quyền, đó là khi: Mi = M . Công thức tính: = Hay  Ví dụ: Có ba công nhân cùng tham gia sản xuất một loại sản phẩm trong cùng một ca sản xuất. Người công nhân thứ nhất làm ra một sản phẩm bình quân hết 15 phút, người công nhân thứ 2 làm ra một  sản phẩm bình quân hết 20 phút, người công nhân thứ 3 mất 30 phút. Tính thời gian lao động hao phí bình quân để sản xuất một sản phẩm của nhóm công nhân trong ca sản xuất đó. (Biết rằng, các công nhân hoàn thành sản phẩm hoàn toàn độc lập nhau). c.                  Số bình quân nhân (Số bình quân hình học) Đây là số bình quân của những hiện tượng có quan hệ tích số với nhau. c1. Số bình quân nhân giản đơn Công thức tính: Hay                                   Trong đó: xi (i = 1, 2, ,n): là các lượng biến. : ký hiệu tích số Ví dụ: Có tình hình biến động sản lượng của một công ty trong thời kỳ 1998–2003 như sau: ü  Năm 1999 so với 1998 = 115% ü  Năm 2000 so với 1999 = 110% ü  Năm 2001 so với 2000 = 108% ü  Năm 2002 so với 2001 = 112% ü  Năm 2003 so với 2002 = 116% Tính tốc độ phát triển bình quân hàng năm trong thời kỳ 1998–2003? c2. Số bình quân nhân gia quyền Công thức tính: Hay                                   Trong đó: xi (i = 1, 2, ,n): là các lượng biến.                                     : ký hiệu tích số. Ví dụ: Có tình hình tăng trưởng kinh tế ở một địa phương trong thời kỳ 1995–2005 như sau ü  Tốc độ tăng trưởng bình quân (hàng năm) trong thời kỳ 1995 – 2000 là 8% ü  Tốc độ tăng trưởng bình quân (hàng năm) trong thời kỳ 2000 – 2002 là 10% ü  Tốc độ tăng trưởng bình quân (hàng năm) trong thời kỳ 1995 – 2005 là 12% Tính tốc độ tăng trưởng bình quân (hàng năm) trong thời kỳ 1995 – 2005? F Lưu ý: Trong thực tế, số bình quân nhân thường được vận dụng để tính tốc độ phát triển (số tương đối động thái) bình quân. 2.4.3.3. Điều kiện vận dụng số bình quân ü  Điều kiện 1: Số bình quân phải được tính ra từ một tổng thể đồng chất, tức là một tổng thể bao gồm các đơn vị cùng loại. ü  Điều kiện 2: Số bình quân chung cần được vận dụng kết hợp với các số bình quân tổ và dãy số phân phối. CHƯƠNG 3 THỐNG KÊ MÔ TẢ DỮ LIỆU THỜI GIAN Các hiện tượng kinh tế thường xuyên biến động theo thời gian do chúng chịu tác động của rất nhiều tác nhân không ngừng biến đổi xung quanh. Các phương pháp thống kê mô tả dữ liệu thời gian sẽ giúp ta xác định được các đặc trưng biến động cơ bản của hiện tượng theo thời gian và qua đó dự đoán các mức độ trong tương lai của hiện tượng. 3.1. KHÁI NIỆM VÀ PHÂN LOẠI DÃY SỐ THỜI GIAN 3.1.1. Khái niệm Dãy số thời gian là một dãy các giá trị của hiện tượng nghiên cứu được sắp xếp theo thời gian. Ví dụ: Giá cả hàng ngày một cổ phiếu nào đó ở thị trường chứng khoán X ở thời điểm đóng cửa, các ấn bản hàng tháng về chỉ số giá cả ở một thành phố, 3.1.2. Phân loại Căn cứ vào đặc điểm về mặt thời gian của dãy số, ta có thể chia ra 2 loại dãy số: a.      Dãy số thời kỳ: Là dãy số biểu hiện sự biến động của hiện tượng nghiên cứu qua từng thời kỳ. Các mức độ trong dãy số thời kỳ có thể cộng lại với nhau qua thời gian, để phản ánh mặt lượng của hiện tượng nghiên cứu trong một thời kỳ dài hơn. Ví dụ: Năm 97 98 99 2000 2001 2002 Sản lượng (Tấn) 1200 1340 1512 1570 1653 1615 b.      Dãy số thời điểm: Là dãy số biểu hiện sự biến động của hiện tượng nghiên cứu qua các thời điểm nhất định. Các mức độ trong dãy số thời điểm không thể cộng lại theo thời gian vì con số cộng này không có ý nghĩa kinh tế. Ví dụ: Ngày 1/1/03 1/2/03 1/3/03 1/4/03 Sản lượng tồn kho (Tấn) 380 395 350 420 3.2. CÁC THÀNH PHẦN DÃY SỐ THỜI GIAN Biến động của dãy số thời gian có thể được xem như là kết quả hợp thành của 4 yếu tố thành phần sau: ü  Xu hướng (T): thể hiện chiều hướng biến động, tăng hoặc giảm của hiện tượng nghiên cứu trong một thời gian dài. Nguyên nhân của những biến động có tính xu hướng có thể là do lạm phát, sự tăng dân số, tăng thu nhập cá nhân, sự tăng trưởng hay giảm sút của thị trường hoặc có sự thay đổi về công nghệ, ü  Thời vụ (S): biểu hiện qua sự giảm hay tăng mức độ của hiện tượng ở một số thời điểm (Tháng hay quý) nào đó được lặp đi lặp lại qua nhiều năm. Biến động thời vụ thường do các nguyên nhân như điều kiện thời tiết, khí hậu, tập quán xã hội, tín ngưỡng, ü  Chu kỳ (C): biến động của hiện tượng lặp đi lặp lại với một chu kỳ nhất định, thường kéo dài từ 2 - 10 năm. Biến động theo chu kỳ là do tác động tổng hợp của nhiều yếu tố khác nhau. ü  Ngẫu nhiên (I): biến động không có quy luật và hầu như không thể dự đoán. Loại biến động này thường xảy ra trong thời gian ngắn và gần như không lặp lại, do ảnh hưởng của thiên tai, động đất, nội chiến, chiến tranh, 3.3. PHÂN TÍCH DÃY SỐ THỜI GIAN 3.3.1. Mức độ bình quân theo thời gian Là số trung bình của các giá trị của hiện tượng nghiên cứu trong dãy số thời gian. Đây là chỉ tiêu biểu hiện mức độ điển hình, chung nhất của hiện tượng trong thời gian nghiên cứu. Giả sử ta có dãy số thời gian: y1,  y2, ...,yn Gọi : mức độ trung bình của dãy số. 3.3.1.1. Dãy số thời kỳ 3.3.1.2. Dãy số thời điểm Có 2 trường hợp: a.      Khoảng cách thời gian giữa các thời điểm bằng nhau: b.      Khoảng cách thời gian giữa các thời điểm không bằng nhau và thời gian nghiên cứu là liên tục: Trong đó: yi    : mức độ thứ i trong dãy số ti     : độ dài thời gian tương ứng với mức độ thứ i 3.3.2. Lượng tăng (giảm) tuyệt đối Là chỉ tiêu biểu hiện sự thay đổi về giá trị tuyệt đối của hiện tượng giữa hai thời kỳ hoặc thời điểm nghiên cứu. Tùy theo mục đích nghiên cứu, ta có: 3.3.2.1. Lượng tăng (giảm) tuyệt đối liên hoàn Thể hiện lượng tăng (giảm) tuyệt đối giữa hai thời gian đứng liền nhau trong dãy số.  ( i = 2,,n) 3.3.2.2. Lượng tăng (giảm) tuyệt đối định gốc Thể hiện lượng  tăng (giảm) giữa kỳ so sánh với kỳ chọn làm gốc cố định cho mọi lần so sánh ( thường là mức độ đầu tiên trong dãy số)  ( i = 2,,n) Giữa lượng tăng (giảm) tuyệt đối liên hoàn và lượng tăng (giảm) tuyệt đối định gốc có mối liên hệ sau: 3.3.2.3. Lượng tăng giảm tuyệt đối trung bình Là số trung bình cộng của các lượng tăng (giảm) tuyệt đối liên hoàn biểu hiện một cách chung nhất lượng tăng (giảm) tính trung bình cho cả một thời kỳ nghiên cứu. Chi tiêu này có ý nghĩa khi các lượng tăng (giảm) tuyệt đối liên hoàn xấp xỉ nhau, nghĩa là trong suốt thời kỳ nghiên cứu, hiện tượng tăng (giảm) với một lượng tương đối đều. 3.3.3. Tốc độ phát triển Là chỉ tiêu tương đối động thái (phát triển) dùng để đánh giá hiện tượng nghiên cứu qua một thời gian nhất định đã phát triển được với tốc độ cụ thể bao nhiêu (lần hay %) 3.3.3.1.  Tốc độ phát triển liên hoàn: Thể hiện tốc độ phát triển của hiện tượng giữa hai kỳ liền nhau.  ( i = 2, 3, .., n) 3.3.3.2. Tốc độ phát triển định gốc: Thể hiện tốc độ phát triển của hiện tượng giữa kỳ nghiên cứu với kỳ được chọn làm gốc so sánh. ( i = 2, 3, .., n) 3.3.3.3. Giữa tốc độ phát triển liên hoàn và tốc độ phát triển định gốc có các mối liên hệ sau: ü  Tích các tốc độ phát triển liên hoàn bằng tốc độ phát triển định gốc: ü  Tỷ số giữa hai tốc độ phát triển định gốc liền nhau trong dãy số bằng tốc độ phát triển liên hoàn: 3.3.3.4. Tốc độ phát triển trung bình:  Là chỉ tiêu thể hiện nhịp độ phát triển đại diện của hiện tượng trong suốt thời kỳ nghiên cứu 3.3.4. Tốc độ tăng (giảm) Chỉ tiêu này phản ánh mức độ của đối tượng nghiên cứu giữa hai thời gian đã tăng (giảm) bao nhiêu lần, bao nhiêu %. 3.3.4.1. Tốc độ tăng (giảm) liên hoàn:  Là tỷ số so sánh giữa lượng tăng (giảm) tuyệt đối liên hoàn với mức độ kỳ gốc liên hoàn. Hay:                3.3.4.2. Tốc độ tăng (giảm) định gốc: Là tỷ số so sánh giữa lượng tăng giảm tuyệt đối định gốc với mức độ kỳ gốc cố định. Hay:                3.3.4.3. Tốc độ tăng (giảm) bình quân: Là chỉ tiêu tương đối nói lên nhịp điệu  tăng (giảm) đại diện trong một thời kỳ nhất định. Hay:                3.3.5. Giá trị tuyệt đối của 1% tăng (giảm) Chỉ tiêu này phản ánh cứ 1% tăng (giảm) của tốc độ tăng (giảm) liên hoàn thì tương ứng với 1% trị số tuyệt đối là bao nhiêu. Hay:                3.4. DỰ ĐOÁN BIẾN ĐỘNG CỦA DÃY SỐ THỜI GIAN 3.4.1. Dự đoán dựa vào lượng tăng (giảm) tuyệt đối bình quân Phương pháp này thường được vận dụng khi hiện tượng nghiên cứu biến đổi tương đối đều đặn nghĩa là các hiện tượng tăng (giảm) tuyệt đối trong các kỳ xấp xỉ như nhau. Công thức:          Trong đó: : giá trị dự đoán ở thời điểm n + L        : giá trị thực tế ở thời điểm n        : lượng tăng (giảm) tuyệt đối bình quân        : tầm xa dự đoán Ví dụ: Doanh thu của siêu thị Big C trong năm 2008 là 1000 tỉ.  Hãy dự đoán doanh thu của siêu thị này trong năm 2010. Biết rằng = 50 tỉ Từ dữ liệu đề cho ta có: Yn =1000 tỉ; = 50 tỉ; L = 2010- 2008=2 năm => Doanh thu tiêu thụ trong năm 2010 là: ó ó = 1100 tỉ 3.4.2. Dự đoán dựa vào tốc độ phát triển bình quân Phương pháp này thường được vận dụng khi hiện tượng nghiên cứu biến đổi với một nhịp độ tương đối ổn định nghĩa là các tốc độ phát triển trong từng kỳ xấp xỉ như nhau. Công thức:          Trong đó: : giá trị dự đoán ở thời điểm n + L : tốc độ phát triển bình quân L: tầm xa dự đoán Ví dụ: Doanh thu của siêu thị Big C trong năm 2008 là 1000 tỉ.  Hãy dự đoán doanh thu của siêu thị này trong năm 2011.  Biết rằng = 115% /năm Từ dữ liệu đề cho ta có: Yn = 1000 tỉ; L = 20011- 2008 = 3 năm; = 115% /năm => Doanh thu tiêu thụ trong năm 2011 là: ó = 1100 tỉ 3.5. CHỈ SỐ 3.5.1. Khái niệm, ý nghĩa và đặc điểm cấu thành chỉ số 3.5.1.1. Khái niệm Chỉ số là phương pháp thống kê được dùng để phân tích tình hình biến động của hiện tượng qua thời gian hoặc không gian và tìm kiếm các nguyên nhân ảnh hưởng đến hiện tượng nghiên cứu. Ví dụ: So sánh giá của 1 kg hàng A ở kỳ báo cáo (11USD/ kg) so với giá của 1 kg hàng A ở kỳ gốc ( 10USD/kg): 11/10 = 1.1 hoặc 110 % 3.5.1.2. Ý nghĩa ü  Phản ảnh sự biến động của hiện tượng qua thời gian hoặc không gian bằng các số tương đối là chỉ số tương đối động thái, kế hoạch và số tương đối không gian. ü  Phản ảnh sự biến động tuyệt đối của hiện tượng qua thời gian hoặc không gian bằng chỉ tiêu chênh lệch tuyệt đối, tức là nó được xác định bằng hiệu giữa tử và mẫu số của số tương đối là chỉ số. ü  Phân tích vai trò và ảnh hưởng biến động của từng nhân tố đối với sự biến động của toàn bộ hiện tượng kinh tế phức tạp. ü  Biểu hiện các nhiệm vụ kế hoạch hoặc tình hình thực hiện kế hoạch. 3.5.1.3. Đặc điểm ü  Khi muốn so sánh các mức độ của hiện tượng kinh tế phức tạp, trước hết ta phải chuyển các đơn vị hoặc phân tử có tính chất khác nhau về dạng đồng nhất để có thể trực tiếp cộng chúng được với nhau. ü  Khi có nhiều nhân tố cùng tham gia vào việc tính toán chỉ số, ta phải giả định chỉ có một nhân tố thay đổi, các nhân tố còn lại không thay đổi. 3.5.2. Các loại chỉ số và phương pháp tính 3.5.2.1. Chỉ số cá thể (chỉ số đơn): là loại chỉ số phản ánh sự biến động của từng phần tử, từng đơn vị cá biệt của hiện tượng phức tạp. Ví dụ: Chỉ số giá, chỉ số giá thành của từng loại sản phẩm, a.      Chỉ số cá thể về giá Công thức:          Trong đó:       p1, p0 là giá bán ra của từng mặt hàng trong kỳ báo cáo, kỳ gốc b.      Chỉ số cá thể về lượng Công thức:          Trong đó: q1, q0 là lượng bán ra của từng mặt hàng kỳ báo cáo, kỳ gốc. Ví dụ: Có tài liệu về giá cả và lượng hàng hóa tiêu thụ tại một thị trường trong hai kỳ như sau: Tên hàng hóa Đơn vị tính Giá bán lẻ đơn vị Lượng  hàng hóa tiêu thụ Kỳ gốc Kỳ báo cáo Kỳ gốc Kỳ báo cáo A Kg 5.0 5.5 1000 1100 B Met 3.0 3.2 2000 2400 F Yêu cầu: Tính chỉ số cá thể về giá của mặt hàng A, chỉ số cá thể về lượng của mặt hàng B 3.5.2.2. Chỉ số chung (chỉ số tổng hợp) Là chỉ số phản ánh sự biến động của tất cả các đơn vị, các bộ phận của hiện tượng phức tạp. Ví dụ:  Chỉ số giá, giá thành của tất cả các sản phẩm của đơn vị a.      Chỉ số chung về giá  Nêu lên sự biến động về giá cả của một nhóm hoặc tất cả các mặt hàng trên một thị trường hay ở các thị trường khác nhau. Công thức tính:         Chênh lệch của mức tiêu thụ do sự thay đổi của yếu tố giá cả được tính theo công thức sau:                               - Trong đó: p1, p0 là giá bán ra của từng mặt hàng trong kỳ báo cáo, kỳ gốc. q1, q0 là lượng bán ra của từng mặt hàng kỳ báo cáo, kỳ gốc. b.      Chỉ số chung về lượng  Được sử dụng để nghiên cứu sự thay đổi khối lượng sản phẩm một nhóm hay toàn bộ lượng sản phẩm sản xuất hoặc tiêu thụ. Công thức tính:        Chênh lệch của mức tiêu thụ do sự thay đổi của lượng bán ra được tính theo công thức sau:                   - Trong đó: p1, p0 là giá bán ra của từng mặt hàng trong kỳ báo cáo, kỳ gốc q1, q0 là lượng bán ra của từng mặt hàng kỳ báo cáo, kỳ gốc 3.5.2.3. Vấn đề lựa chọn quyền số a.      Quyền số Là đại lượng được dùng trong công thức chỉ số liên hợp và được cố định giống nhau ở tử số và mẫu số. b.      Chức năng ü  Làm cho các phần tử vốn không thể trực tiếp cộng được với nhau được chuyển về dạng đồng nhất và có thể cộng được. ü  Biểu hiện vai trò quan trọng của mỗi phần tử hay bộ phận trong toàn bộ tổng thể, nghĩa là duy trì tỷ trọng của phần tử hoặc bộ phận đó tương xứng với vị trí của nó trong quá trình tính toán. c.      Chọn thời kỳ quyền số Theo phương pháp tính chỉ số như trên thì cách chọn quyền số là như sau: ü  Khi xây dựng chỉ số liên hợp phát triển để nghiên cứu sự biến động của chỉ tiêu chất lượng thì quyền số thường là các chỉ tiêu khối lượng có liên quan và được cố định ở kỳ báo cáo. ü  Khi xây dựng chỉ số liên hợp phát triển để nghiên cứu sự biến động của chỉ tiêu khối lượng thì quyền số thường là các chỉ tiêu chất lượng có liên quan và được cố định ở kỳ gốc. CHƯƠNG 4 ƯỚC LƯỢNG THỐNG KÊ Trong thực tế, dữ liệu tổng thể thường ít được sử dụng vì những nhược điểm như: Chi phí lớn, không kịp thờiThay vào đó, dữ liệu mẫu thường được sử dụng hơn. Tuy nhiên, đối tượng nghiên cứu thì không thay đổi, đó vẫn là cả tổng thể đang nghiên cứu. Do đó, vấn đề đặt ra là cần phải suy rộng từ dữ liệu mẫu cho tổng thể. Việc xác định giá trị gần đúng của các số đo đặc trưng của tổng thể nghiên cứu từ mẫu được chọn theo các phương pháp ngẫu nhiên được gọi là ước lượng thống kê. 4.1. BIẾN NGẪU NHIÊN 4.1.1. Khái niệm Biến ngẫu nhiên là 1 đại lượng có thể nhận giá trị này hay giá trị khác một cách ngẫu nhiên. Biến ngẫu nhiên được ký hiệu bằng chữ in hoa : X,Y,Z; các giá trị của biến ngẫu nhiên được ký hiệu bằng chữ thường : x, y, z Biến ngẫu nhiên có 2 đặc điểm : ü  Có thể biết được các giá trị có thể có của biến ngẫu nhiên. ü  Biến ngẫu nhiên sẽ nhận 1 giá trị nào đó trong tất cả các giá trị có thể có của nó tương ứng với một xác suất nào đó. Ví dụ: ·        Tiến hành phép thử tung đồng xu, nếu mặt trên đồng xu là mặt sấp thì sẽ được 1 điểm, còn nếu là mặt ngửa thì sẽ được 2 điểm. Gọi X là số điểm thu được trong 1 lần tung đồng xu. Ta biết được các giá trị có thể có của X là : 1, 2; tuy nhiên ta không biết được trong lần tung đồng xu X nhận được bao nhiêu điểm. Ta nói: X là biến ngẫu nhiên. ·        Tiến hành chọn ngẫu nhiên 10 sản phẩm từ 1 lô sản phẩm để điều tra về chất lượng của chúng. Gọi số phế phẩm xuất hiện trong 10 sản phẩm là X.  Ta biết được các giá trị có thể có của X là 0,1,2,3,4,5,6,7,8,9,10; tuy nhiên ta không thể biết được X nhận được giá trị nào trong lần điều tra này. Ta nói: X là một biến ngẫu nhiên. Phân loại: Có 2 loại : ü  Biến ngẫu nhiên rời rạc: các giá trị có thể có của nó là những con số có thể đếm được. Ví dụ: Số nhân khẩu trong 1 hộ gia đình, số tai nạn giao thông trong 1 năm, số khách hàng đến mua sắm tại 1 cửa hàng trong 1 ngày, ü  Biến ngẫu nhiên liên tục: các giá trị có thể có của nó là những con số có thể lấp kín một khoảng trên trục số. Ví dụ: Thu nhập của 1 hộ gia đình, năng suất của 1 loại cây trồng, năng suất lao động của 1 công nhân, giá thành của 1 sản phẩm, trọng lượng của 1 sản phẩm 4.1.2. Luật phân phối Một hình thức xác lập mối quan hệ giữa các giá trị và các xác suất tương ứng của một biến ngẫu nhiên gọi là luật phân phối của biến ngẫu nhiên ấy Ngườu ta thường dùng một trong các phương pháp: bảng, biểu đồ hay biểu thức đại số để xác lập luật phân phối. Ví dụ: Luật phân phối tuổi của một sinh viên được chọn ngẫu nhiên trong một lớp như sau: xi 19 20 21 22 23 24 Pi 0.1 0.2 0.5 0.1 0.06 0.04 Đối với biến ngẫu nhiên liên tục, do có vô số giá trị, ta không dùng được phương pháp bảng như trên. Thay vào đó, người ta thường dùng hàm mật độ phân phối để trình bày luật phân phối. Hàm mật độ phân phối f(x) của biến ngẫu nhiên X có những tính chất sau: ·        f(x) ≥ 0         ·        Trên đồ thị, xác suất mà  x1  x2 là diện tích hình nằm bên dưới hàm mật độ phân phối giữa x1 và x2 xmin          x1     x2               xmax     X f(x) Hay:          p (x1  x2) =                   p (xmin  xmax) = =1 4.2. MỘT SỐ LUẬT PHÂN PHỐI THƯỜNG DÙNG 4.2.1. Luật phân phối nhị thức Quy luật phân phối nhị thức (còn gọi là phân phối xác suất nhị thức hay phân phối nhị thức) là 1 quy luật phân phối có nhiều ứng dụng trong thực tế. Nó được áp dụng khi biến ngẫu nhiên rời rạc là “số lần thành công (hay thất bại) trong n phép thử độc lập”. Khi đó ở mỗi phép thử độc lập chỉ xuất hiện 2 biến cố đối lập là “thành công” và “thất bại”, xác suất để xuất hiện biến cố “thành công” trong mỗi phép thử phải đều bằng nhau và bằng p và xác suất để xuất hiện biến cố “thất bại” sẽ là q = 1-p. Ví dụ: Số phế phẩm trong một lô hàng, số khách hàng chấp nhận mua hàng trong n lần chào hàng của một nhân viên tiếp thị là các biến ngẫu nhiên có phân phối nhị thức. * Khái niệm: Quy luật phân phối nhị thức là quy luật phân phối xác suất của biến ngẫu nhiên rời rạc X, trong đó X sẽ nhận các giá trị 0,1,2,, n với các xác suất tương ứng được tính theo công thức xác suất nhị thức như sau:  với =0,1,2,,n;  0<p<1, q=1-p Biến ngẫu nhiên rời rạc X có phân phối nhị thức đuợc ký hiệu: X ~ B(n,p) * Các đặc trưng cơ bản của biến ngẫu nhiên có phân phối nhị thức: Số trung bình:     Phương sai:     Độ lệch chuẩn: 4.2.2. Luật phân phối chuẩn tắc Đối với biến ngẫu nhiên có phân phối chuẩn, việc tính toán xác suất theo công thức rất phức tạp. Do đó để việc tính toán được đơn giản, người ta chuyển quy luật phân phối chuẩn trở thành quy luật phân phối chuẩn chuẩn tắc (còn gọi là phân phối chuẩn hóa). * Khái niệm: Cho biến ngẫu nhiên X có quy luật phân phối chuẩn với trung bình là  và phương sai là ; khi đó bằng phép biến đổi biến :  ta có thể biến đổi biến ngẫu nhiên X thành biến ngẫu nhiên Z có quy luật phân phối chuẩn chuẩn hóa với số trung bình là 0 và phương sai là 1. Quy luật phân phối chuẩn chuẩn hoá là quy luật phân phối xác suất của biến ngẫu nhiên liên tục Z, trong đó Z sẽ nhận các giá trị từ -∞ đến +∞ với hàm mật độ xác suất  có dạng : Biến ngẫu nhiên Z có phân phối chuẩn chuẩn hóa được ký hiệu: Z ~ N(0,1) * Cách tính: Dựa vào bảng tính tích phân Laplace, trong đó tính sẵn xác suất để BNN Z nhận giá trị trong đoạn từ 0 à z :  ü  Chú ý: P(-∞< Z <+∞) = 1 P(-∞< Z ≤0) = P(0 ≤ Z < +∞) = 0,5 P(-z ≤ Z ≤ 0) = P(0 ≤ Z <+z) 4.2.3. Luật phân phối chuẩn * Ý nghĩa: Quy luật phân phối chuẩn (gọi tắt là phân phối chuẩn) là quy luật đóng vai trò chủ đạo trong lý thuyết thống kê suy luận, bởi vì hầu hết các hiện tượng trong cuộc sống đều tuân theo quy luật phân phối chuẩn; mặt khác quy luật phân phối chuẩn còn được dùng để xấp xỉ các quy luật phân phối của biến ngẫu nhiên rời rạc, hoặc được dùng để xấp xỉ các quy luật phân phối khác của biến ngẫu nhiên liên tục * Khái niệm: Quy luận phân phối chuẩn là quy luật phân phối xác suất của biến ngẫu nhiên liên tục X, trong đó X sẽ nhận các giá trị từ -∞ đến +∞ với hàm mật độ xác suất  có dạng : Biến ngẫu nhiên X có phân phối chuẩn được ký hiệu: X ~ N( , ) Trong đó: e ≈ 2,71828 ;  ≈ 3,14159  là các giá trị của biến ngẫu nhiên X, - ∞0  là số trung bình của biến ngẫu nhiên, phản ánh độ tập trung xác suất quanh số trung bình.  là độ lệch chuẩn của biến ngẫu nhiên, phản ánh độ phân tán xác suất quanh số trung bình. 4.2.4. Luật phân phối “Khi bình phương” * Khái niệm: Cho biến ngẫu nhiên X của tổng thể chung có phân phối chuẩn với phương sai bằng , từ tổng thể chung trên, chọn ngẫu nhiên ra một mẫu có cỡ mẫu n với phương sai mẫu bằng ; khi đó biến ngẫu nhiên sẽ có phân phối Chi bình phương với n-1 bậc tự do. 4.2.5. Luật phân phối Student * Khái niệm: Gọi Xi (i=1,2,,n) là các biến ngẫu nhiên được chọn ra từ một tổng thể chung có phân phối chuẩn. Trong trường hợp n<30 và chưa biết phương sai tổng thể thì biến ngẫu nhiên  sẽ có phân phối Student (còn gọi là phân phối t) với n-1 bậc tự do. ü  Nhận xét: So với biểu đồ phân phối chuẩn chuẩn hoá, biểu đồ biểu diễn phân phối Student cũng có dạng gần giống, đó là dạng hình chuông, có trục đối xứng là trục tung, tuy nhiên mức độ tập trung của các quan sát ở khu vực trung tâm kém hơn, nói lên mức độ phân tán quanh số trung bình nhiều hơn. Khi n càng nhỏ thì phân phối Student càng khác biệt so với phân phối chuẩn hoá, nhưng khi n càng lớn, thì phân phối Student sẽ có khuynh hướng tiến càng gần về phân phối chuẩn. 4.2.6. Luật phân phối Fisher-Snedecor * Khái niệm: Cho 2 biến ngẫu nhiên X và Y của 2 tổng thể chung có phân phối chuẩn với phương sai bằng  và ; từ 2 tổng thể chung trên ta chọn ngẫu nhiên ra 2 mẫu độc lập với cỡ mẫu là và với phương sai mẫu bằng  và ; khi đó biến ngẫu nhiên sẽ có phân phối Fisher (còn gọi là phân phối F) với bậc tự do của tử số là -1 và bậc tự do của mẫu số là -1 4.3. ƯỚC LƯỢNG THỐNG KÊ 4.3.1. Các khái niệm: Ước lượng thống kê: Việc suy rộng các đặc trưng của mẫu thành các đặc trưng của tổng thể được gọi là ước lượng thống kê. Ví dụ: Từ các tham số của mẫu như trung bình mẫu, tỷ lệ mẫu, phương sai mẫu ta tiến hành suy rộng các giá trị tham số tương ứng trên tổng thể chung là trung bình tổng thể, tỷ lệ tổng thể, phương sai tổng thể a.      Ước lượng điểm: Có nghĩa là từ giá trị tham số của mẫu, ta ước lượng tham số của tổng thể sẽ là 1 giá trị nào đó. b.      Ước lượng khoảng: Có nghĩa là từ giá trị tham số của mẫu, ta ước lượng tham số của tổng thể sẽ nằm trong 1 khoảng nào đó. c.      Khoảng tin cậy (hay khoảng ước lượng) : Là một khoảng giá trị mà ta ước lượng tham số của tổng thể sẽ rơi vào đó. d.      Độ tin cậy của khoảng tin cậy: Là xác suất đúng khi ước lượng khoảng tin cậy cho tham số của tổng thể. e.      Độ sai lầm của khoảng tin cậy: Là xác suất sai khi ước lượng khoảng tin cậy cho tham số của tổng thể. 4.3.2. Các số đo đặc trưng 4.3.2.1. Các số đo đặc trưng của tổng thể a.      Số trung bình tổng thể            =  ( thường được ký hiệu là  để phân biệt với số trung bình mẫu.) b.      Phương sai tổng thể             = c.       Tỷ lệ tổng thể p =     Trong đó: Ni là tần số của bộ phận tổng thể có biểu hiện đang nghiên cứu trên tiêu thức đang nghiên cứu 4.3.2.2. Các số đo đặc trưng của mẫu ngẫu nhiên tổng quát a.      Số trung bình mẫu tổng quát              = b.      Phương sai mẫu tổng quát       = c.      Tỷ lệ mẫu tổng quát F =   4.3.2.3. Các số đo đặc trưng của mẫu dữ liệu cụ thể a.      Số trung bình mẫu          = b.     Phương sai mẫu       = c.      Tỷ lệ mẫu f =  Trong đó: ni là biểu hiện của bộ phận có biểu hiện đang nghiên cứu trên tiêu thức đang nghiên cứu. 4.4. ƯỚC LƯỢNG THỐNG KÊ VỚI LẤY MẪU NGẪU NHIÊN 4.4.1. Ước lượng điểm ü  Ước lượng điểm của số trung bình tổng thể  là số trung bình mẫu ü  Ước lượng điểm của tỉ lệ tổng thể p là tỉ lệ mẫu f ü  Ước lượng điểm của phương sai tổng thể  là phương sai mẫu hiệu chỉnh      = 4.4.2. Ước lượng khoảng của số trung bình tổng thể 4.4.2.1. Trường hợp n Khoảng ước lượng với độ tin cậy 1-  của  là: (  -   ,   + ) Trong đó                  : là số trung bình mẫu của dữ liệu cụ thể              : sai số chuẩn Sai số chuẩn Ước lượng không chệch Chọn lặp Chọn không lặp 4.4.2.2. Trường hợp n a.      Biết trước phương sai tổng thể ü  Chỉ sử dụng khi tổng thể có phân phối chuẩn ü  Tương tự như trường hợp n b.      Chưa biết trước phương sai tổng thể Khoảng ước lượng với độ tin cậy 1-  của  là: (  -   ,   + ) 4.4.3. Ước lượng khoảng của tỷ lệ tổng thể: n Khoảng ước lượng với độ tin cậy 1-  của p là: (f -   ,  f + ) Trong đó f           : Là tỉ lệ mẫu dữ liệu cụ thể                : Sai số chuẩn Sai số chuẩn Ước lượng không chệch Chọn lặp Chọn không lặp CHƯƠNG 5 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Giả thuyết thống kê là một nhận định chủ quan nào đó đưa ra về một hiện tượng số lớn như: trị số của một số đo đặc trưng, luật phân phối Giả thuyết thì có thể đúng hoặc sai. Khi sự đúng hay sai này mang ý nghĩa lớn trên một tổng thế số lớn hiện có hoặc khuếch đại về mặt thời gian hay không gian thì việc xác minh sự đúng hay sai này trên cả  tổng thể là rất kém thời gian và tiền bạc. Do đó, kiểm định nó dựa trên bằng chứng mẫu là vô cùng cần thiết và hiệu quả. 5.1. KHÁI NIỆM TOP Khi một mẫu được chọn ra từ một tổng thể, các thông tin của mẫu có thể nói lên đặc điểm của tổng thể đó hoặc cũng có thể dùng để đánh giá sự phỏng đoán hoặc một giả thuyết đã được giả định. Ví dụ: a.      Một nhà sản xuất kẹo cho rằng trung bình mỗi hộp (0,5kg) có khoảng 82 viên kẹo. Ðể kiểm tra điều này, ngẫu nhiên những hộp kẹo được chọn ra để kiểm tra, đếm và tính toán. b.      Một nhà sản xuất nước giải khát muốn kiểm tra giả định về tỉ lệ lượng tạp chất có trong thành phẩm nhiều nhất là 0,5%. Ngẫu nhiên những chai và lon nước giải khát được chọn ra để kiểm tra một cách cẩn thận về tỉ lệ tạp chất này. c.      Một quản trị Marketing muốn kiểm tra giả định doanh thu của công ty tăng trung bình ít nhất 5% sau đợt quảng cáo. Ông ta kiểm tra giả định bằng cách liệt kê doanh thu trước và sau chiến dịch quảng cáo để tính toán. d.      Một đài phát thanh truyền hình muốn biết những chương trình Tivi có thỏa mãn cho cả quí ông và quí bà hay không. Ðể kiểm tra điều này, ông ta lấy ý kiến của nam và nữ một cách ngẫu nhiên trong khu vực phát hình của mình, xử lý thông tin và cho kết luận.  5.2.   QUI TRÌNH TỔNG QUÁT TRONG KIỂM ĐỊNH GIẢ THUYẾT Top a.      Chọn loại kiểm định: Tùy theo mục đích nghiên cứu có nhiều loại kiểm định khác nhau như: ü  Những kiểm định đơn giản về trung bình tổng thể (µ) phương sai tổng thể (s2), hoặc tỉ lệ tổng thể (p). ü  Kiểm định sự khác sai về trung bình (m) phương sai (s2), hoặc tỉ lệ (p) của hai tổng thể hay nhiều tổng thể.    ü  Kiểm định của một tổ hợp của những biến độc lập và những biến phụ thuộc của các nhân tố ảnh hưởng đến các vấn đề nghiên cứu.  b.      Mục đích của kiểm định.   c.      Ðặt giả thuyết H0 và  H1: dạng một phía hoặc hai phía (một đuôi hoặc hai đuôi). d.      Ðặt giả thuyết cho cỡ mẫu, tổng thể, dạng phân phối chuẩn hay phân phối bất kỳ, mẫu ngẫu nhiên độc lập hay mẫu ngẫu nhiên phân tầng. e.      Tính toán biến ngẫu nhiên của kiểm định như biến Z (trong phân phối chuẩn), t (trong phân phối Student t) hay c2 (trong phân phối Chi bình phương). f.        Quyết định bác bỏ hay chấp nhận giả thuyết H0 thông qua việc so sánh giữa giá trị kiểm định tính toán được và giá trị tra bảng. g.      Giải thích và kết luận về vấn đề được giả định.        Qui trình tổng quát trong kiểm định giả thuyết sẽ được chi tiết trong các ví dụ phần sau của chương này. Sau đây là một số cơ sở để ước lượng và suy luận:      v Dùng trung bình mẫu hoặc số trung vị để ước lượng trung bình tổng thể (µ) v Dùng phương sai mẫu (s02)để ước lượng phương sai tổng thể  (s2). v Dùng độ lệch chuẩn ((s0) để ước lượng độ lệch chuẩn tổng thể (s).   v Dùng tỉ lệ mẫu f để ước lượng tỉ lệ tổng thể p. 5.3.      CÁC LOẠI GIẢ THUYẾT TRONG THỐNG KÊ 5.3.1.  Giả thuyết H0 (The null hypothesis)               Để dễ hiểu, q được ký hiệu cho các tham số của tổng thể như số trung bình (m), phương sai (s2), phương hoặc tỉ lệ (p). Vậy giả thuyết H0 là tham số q của tổng thể thì bằng với giá trị q0 cụ thể nào đó trong trường hợp giả thuyết có giá trị đơn, nghĩa là H0: q = q0 (kiểm định hai đuôi), hoặc giả thuyết là một dãy của giá trị, lúc đó H0: q ³ q0  hay  H0: q £ q0 (kiểm định một đuôi). 5.3.2.  Giả thuyết H1 (The Alternative Hypothesis)   Giả thuyết H1 là kết quả ngược lại của giả thuyết H0, nếu giả thuyết H0 đúng thì giả thuyết H1 sai và ngược lại. Vậy cặp giả thuyết H0 và H1được thể hiện trong các trường hợp kiểm định như sau: ü  Trong trường hợp kiểm định dạng hai đuôi (Two-tail test): ü  Trong trường hợp kiểm định dạng một đuôi (One- tail test): hoặc 5.4.      CÁC LOẠI SAI LẦM TRONG KIỂM ĐỊNH GIẢ THUYẾT 5.4.1.  Sai lầm loại I Là sai lầm của việc bác bỏ giả thuyết H0 khi giả thuyết này đúng ở mức ý nghĩa  nào đó của kiểm định, nghĩa là nếu quyết định xác suất bác bỏ giả thuyết H0 khi giả thuyết này đúng là  thì xác suất để chấp nhận nó là (1- ). 5.4.2. Sai lầm loại II Ngược lại sai lầm loại I là sai lầm loại II là loại sai lầm của việc chấp nhận giả thuyết H0 khi giả thuyết này sai. Nếu xác suất của việc quyết định chấp nhận một giả thuyết H0 sai được ký hiệu là b thì xác suất để bác bỏ giả thuyết này là (1-b) Những quyết định dựa trên giả thuyết H0 được tóm tắt như sau:  5.5.    KIỂM ĐỊNH TRUNG BÌNH TỔNG THỂ 5.5.1. Kiểm định trung bình tổng thể (µ) với giả định tổng thể có phân phối chuẩn, và phương sai tổng thể (s2) được biết trước 5.5.1.1 Trường hợp mẫu nhỏ: n < 30 Chúng ta bắt đầu với việc kiểm định giả thuyết đơn giản rằng trung bình tổng thể (µ) thì bằng một giá trị cụ thể nào đó. Giả sử rằng chúng ta có một mẫu ngẫu nhiên có n phần tử được chọn ra từ một tổng thể có phân phối chuẩn với trung bình (µ) và phương sai (s2). Nếu trung bình của mẫu n phần tử là và kiểm định ở mức ý nghĩa a. Ta có các giả thuyết  được ví dụ như sau:             1. Đặt giả thuyết: 4. Kết luận: sau khi kiểm định ta kết luận thực chất của vấn đề suy ra từ thông tin mẫu cho tổng thể. Ví dụ 1: Một qui trình sản xuất quả bóng bàn nếu sản xuất trong một dây chuyền chính xác thì trọng lượng của các quả bóng có phân phối chuẩn với Ġ = 5g và độ lệch chuẩn  = 0,1g. Một quản đốc nhà máy nhận định rằng có một sự tăng lên về trọng lượng trung bình của các quả bóng được sản xuất ra, với độ lệch chuẩn không thay đổi. Một mẫu ngẫu nhiên gồm 16 quả bóng đã được chọn để kiểm tra với trung bình g. Kiểm định giả thiết  Ho cho rằng trung bình toàn bộ các bóng bàn được sản xuất ra của nhà máy có trọng lượng tối đa là 5g ở mức ý nghĩa 5% và 10%.   3.      Quyết định Ta có: Z5% = 1,645 và Z10% = 1,28 ·        Trường hợp 1:                         Nếu ·        Trường hợp 2:                         Nếu 4.      Kết luận ·        Trường hợp 1: Với mức ý nghĩa 5%, số liệu của mẫu quan sát không đủ bằng chứng để bác bỏ giả thuyết H0, nghĩa là trọng lượng trung bình của các quả bóng trong tổng thể tối đa là 5g. ·        Trường hợp 2: ở mức ý nghĩa 10% giả thuyết H0 bị bác bỏ, nghĩa là số liệu của mẫu quan sát đủ để cho ta kết luận rằng trọng lượng thực tế trung bình tổng thể các quả bóng trên 5g. Như vậy, có một vấn đề xuất hiện ở đây rằng ở mức ý nghĩa nào của (giữa 5% và 10% thì giả thuyết H0 bị bác bỏ, giá trị ở tại mức (đó được gọi là giá trị p (p value: probability value)).   Giá trị P: giá trị p là mức ý nghĩa  nhỏ nhất mà ở đó giả thuyết H0 bị bác bỏ Trở lại ví dụ trên, Za trong kiểm định bằng 1,52. Như vậy giả thuyết H0 bị bác bỏ ở bất cứ giá trị nào của  a mà ở đó Za nhỏ hơn 1,52. Cụ thể, tìm giá trị p trong trường hợp như sau:                            Za = 1,52            Tra bảng ta có:                         P( Z1,52 ) =  0,4357                   =>       a = 0,5 - P (Z1,52) = 0,5 - 0,4357 = 0, 0643 Hay           a = 6,43% Điều này cho ta suy luận rằng giả thiết H0 có thể bị bác bỏ ở bất kỳ giá trị a nào lớn hơn 6,43%, bởi vì khi a > 6,43%  thì  Za = 1,52  nằm trong vùng bác bỏ giả thuyết (tham khảo sơ đồ dưới đây) Tóm tắt các trường hợp tổng quát cho hai dạng kiểm định hai đuôi và một đuôi:      Ví dụ 2: Một máy khoan lỗ trên tấm kim loại, đường kính của những lỗ khoan có phân phối chuẩn với µ = 2cm và có độ lệch chuẩn là 0,06cm. Ðể kiểm tra tính chất chính xác của máy khoan, đường kính của các lỗ khoan ngẫu nhiên được chọn ra để đo. Giả sử độ lệch chuẩn không thay đổi, một mẫu gồm 9 số đo với đường kính trung bìnhĠ = 1,95cm. Hãy kiểm định giả thuyết H0 rằng trung bình tổng thể (µ) là 2cm ở mức ý nghĩa 5%, và tìm giá trị p của kiểm định?   1.    Giả thuyết: 2.    Kiểm định: 3.    Quyết định: Giá trị tra bảng                 Ta có:     Vì vậy, ta bác bỏ giả thuyết H0 ở mức ý nghĩa 5%, nghĩa là trung bình đường kính của các lỗ khoan có thể trên dưới  2cm.  Ở đây chúng ta cũng có thể  tìm giá trị p để xem giả thuyết H0 bị bác bỏ tại mức ý nghĩa nhỏ nhất là bao nhiêu?   Ta có: 4.    Kết luận: Giả thuyết H0 có thể bị bác bỏ dựa vào kiểm định "hai đuôi" ở bất cứ giá trị nào của a lớn hơn 1,24%. Điều này cũng cho ta nghi ngờ về tính chính xác của máy khoan về đường kính của lỗ khoan là khoản 2cm. 5.5.1.2 Trường hợp mẫu lớn: n > 30    Các bước thực hiện giống như trường hợp mẫu nhỏ nhưng thay phương sai chung (s2)  bằng phương sai mẫu trong phần tính toán kiểm định. Giá trị kiểm định: 5.5.2. Kiểm định giả thuyết của trung bình tổng thể khi chưa biết phương sai (s2) Top       Giả sử chúng ta có một mẫu ngẫu nhiên gồm n phần tử từ một tổng thể có phân phối chuẩn với trung bình tổng thể là µ.  Nếu trung bình và độ lệch chuẩn của mẫu lần lượt là  và     Sx, và kiểm định ở mức ý nghĩa a thì ba dạng tổng quát của kiểm định như sau:     1. Giả thuyết:     2. Kiểm định: Kiểm định giả thuyết của tổng thể trung bình tổng thể khi chưa biết phương sai  (s2) , ta dùng biến ngẫu nhiên t với (1-n) độ tự do thay cho biến ngẫu nhiên Z trong phân tích giá trị kiểm định. Ví dụ: Tổng giám đốc công ty kinh doanh khách sạn du lịch của thành phố Y biết rằng doanh thu trung bình của các khách sạn tháng 12 tăng lên 20% so với tháng 11. Sáu khách sạn ngẫu nhiên được chọn ra và ghi nhận doanh thu tăng lên như sau (%):         19,2          18,4          19,8          20,2          20,4          19,0     Giả sử phân phối của tổng thể là phân phối chuẩn, hãy kiểm định giả thuyết H0 rằng tốc độ tăng trung bình của doanh thu công ty là 20% dựa vào kiểm định "hai đuôi" ở mức ý nghĩa 10%. 1.    Giả thuyết 2.    Giá trị kiểm định: với      Vậy:     Ta thấy t = -1,597 nằm giữa -2,015 và  + 2,015 trong vùng chấp nhận H0.     4. Kết luận: Tốc độ tăng doanh thu trung bình của khách sạn bằng 20% là sự thật ở mức ý nghĩa 10%.            5.6.     KIỂM ĐỊNH TỈ LỆ P TRONG TỔNG THỂ VỚI MẪU LỚN (n>40) Top Trong nhiều vấn đề thực tế, chúng ta muốn kiểm định giả thuyết về tỉ lệ của các phần tử trong một tổng thể lớn. Ở đây chúng ta suy luận vấn đề cho tổng thể dựa vào tỉ lệ của đơn vị trong mẫu ngẫu nhiên với mức ý nghĩa .a Nếu ký hiệu:     Có 3 trường hợp tổng quát trong kiểm định được diễn giải dưới đây:     1. Giả thiết:     2. Kiểm định: Ví dụ: Một mẫu ngẫu nhiên gồm 199 nhà đầu tư trong một thành phố lớn, 104 trong số họ đồng ý với câu nói rằng: "lưu lượng tiền mặt trong hoạt động kinh doanh là một số đo có giá trị của khả năng sinh lời". Hãy kiểm định giả thuyết ở mức ý nghĩa 10% dựa vào kiểm định "hai đuôi" rằng phân nửa số nhà đầu tư (50%) sẽ đồng ý với câu nói trên.    1.  1.Giả thiết: 2.  Kiểm định: 4. Kết luận: Những số liệu trên không đủ bằng chứng để bác bỏ giả thuyết H0 cho rằng 50% các nhà đầu tư trong công ty đồng ý rằng lưu lượng tiền mặt trong hoạt động kinh doanh là một số đo có giá trị của khả năng sinh lời. 5.7.    KIỂM ĐỊNH PHƯƠNG SAI CỦA MỘT PHÂN PHỐI CHUẨN Top      Giả sử rằng chúng ta có một ngẫu nhiên với n phần tử được quan sát từ một tổng thể có phân phối chuẩn với phương sai s2. Nếu phương sai mẫu là , so là một giá trị cụ thể nào đó của phương sai cần kiểm định và kiểm định ở mức ý nghĩa  a ta có: Ví dụ: Ðể đạt được tiêu chuẩn đã được đặt ra cho mức độ tạp chất trong sản phẩm chất hóa học là không vượt quá 4%. Một mẫu ngẫu nhiên gồm 20 sản phẩm có phương sai mẫu 5,62 trong phần trăm mức độ của tạp chất. Hãy kiểm định giả thuyết H0 ở mức ý nghĩa 10% rằng phương sai chung của tổng thể không vượt quá 4%.       1. Giả thuyết:     2. Kiểm định:     4. Kết luận: ở mức ý nghĩa 10%, số liệu không đủ bằng chứng để bát bỏ giả thuyết  cho rằng phương sai chung của phần trăm mức độ phức tạp chất tối đa là 4. 5.8.    KIỂM ĐỊNH SỰ KHÁC NHAU CỦA HAI TRUNG BÌNH TRONG HAI TỔNG THỂ 5.8.1. Kiểm định dựa trên phối hợp từng cặp (Matched pairs): Top Giả sử rằng chúng ta có một mẫu ngẫu nhiên gồm n cặp quan sát từ những phân phối của hai tổng thể có trung bình lần lượt là và . Đặt   và   là trung bình và độ lệch chuẩn cho sự khác nhau của n cặp . Nếu tổng thể của sự khác nhau này có phân phối chuẩn, D0 là một giá trị cụ thể nào đó để kiểm định và kiểm định ở mức ý nghĩa   ta có ba trường hợp kiểm định tổng quát như sau: Ví dụ: Có một nghiên cứu nhằm mục đích kiểm tra sự gợi nhớ nội dung quảng cáo của các sản phẩm khi xem tivi trong 24 giờ. Công ty đưa ra 2 loại nhãn hiệu quảng cáo cho 10 sản phẩm khác nhau. Tài liệu thu nhập sau đây là lượng người sau khi phỏng vấn nhớ hai lọai nhãn hiệu khi xem Tivi:   Sản phẩm Loại 1 Loại 2 Chênh lệch (i) (xi) (yi) di di2 1 137 53 84 7.056 2 135 114 21 441 3 83 81 2 4 4 125 86 39 1.521 5 47 34 13 169 6 46 66 -20 400 7 114 89 25 625 8 157 113 44 1.936 9 57 88 -31 961 10 144 111 33 1.089 Tổng cộng: 210 14.202       Giả sử phân phối tổng thể của các chênh lệch này có phân phối chuẩn. Hãy kiểm định giả thuyết rằng không có sự khác biệt giữa trung bình của hai lọai nhãn hiệu (D0 = 0) của người xem ở mức ý nghĩa 5% và 2,5%.     3. Kết luận: Như vậy giả thuyết H0 rằng có sự bằng nhau của hai trung bình tổng thể về sự gợi nhớ nhãn hiệu sản phẩm bị bác bỏ ở mức ý nghĩa 5% nhưng được chấp nhận ở mức ý nghĩa 2,5% mặc dù số liệu trong bảng trên cho thấy rằng trung bình nhãn hiệu loại 1 cao hơn.  5.8.2. Kiểm định dựa trên mẫu độc lập: Top Giả sử chúng ta có một mẫu ngẫu nhiên gồm nx quan sát từ một tổng thể có phân phối trung bình mx và phương sai   ,  và một mẫu ngẫu nhiên khác gồm  ny quan sát từ một tổng thể cũng có phân phối chuẩn với trung bình my và phương sai  . Trường hợp số quan sát mẫu lớn ta có thể thay thế phương sai tổng thể bằng phương sai mẫu. Nếu   lần lượt là trung bình mẫu của hai tổng thể x và y; D0 là một giá trị nào đó trong kiểm định ở mức ý nghĩa ta có ba trường hợp kiểm định tổng quát như sau: Ví dụ: Một cuộc điều tra trong thực tế các kế toán viên về chuyên môn kế toán được thực hiện trong hoạt động kinh doanh ở các công ty. Các ứng viên trả lời đánh dấu điểm số từ 1 (hoàn toàn không đồng ý) đến 5 (hoàn toàn đồng ý) với câu nói sau đây: Phụ nữ có nghiệp vụ kế toán thì có nhiệm vụ và vị trí trong công việc như nam giới. Một mẫu ngẫu nhiên gồm 186 nam kế toán trong thang điểm trả lời có trung bình là 4,059 và độ chênh lệch chuẩn 0,839. Một mẫu ngẫu nhiên khác gồm 172 nữ kế toán có trung bình cho thang điểm trả lời là 3,680 và độ lệch chuẩn 0,996. Hãy kiểm định giả thuyết H0 cho trung bình hai tổng thể thì bằng nhau trên cơ sở giả thuyết H1 rằng trung bình thì cao hơn cho các nam kế toán viên.   Đặt mx và my lần lượt là trung bình tổng thể cho nam và nữ kế toán viên.Ta có: 5.9.    KIỂM ĐỊNH SỰ KHÁC BIỆT CỦA HAI TỈ LỆ TỔNG THỂ (trường hợp mẫu lớn độc lập)    Top 5.9.1. Trường hợp 1: Chênh lệch hai tỉ lệ tổng thể bằng 0 Top 5.9.2. Trường hợp 2: Chênh lệch hai tỉ lệ tổng thể bằng D Top  Ví dụ: Thông tin từ một bài báo cho biết rằng thị phần cho vay của một số ngân hàng đối với các hãng xe hơi đang bị giảm sút. Bài báo viết rằng năm 2000 các ngân hàng cho vay đến các hãng này khoảng 53% nhưng đến năm 2006 chỉ còn 43%. Giả sử rằng ngẫu nhiên trong 100 lần vay của các hãng xe hơi có 53 lần vay từ ngân hàng vào năm 2000 và 43 lần vào năm 2006. Hãy kiểm định hai đuôi sự bằng nhau của hai tỷ lệ tổng thể về việc vay của các hãng xe hơi tại các ngân hàng năm 2000 và năm 2006 ở mức ý nghĩa 10%. Tra bảng phân phối chuẩn ta cóï Za/2 = Z5% = 1,645. Như vậy, giá trị kiểm định rơi vào vùng chấp nhận giả thuyết H0, có nghĩa là tài liệu không đủ cơ sở để nói lên rằng thị phần cho vay của các ngân hàng đến các hãng xe là thay đổi giữa hai năm 2000 và 2006. CHƯƠNG 6 PHÂN TÍCH PHƯƠNG SAI Mục tiêu của phân tích phương sai là so sánh trung bình của nhiều tổng thể dựa trên các trung bình mẫu và thông qua kiểm định giả thuyết để kết luận. Trong chương này chúng ta đề cập đến hai mô hình phân tích phương sai: phân tích phương sai một chiều và phân tích phương sai hai chiều. 6.1. PHÂN TÍCH PHƯƠNG SAI MỘT CHIỀU (One-Way Analysis of Variance) Top Phân tích phương sai một chiều là phân tích dựa trên ảnh hưởng của một nhân tố (Single factor). 6.1.1. Trường hợp k tổng thể được giả định có phân phối chuẩn và có phương sai bằng nhau: Giả sử rằng chúng ta muốn so sánh trung bình của k tổng thể có phương sai bằng nhau dựa trên những mẫu ngẫu nhiên độc lập gồm n1, n2 , ... , nk quan sát từ k tổng thể khác nhau có phân phối chuẩn. Nếu trung bình của các tổng thể được kí hiệu là (x1, x2,..xk) thì mô hình phân tích phương sai một chiều được mô tả dưới dạng kiểm định giả thuyết như sau:     H0: m1 = m2 = ... = mk   Nghĩa là giả thuyết H0 cho rằng trung bình của k tổng thể khác nhau thì bằng nhau. Ðể kiểm định giả thuyết này cần thực hiện các bướcsau: ü  Bước 1: Trước tiên, tính các trung bình mẫu từ những quan sát của các mẫu ngẫu nhiên độc lập và trung bình chung của tổng thể từ trường hợp tổng quát như sau: Bảng 6.1: Bảng số liệu tổng quát Tổng thể 1 2          ... k x11 x21      ... xk1 x12 x22       ... xk2 ..... .....      ... ..... x1n1 x2n2     ... xknk         Tính trung bình mẫu :·                       (i=1,2,....,k)         Và trung bình chung của k tổng thể:· ü  Bước 2: Tính trung bình bình phương giữa các nhóm trong tổng thể (MSG) từ tổng bình phương giữa các nhóm (SSG), trung bình bình phương trong từng nhóm riêng biệt (MSW) từ tổng bình phương trong từng nhóm (SSW), và tính tổng bình phương của toàn mẫu quan sát (SST).  Tính tổng bình phương trong từng nhóm riêng biệt: SSW (Sum of  Squares within-groups):   Tính cho nhóm thứ nhất:     SS1= - ·      Tính cho nhóm thứ hai: Tương tự như vậy ta có thể tính cho nhóm thứ k. Vậy tổng bình phương trong từng nhóm được tính như sau:    SSW = SS1 + SS2 + ... + SSk Tương tự như vậy ta có thể tính cho nhóm thứ k. Vậy tổng bình phương trong từng nhóm được tính như sau: SSW = SS1 + SS2 + ... + SSk Tính tổng bình phương giữa các nhóm - SSG (Sum of  Squares between-groups): Tính tổng bình phương của toàn mẫu quan sát - SST (Total Sum of  Squares):                  SST = SSW + SSG  ü  Bước 3: Cuối cùng kiểm định giả thuyết được quyết định dựa trên tỉ số F - là thương số giữa trung bình bình phương giữa các nhóm (MSG) và trung bình bình phương trong từng nhóm (MSW).                                                      Bác bỏ giả thuyết H0 cho rằng trung bình của k tổng thể đều bằng nhau khi:                    F > F k-1 , n-k ,a   Biến ngẫu nhiên Fk-1,n-k theo một phân phối F được kí hiệu F v1 , v2  khi tra bảng. Sau đây là biểu bảng tổng quát của ANOVA. Bảng 6.2: Bảng tổng quát của ANOVA Source of Variation Sum of Squares (SS) Degree of Freedom (D.f) Mean Squares (MS) F ratio Between-Groups SSG k - 1 Within-Groups SSW n - k Total SST n - 1 Ví dụ: Một quản trị Marketing muốn xem xét chi phí bán hàng trung bình trên tháng (1000đồng) của một sản phẩm điện tử ở ba cửa hàng khác nhau: A, B và C. Số liệu của chỉ tiêu trên được thu thập trong 7 tháng cho cửa hàng A, 7 tháng cho cửa hàng B và 6 tháng cho cửa hàng C như trong bảng sau:    Ðặt giả thuyết H0: Chi phí bán hàng trung bình/sản phẩm của ba cửa hàng A, B và C đều bằng nhau:                       H0 : mA = mB = mC   1. Tính trung bình mỗi nhóm (mỗi cửa hàng):       * Chi phí bán hàng trung bình/sản phẩm của cửa hàng A:                                         * Chi phí bán hàng trung bình/sản phẩm của cửa hàng B:       * Chi phí bán hàng trung bình/sản phẩm của cửa hàng C:                 * Chi phí bán hàng trung bình/sản phẩm tính chung cho ba cửa hàng:  2. Tính tổng bình phương của cả 3 nhóm: SSW = SS1 + SS2 + SS3 Tương tự:       SS2 =  (24,6 - 23,2)2 + (23,1- 23,2 )2 + ... + (23,5- 23,2)2  = 4,96 SS3 =  (22,7 - 22,9)2 + (21,9 - 22,9)2 + ... + (23,4 - 22,9)2 = 3,46 Þ  SSW = 3,76 + 4,96 + 3,46 = 12,18  Suy ra, trung bình phương trong từng nhóm: 3. Tổng bình phương giữa các nhóm: Suy ra, trung bình bình phương giữa các nhóm: 4. Tính tổng bình phương chung:             SST = SSW + SSG = 12,18 + 21,55 = 33,73    5. Tính tỉ số F: Tra bảng phân phối F với mức ý nghĩa  =1%, ta có: Vì F = 15,04  >  6,11 cho nên nguồn số liệu cho phép bác bỏ giả thuyết H0 rằng chi phí bán hàng trung bình ở ba cửa hàng thì bằng nhau ở mức ý nghĩa 1%. Nghĩa là ở mức ý nghĩa 1% thì chi phí bán hàng trung bình/ sản phẩm ở ba cửa hàng thì khác nhau. Sau đây là bảng kết quả phân tích phương sai một chiều từ ví dụ trên.  Bảng 5.3: Bảng kết quả ANOVA một chiều 6.1.2. Trường hợp các tổng thể được giả định có phân phối bất kỳ (phương pháp phi tham số) Giả sử rằng chúng ta có các mẫu ngẫu nhiên độc lập gồm n1, n2, ..., nk quan sát từ k tổng thể có phân phối bất kỳ. Ta sử dụng kiểm định KRUSKAL- WALLIS bằng  cách xếp hạng các quan sát mẫu. Mặc dù số quan sát của nk mẫu là khác nhau nhưng khi xếp hạng thì được sắp xếp một cách liên tục từ nhỏ đến lớn, nếu giá trị quan sát trùng nhau thì hạng xếp giống nhau bằng cách dùng số trung bình cộng các hạng của chúng để chia đều.        Ðặt  n = n1 + n2 + ... + nk là tổng các quan sát thuộc các mẫu, và R1 , R2, ... , Rk là tổng của các hạng được xếp theo thứ tự của k mẫu. Kiểm định giả thuyết ở mức ý nghĩa cho trường hợp này là:     H0:  (1 = (2 = ... = (k  : Trung bình của k tổng thể đều bằng nhau. Ở đây ta sử dụng biến W thay cho tỉ số F trong phần tính toán giá trị kiểm định. Tra bảng phân phối (2 (Chi-Square) để so sánh, và giả thuyết H0 bị bác bỏ khi:                               W  >  c2k-1, a       Trở lại ví dụ chi phí bán hàng trung bình/sản phẩm ở ba cửa hàng ta có kết quả xếp hạng như trong bảng 10.4. Trong cách xếp hạng này, chi phí nhỏ nhất trong ba cửa hàng là 19,9 (ngàn đồng) được xếp hạng 1, tương tự hạng được xếp cho đến chi phí lớn nhất là 24,6 (ngàn đồng) được xếp hạng 20. Những chi phí trùng nhau sẽ có hạng bằng nhau, chẳng hạn như có hai chi phí là 20,3 (ngàn đồng) trong cửa hàng A, hạng thứ tự của chúng là 2 và 3. Vì vậy, hai giá trị 20,3 có hạng bằng nhau và bằng (2+3)/2 = 2,5.    Bảng 5.4: Xếp hạng liên tục các dữ liệu ở ba cửa hàng.  Ðvt: 1000 đồng Suy ra:                 =  11,10 Ở đây chúng ta có bậc tự do (k -1) = 2 và nếu kiểm định ở mức ý nghĩa 0,5%, khi tra bảng phân phối (2 ta tìm được:  (22;0,5% = 10,6 Bởi vì  W = 11,10 > (22;0,5%  = 10,6 nên giả thuyết H0 bị bác bỏ ở mức ý nghĩa 0,5%,  nghĩa là chi phí bán hàng trung bình / sản phẩm ở ba cửa hàng không bằng nhau. 6.2. PHÂN TÍCH PHƯƠNG SAI HAI CHIỀU (Two -Way Analysis of Variance) Top Phân tích phương sai hai chiều là xét đến hai yếu tố (hai nguyên nhân) ảnh hưởng đến hiện tượng nghiên cứu. Ví dụ như trong phân tích phương sai một chiều cho ta biết kết quả chi phí bán hàng trung bình/sản phẩm ở ba cửa hàng là khác nhau mà ở đây ta chưa nghiên cứu đến trình độ tiếp cận của người bán hàng đến khách hàng hoặc kỹ năng đặc biệt của từng nhân viên khi bán hàng.... Phân tích phương sai hai chiều sẽ có ý nghĩa trong trường hợp này.  6.2.1. Trường hợp có một quan sát mẫu trong một ô (One observation per cell) Top Giả sử xij là một quan sát thấy được ở cột thứ i và hàng thứ j trong một mẫu, như vậy nếu có k cột và h hàng thì ta kí hiệu tổng số quan sát là n = k.h  Dạng tổng quát của quan sát mẫu trên k cột và h hàng như sau:  Bảng 6.5: Quan sát mẫu của phương sai hai chiều Ðể phát triển một kiểm định giả thuyết cho rằng trung bình của các tổng thể thì bằng nhau cho k cột . Ta thực hiện theo các bước sau:  Bước 1: Tính trung bình của riêng từng cột (từng tổng thể): group           (i=1, 2,..., k)               Bước 2: Tính trung bình riêng cho từng hàng: block           (j = 1, 2,..., h) Bước 3: Tính trung bình chung của toàn mẫu quan sát : Bước 4 : Tính 1. Tổng bình phương chung: SST = SSG + SSB + SSE : 2. Tổng bình phương giữa các cột: between-groups :                              3. Tổng bình phương giữa các hàng: between-blocks : 4. Tổng bình phương sai số (error) Bước 5:  Tính các trung bình bình phương:  1. Trung bình bình phương giữa các cột 2. Trung bình bình phương giữa các hàng 3. Trung bình bình phương sai số Bước 6 : Tính giá trị kiểm định từ hai tỉ số  F tương ứng cho hai cặp giả thuyết H0 Bước 7 : Có 2 trường hợp trong quyết định bác bỏ giả thuyết H0 của ANOVA hai chiều một quan sát trong một ô:  1. Ðối với F1, ở mức ý nghĩa , giả thuyết H0 cho rằng trung bình của tổng thể theo chỉ tiêu cột thì bằng nhau (nếu F1 trong bảng kết quả làchỉ tiêu theo cột) có thể bị bác bỏ khi:                                    F1 > F k -1,(k-1)(h-1), a 2. Ðối với F2, ở  mức ý nghĩa , giả thuyết H0 cho rằng trung bình của tổng thể theo chỉ tiêu hàng thì bằng nhau (nếu F1 trong bảng kết quả là chỉ tiêu theo hàng) có thể bị bác bỏ khi:                                 F2 > F h -1,(k-1)(h-1), a Chú ý:      F (k -1),(k-1)(h-1), (hay Fh -1,(k-1)(h-1)  (là giá trị trong bảng phân phối F (phân phối Fisher ở sau sách) có dạng F v1, v2 Bảng kết quả phân tích phương sai hai chiều được xử lý từ phần mềm Excel. hoặc SPSS, Kết quả được in ra có dạng tổng quát như sau: Bảng 6.6: Bảng kết quả tổng quát ANOVA hai chiều 6.2.2. Trường hợp có hơn một quan sát trong một ô (More than one obserration per cell) Top  Phát triển thêm từ trường hợp một quan sát trong một ô. Ðể tăng tính chính xác khi suy rộng một vấn đề nào đó của mẫu cho một tổng thể, ta tăng mẫu quan sát (n) trong điều kiện cho phép. Gọi (l) là số quan sát trong một ô, ta có dạng tổng quát của (l) quan sát trong một ô như sau:  Bảng 6.7: Quan sát mẫu tồng quát của ANOVA nhiều quan sát trong một ô Có ba giả thuyết H0 trong trường hợp phân tích phương sai hai chiều nhiều quan sát trong một ô tương ứng với ba tỉ số F (F1,F2 và F3).          Hai giả thuyết H·0 tương ứng với tỉ số F1 và F2 giống như trong trường hợp phân tích phương sai hai chiều một quan sát trong một ô. Nghĩa là, trung bình chỉ tiêu nghiên cứu của chỉ tiêu theo cột và theo hàng thì bằng nhau.          Giả thuyết H·0 tương ứng với tỉ số F3: không có sự ảnh hưởng qua lại giữa các chỉ tiêu theo cột và hàng đến chỉ tiêu nghiên cứu.  Cũng từ ví dụ chi phí bán hàng (chỉ tiêu nghiên cứu), thay vì thu thập một quan sát trong một ô, ta tiến hành thu thập ba quan sát trong một ô nhằm để tăng khả năng chính xác của việc suy rộng cho tổng thể. Bảng sau đây thể hiện dữ liệu thu thập ba quan sát trong một ô:   Nhóm tuổi Cửa hàng nhân viên A B C 1 25,0  25,4  25,2 24,0  24,4  23,9 25,9  25,8  25,4 2 24,8  24,8  24,5 23,5  23,8  23,8 25,2  25,2  25,4 3 26,1  26,3  26,2 24,6  24,9  24,9 25,7  25,9  25,5 4 24,1  24,4  24,4 23,9  24,0  23,8 24,0  23,6  23,5 5 24,0  23,6  24,1 24,4  24,4  24,1 25,1  25,2  25,3 Ðặt các giả thuyết H0: 1. Giả thuyết H0 trong trường hợp F1: Chi phí bán hàng trung bình/sản phẩm ở các cửa hàng khác nhau đều bằng nhau. 2. Giả thuyết H0 trong trường hợp F2: Chi phí bán hàng trung bình/sản phẩm được thực hiện bởi các nhân viên có độ tuổi khác nhau thì bằng nhau. 3. Giả thuyết H0 trong trường hợp F3: không có tương tác giữa độ tuổi khác nhau của nhân viên bán hàng bán ở ba cửa hàng khác nhau. Bước 1 : Tính trung bình nhóm (group means): Bước 2 : Tính trung bình theo hàng (block means):  Bước 3: Tính trung bình trong một ô (cell means) Tương tự ta cũng tính được: Bước 4 : Tính trung bình chung (overall mean): Bước 5 : Tính các tổng bình phương (SS) và các trung bình bình phương (MS):     Chú ý: ở đây xuất hiện thêm một chỉ tiêu SSI (sums of squares for interaction) là tổng bình phương của sự tác động qua lại giữa chỉ tiêu cột và hàng. Bước 6: Tỉ số F   Sau đây là bảng kết quả ANOVA tổng quát:  Bảng 6.7: Bảng kết quả ANOVA hai chiều tổng quát Nguồn biến động Tổng bình phương Ðộ tự do Trung bình bình phương Tỉ số F Giữa các nhóm SSG (k-1) MSG F1 Giữa cãc hàng SSB (h-1) MSB F2 Giữa các nhóm và hàng SSI (k-1)(h-1) MSI F3 Sai số SSE k.h(l-1) MSE Tổng cộng SST khl -1 Và bảng kết quả ANOVA trong ví dụ trên là: Nguồn biến động Tổng bình phương Ðộ tự do Trung bình bình phương Tỉ số F Các cửa hàng (A,B và C) 7,1565 2 3,5783 92,46 Loại tuổi nhân viên 13,1517 4 3,2879 84,96 Interaction 6,6045 8 0,8256 21,33 Error 1,1600 30 0,0387 Total 28,0727 44 F Nhận xét: Ta có  k = 3   h = 5         l = 3    và  ( = 1% 1. F1 = 96,42  và  khi tra bảng phân phối F, ta có Fk-1 ,k h (l-1),(         = F2,30,1% = 5,39.  Vì: F1 = 96,42  > F2,30,1% = 5,39 nên giả thuyết H0  bị bác bỏ ở mức ý nghĩa 1%. Nghĩa là chi phí bán hàng trung bình / sản phẩm ở các cửa hàng khác nhau thì khác nhau.   2. F2 =  84,96 và  khi tra bảng phân phối F, ta có Fh-1 ,k h (l-1),(  = F4,30,1% = 4,02.  Vì: F2 =  84,96   > F4,30,1% = 4,02 nên giả thuyết H0  bị bác bỏ ở mức ý nghĩa 1%. Nghĩa là chi phí bán hàng trung bình / sản phẩm được thực hiện bởi các nhân viên có độ tuổi khác nhau thì khác nhau.  3. F3 = 21,33 và  khi tra bảng phân phối F, ta có F (k-1)(h-1), k h (l-1),(         = F8,30,1% = 3,17. Vì: F3 = 21,33 > F8,30,1% = 3,17 nên giả thuyết H0  bị bác bỏ ở mức ý nghĩa 1%. Nghĩa là có liên hệ và ảnh hưởng qua lại giữa độ tuổi khác nhau của nhân viên bán hàng bán ở  ba cửa hàng khác nhau đến chi phí bán hàng trung bình/sản phẩm. F Chú ý:  Khi thực hiện ANOVA trên máy vi tính, trong bảng kết quả cho ta thêm một cột mang tên F Critical, cột này sẽ là kết quả tra bảng dùng để so sánh với cột F ratio để quyết định bác bỏ hay chấp nhận giả thuyết H0.

Các file đính kèm theo tài liệu này:

  • docxtailieu.docx
Tài liệu liên quan