| รายละเอียดวิทยานิพนธ์ | |
| ชื่อวิทยานิพนธ์ | การทดสอบความเป็นอิสระแบบเบส์สำหรับการแจกแจงพหุนามโดยใช้การแจกแจงก่อนที่เป็นอิสระต่อกัน BAYESIAN TEST OF INDEPENDENCE FOR MULTIONMIAL DISTRIBUTION USINGINDEPENDENCE PRIOR |
| ชื่อนิสิต | นริศรา วิเชียรเจริญ Narisara Wichiencharoen |
| ชื่ออาจารย์ที่ปรึกษา | รศ ดร สุพล ดุรงค์วัฒนา Asso Prof Supol Durongwatana Ph D |
| ชื่อสถาบัน | จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย Chulalongkorn University. Bangkok (Thailand). Graduate School. |
| ระดับปริญญาและรายละเอียดสาขาวิชา | วิทยานิพนธ์มหาบัณฑิต. พาณิชยศาสตร์และการบัญชี (สถิติ) Master. Science (Statistics) |
| ปีที่จบการศึกษา | 2543 |
| บทคัดย่อ(ไทย) | การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อศึกษาการทดสอบความเป็นอิสระของตัวแปร 2 ตัวที่อยู่ในรูปตาราง การณ์จรโดยใช้แนวคิดแบบเบส์โดยที่การคำนวณค่าของตัวสถิติทดสอบแบบเบส์นั้นนอกจากจะขึ้นอยู่กับข้อมูลที่เก็บรวบรวมมาแล้วยังขึ้นอยู่กับการแจกแจงก่อน (Prior distribution)ซึ่งในการวิจัยครั้งนี้จะใช้การแจกแจงก่อนที่เรียกว่าการแจกแจงไดริเซตและอยู่ในรูปแบบที่เป็นอิสระต่อกัน และเปรียบเทียบตัวสถิติทดสอบที่ใช้ทดสอบความเป็นอิสระของตัวแปร 2 ประเภท คือ ตัวสถิติทดสอบที่ใช้แนวคิดแบบฉบับ(Classical statistics) ได้แก่ ตัวสถิติทดสอบเพียร์สันไคกำลังสอง ((2)และตัวสถิติทดสอบอัตราส่วนความควรจะเป็นไคกำลังสอง (G2) กับตัวสถิติที่ถูกเสนอขึ้นมาใหม่ คือ ตัวสถิติทดสอบที่ใช้แนวคิดแบบเบส์ซึ่งเรียกว่าปัจจัยเบส์ (Bayes factor) ได้แก่ F(1), F(2),..., F(9)เมื่อตัวแปรมีการแจกแจงพหุนามและอยู่ในตารางการณ์จร 2 ทาง โดยที่ฟังก์ชั่นความควรจะเป็นอยู่ในรูป f(x l p) =(สูตร)ซึ่งสมมติฐานที่ใช้ในการทดสอบ คือ H(,0) : p(,ij) = p(,i)p(,j) H(,1) : p(,ij) () p(,i)p(,j)โดยที่ p(,ij) คือ พารามิเตอร์ที่ต้องการทดสอบซึ่งเป็นความน่าจะเป็นที่ข้อมูลจะตกอยู่ในแถวที่ I และสดมภ์ที่ j สำหรับแนวคิดแบบเบส์จะถือว่า p(,ij) มีการแจกแจงซึ่งเรียกการแจกแจงนี้ว่าการแจกแจงก่อน ในการวิจัยครั้งนี้กำหนดให้การแจกแจงของ p(,ij) เป็นการแจกแจงไดริเซต ซึ่งมีรูปแบบเป็น (สูตร)โดยมีพารามิเตอร์ คือ q = (q(,11) , q(,12) ,..., q(,ij)) และ K โดยที่ qมีการแจกแจงแบบสม่ำเสมอ (Uniform distribution) และ Kเป็นพารามิเตอร์แสดงความเชื่อของผู้ทดลองเกี่ยวกับความเป็นอิสระของข้อมูลซึ่งค่า K จะถูกกำหนดจาก log K = 0.0, 0.5, ..., 4.0 ทำให้มีค่าปัจจัยเบส์ 9ตัว คือ ตามลำดับ F(1), F(2),..., F(9) การพิจารณาค่าของตัวสถิติจะพิจารณาจากความสามารถในการควบคุมความน่าจะเป็นของความผิดพลาดประเภทที่1 และอำนาจการทดสอบ ในการวิจัยครั้งนี้ใช้เทคนิคการจำลองมอนติคาร์โลโดยกระทำซ้ำ 1,000 ครั้งใน แต่ละสถานการณ์ ผลสรุปของการวิจัยมีดังนี้ ~b1. ความสามารถในการควบคุมความน่าจะเป็นของความผิดพลาดประเภทที่ 1~b ตัวสถิติทดสอบทั้ง 11 ตัวสามารถควบคุมความน่าจะเป็นของความผิดพลาดประเภทที่ 1 ได้ในทุกสถานการณ์ที่ต้องการศึกษา เมื่อระดับนัยสำคัญของการทดสอบ ((+,a)) มีค่า 0.01 และ 0.05 ~b2. อำนาจการทดสอบ~b อำนาจการทดสอบของตัวสถิติทุกตัวแปรตามขนาดตัวอย่างระดับความสัมพันธ์ของข้อมูล และระดับนัยสำคัญ ตัวสถิติทดสอบที่ใช้แนวคิดแบบฉบับ (Classic statistic)มีแนวโน้มที่จะให้อำนาจการทดสอบสูงกว่าตัวสถิติทดสอบที่ใช้แนวคิดแบบเบส์(Bayes factor) ในกรณีที่ขนาดตัวอย่างมีค่าน้อยและ/หรือระดับความสัมพันธ์ของข้อมูลมีค่าน้อย เนื่องจากการคำนวณค่าตัวสถิติทดสอบแบบเบส์มีการนำความเชื่อเกี่ยวกับความเป็นอิสระของข้อมูลเข้าไปร่วมคำนวณด้วยโดยที่ความเชื่อนี้จะอยู่ในรูปของค่าพารามิเตอร์ขั้นที่ 2 (Hyperparameter)ซึ่งเขียนอยู่ในรูปของค่า K ทำให้การปฏิเสธสมมติฐานว่างของตัวสถิติทดสอบแบบเบส์มีค่าต่ำกว่าการปฏิเสธสมมติฐานว่างของตัวสถิติทดสอบแบบฉบับซึ่งไม่ได้ใส่ความเชื่อก่อนในการคำนวณค่าของตัวสถิติ แต่ ในกรณีที่ขนาดตัวอย่างมีค่ามากหรือระดับความสัมพันธ์ของข้อมูลมีค่ามากอำนาจการทดสอบของตัวสถิติทดสอบแบบฉบับและอำนาจการทดสอบของตัวสถิติทดสอบแบบเบส์จะมีค่าไม่แตกต่างกัน ดังนั้น การเลือกตัวสถิติที่เหมาะสมกับการใช้งานควรพิจารณาจากความรู้เดิมของผู้ใช้งาน ถ้าผู้ใช้งานไม่มีความรู้เดิมเกี่ยวกับข้อมูลเลยหรือไม่เคยทำการเก็บข้อมูลมาก่อนควรใช้ตัวสถิติทดสอบแบบฉบับ แต่ถ้าผู้ใช้งานมีความรู้เดิมว่าข้อมูลมีความเป็นอิสระต่อกันหรือเคยทำการทดลองกับข้อมูลชุดเดิมแล้วพบว่าข้อมูลมีความเป็นอิสระต่อกัน ควรใช้ตัวสถิติทดสอบแบบเบส์ที่ใช้การแจกแจงก่อนที่เป็นอิสระต่อกันในการทดสอบความเป็นอิสระกับข้อมูลชุดใหม่ |
| บทคัดย่อ(English) | The objective of this research is to study the test of independencefor bivariate in contingency table using Bayesian approach. The computationof Bayesian statistic does not only depends on the collected data but alsodepends on prior distribution. Prior distribution in this research is inthe form of Dlrichlet distribution and concentrated about independencesurface H(,o). In addition, the research will compare two classes of teststatistics for testing independence between two variables. The statisticsin the first class are Pearson' s chi-square test statistic ((+,c)('2)) andlikelihood ratio test statistic (G('2)) and the statistic in the secondclass is Bayes factors which are F((,1)), F((,2)) ,..., F((,9)). Thevariables are in two-way contingency table and have multinomaildistribution. The likelihood function is Figure StructureThe hypothesis can be written as H(,o) : p(,ij) = p(,L)p(,j) H(,1) : p(,ij) (+,น) p(,i)p(,j)where the parameter, p(,ij), is probability of cell in i('th) row andj('th) column. According to Bayesian approach, p(,ij) has priordistribution in the form of Dirichelt distribution (+,p)(p(+,ฝ)K,q(,a),q(,b)) = D(,u)('-1)(Kq(,a),q(,bj))(+,P)p(,ij)('K)q(,aj)q(,bj)('-1) D(,IJ)(Kq(,ai)q(,bj)) = (...)(+,P)p(,ij)('Kq(,aj)('q)(,bj)('-1) = (...)in which two hyparameters , q = (q(,11), q(,12) ,..., q(,ij)) and K , whereas q have uniform distribution and K is a parameter which reflects thestrength of one's prior belief about the independence. The value of K arecomputed from log K = 0.0, 0.5,...,4.0. So, there are nine Bayes factorsnamely F((,1)) F((,2)),...,F((,9)). The value of the test statistics willbe considered from their abilities to control probability of type I errorand power of the test. For this research, Monte Carlo technique Is used byrepeating 1,000 times for each case. The results of this research can besummarized as follow : ~b1. The ability to control probability of type I error~b All of 11 test statistics can control probability of type Ierror in all cases when significance levels are 0.01 and 0.05 ~b2. Power of the test~b Power of the test statistics vary according to the sample size,the strength of the relationship between the variables and significancelevels. Classic statistics tend to have higer power of the test than Bayesfactors in the cases that the sample size is small or the relationship ofthe variables is weak because the computation of Bayes factors has Includedthe hyperparameter K which reflects the strength of one's prior beliefabout the independence so that the null hypothesis rejection of Bayesfactors are fewer than the null hypothesis rejection of classic statistics.In case that the sample size Is large or the relationship of the variableIs strong, the power of the test of classic statistics are equal the powerof the test of the Bayes factors. Thus, the selection of test statistic depends on one's prior beliefabout the data. User with no prior belief about the data would bettermanipulate classic statistic. On the other hand, user with prior beliefabout independence would find it more compelling to engage Bayes factorusing independence prior. |
| ภาษาที่ใช้เขียนวิทยานิพนธ์ | |
| จำนวนหน้าของวิทยานิพนธ์ | 183 P. |
| ISBN | 974-13-0161-8 |
| สถานที่จัดเก็บวิทยานิพนธ์ | |
| คำสำคัญ | CONTINGENCY TABLE, CATEGORICAL DATA, TEST OF INDEPENDENCE, MULTINORNAIL DISTRIBUTION, DIRICHLET DISTRIBUTION, BAYES FACTOR, CHI-SQUARE TEST STATISTIC, LIKELIHOOD RATIO TEST STATISTIC, TYPE 1 ERROR, POWER OF THE TEST |
| วิทยานิพนธ์ที่เกี่ยวข้อง |
|

