รายละเอียดวิทยานิพนธ์
ชื่อวิทยานิพนธ์ การวิเคราะห์แนวทางการเปรียบเทียบสมรรถนะของโปรแกรมแยกคำภาษาไทย
ANALYSIS OF GUIDELINES FOR PERFORMANCE COMPARISON OFTHAI WORD SEPARATION PROGRAM
ชื่อนิสิต พิสิทธิ์ พรมจันทร์
Pisit Promchan
ชื่ออาจารย์ที่ปรึกษา อ ดร ยรรยง เต็งอำนวย
Yunyong Teng-Amnuay Ph D
ชื่อสถาบัน จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Chulalongkorn University. Bangkok. (Thailand). Graduate School.
ระดับปริญญาและรายละเอียดสาขาวิชา วิทยานิพนธ์มหาบัณฑิต. วิศวกรรมศาสตร์ (วิทยาศาสตร์คอมพิวเตอร์)
Master. Science (Computer Science)
ปีที่จบการศึกษา 2540
บทคัดย่อ(ไทย) งานวิจัยนี้ได้ทำการวิเคราะห์ หาแนวทางในการเปรียบเทียบสมรรถนะของโปรแกรมและอัลกอริธึมตัดคำภาษาไทย โดยเริ่มจากการสังเคราะห์ตัวอย่างมาตรวัด ที่จะใช้ในการวัดและเปรียบเทียบประสิทธิภาพ ศึกษาคุณลักษณะเฉพาะของเอกสารภาษาไทย ที่มีผลต่อประสิทธิภาพของโปรแกรมตัดคำภาษาไทย รวบรวมโปรแกรมและอัลกอริธึมตัดคำภาษาไทย ที่ได้มีการพัฒนาและเผยแพร่ใช้งานในปัจจุบัน รวบรวมข้อมูลภาษาไทยที่ใช้อ้างอิง รวมไปถึงพจนานุกรมที่ใช้ในการตรวจสอบความถูกต้องของการตัดคำ จากนั้นจึงทำการพัฒนาวิธีการวัดประสิทธิภาพ และทำการวัดประสิทธิภาพ จากผลการวัดประสิทธิภาพพบว่าแบบเปรียบเทียบคำที่ยาวที่สุดจะตัดได้จำนวนคำที่ถูกต้องออกมามากที่สุด แบบการแก้ไขย้อนกลับจะได้คำผิดน้อยที่สุด แบบอาศัยความถี่ของการใช้คำจะได้อัตราความถูกต้องต่อจำนวนคำในพจนานุกรมสูงสุด แบบใช้พจนานุกรมลดความกำกวมสามารถจัดการกับคำกำกวมได้ดีที่สุดและแบบเปรียบเทียบคำที่สั้นที่สุดจะตัดออกมาได้จำนวนคำสูงสุดนอกจากนี้พบว่าโครงสร้างข้อมูลสำหรับพจนานุกรมที่ใช้ในโปรแกรมตัดคำมีผลมากในด้านความเร็วโดยที่โครงสร้างข้อมูลแบบทรัยให้ความเร็วสูงสุดในปัจจุบัน
บทคัดย่อ(English) In this thesis, the guidelines for performancecomparison of Thai Words Separation-Programs have beenanalyzed. The thesis begin from synthesis of example ofperformance indicators, study the characteristics ofThai documents that effect performance of the ThaiWords Separation Programs. Then, collect-Thai WordsSeparation Programs and algorithms that had beendeveloped and announced to be used currently, collectthe Thai.. reference data which include the referencedictionary to validate the accuracy of Thaiwords-separation, and-develop the measurementmethodology. Finally, I do the performance measurementusing the developed methodology. Experimental results show that the LongestPattern Matching' gives the-most-accurate words-outputwhile the Back-Tracking Algorithm:gives the least errorwords. Words Usage Frequency gives the highest validwords ratio per number of words in its dictionary. Theusage of ambiguity dictionary gives the:best ambiguouscase resolution, whereas the Shortest Pattern Matchinggives the highest number of words output. Additionally,it is found that the data structure for dictionary thatused in Thai Words Separation Programsextremely-effects in term of speed, meanwhilethe-Trie structure is the most popular method that hasbeen used in the present due to its outperformed speed.
ภาษาที่ใช้เขียนวิทยานิพนธ์
จำนวนหน้าของวิทยานิพนธ์ 71 P.
ISBN 974-638-133-4
สถานที่จัดเก็บวิทยานิพนธ์
คำสำคัญ ALGORITHM, ANALYSIS, PERFORMANCE, COMPARISON, THAI, WORD, SEPARATION, SEGMENTATION
วิทยานิพนธ์ที่เกี่ยวข้อง




เว็บไซต์นี้ใช้งานคุกกี้ ในการใช้งานสามารถใช้งานเว็บไซต์อย่างต่อเนื่องและมีประสิทธิภาพ
เว็บไซต์นี้จะมีเก็บค่าคุกกี้ เพื่อให้การใช้งานเว็บไซต์ของท่านเป็นไปอย่างความราบรื่นและเป็นส่วนตัวมากขึ้น จึงขอให้ท่านรับรองว่าท่านได้อ่านและทำความเข้าใจนโยบายการใช้งานคุกกี้
Accept
นโยบายการคุ้มครองข้อมูลส่วนบุคคล | ข้อกำหนดและนโยบายการให้บริการเว็บไซต์
© 2009 ฝ่ายบริการความรู้ทางวิทยาศาสตร์และเทคโนโลยี, สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ All Rights Reserved.