forked from tyroroto/ThaiWord-Segmentation-.Net
- Notifications
You must be signed in to change notification settings - Fork 0
Home
Chaiwat Matarak edited this page Jan 4, 2020 · 1 revision
using System; using System.Collections.Generic; using ThaiStringTokenizer; public void SplitWord() { var tokenizer = new ThaiTokenizer(); var text = "ปลาที่ใหญ่ที่สุดในโลกคือปารีสชุบแป้งทอด"; var results = tokenizer.Split(text); Console.WriteLine("results = [{0}]", string.Join('|', results)); // results = [ปลา|ที่|ใหญ่|ที่สุด|ใน|โลก|คือ|ปารีส|ชุบ|แป้ง|ทอด] }using System; using System.Collections.Generic; using ThaiStringTokenizer; public void SubstringThaiStyle() { var tokenizer = new ThaiTokenizer(); var text = "ปลาที่ใหญ่ที่สุดในโลกคือปารีสชุบแป้งทอด"; var maxLenght = 20; var result = tokenizer.SubThaiString(text, maxLength); Console.WriteLine("results = [{0}]", string.Join('|', results)); // results = [ปลาที่ใหญ่ที่สุดในโลกคือ|ปารีสชุบแป้งทอด] }using System; using System.Collections.Generic; using ThaiStringTokenizer; using ThaiStringTokenizer.Models; public void SubstringThaiStyle() { var input = "ถ้าหากรักนี้ ไม่บอกไม่พูดไม่กล่าว แล้วเขาจะรู้ว่ารักหรือเปล่า"; var tokenizer = new ThaiTokenizer(); var results = tokenizer.SubThaiStringAndCount(input, 24); foreach (var result in results) { Console.WriteLine("word = {0}, countable = {1}, uncountable = {2}", result.Words, result.Countable, result.Uncountable); } // Words = ถ้าหากรักนี้ ไม่บอกไม่พูดไม่กล่าว, Countable = 24, Uncountable = 9 // Words = แล้วเขาจะรู้ว่ารักหรือเปล่า, Countable = 21, Uncountable = 7 }using System; using System.Collections.Generic; using ThaiStringTokenizer; public void SplitWord() { var customDictionary = new List<string> { "หวัดดี", "หวักลี", "เชอแตม" }; var tokenizer = new ThaiTokenizer(customDictionary); var text = "หวักลีหวัดดีปลาที่ใหญ่ที่สุดในโลกคือปารีสชุบแป้งทอดเชอแตม"; var results = tokenizer.Split(text); Console.WriteLine("results = [{0}]", string.Join('|', results)); // results = [หวักลี|หวัดดี|ปลา|ที่|ใหญ่|ที่สุด|ใน|โลก|คือ|ปารีส|ชุบ|แป้ง|ทอด|เชอแตม] }using System; using System.Collections.Generic; using ThaiStringTokenizer; public void SubstringThaiStyle() { var tokenizer = new ThaiTokenizer(); var text = "อาราธนาพระพุทธ อาราธนาพระธรรม อาราธนาพระสงฆ์"; var maxLenght = 50; var results = tokenizer.SubThaiString(text, maxLength); Console.WriteLine("results = [{0}]", string.Join('|', results)); // results = [อาราธนาพระพุทธ อาราธนาพระธรรม อาราธนาพระสงฆ์] }using System; using System.Collections.Generic; using ThaiStringTokenizer; public void SplitWord() { var tokenizer = new ThaiTokenizer(matchingTechnique: MatchingTechnique.ShortestMatching); var text = "เจริญ"; var results = tokenizer.Split(text); Console.WriteLine("results = [{0}]", string.Join('|', results)); // results = [เจ|ริญ] }using System; using System.Collections.Generic; using ThaiStringTokenizer; public void SplitWord() { var tokenizer = new ThaiTokenizer(matchingTechnique: MatchingTechnique.LongestMatching); var text = "เจริญ"; var results = tokenizer.Split(text); Console.WriteLine("results = [{0}]", string.Join('|', results)); // results = [เจริญ] }using System; using System.Collections.Generic; using ThaiStringTokenizer; public void SplitWord() { var tokenizer = new ThaiTokenizer(matchingTechnique: MatchingTechnique.ShortestMatching); var text = "ศิริวิมล"; var results = tokenizer.Split(text); Console.WriteLine("results = [{0}]", string.Join('|', results)); // results = [ศิ|ริ|วิ|มล] }