ข้อดี-ข้อเสีย UTF-8 กับ TIS-620

ข้อดี-ข้อเสีย UTF-8 กับ TIS-620

พอดีมีเพื่อนมาถามว่า ข้อดี-ข้อเสีย UTF-8 กับ TIS-620 มันต่างกันยังไง ผมก็เลยต้องหาคำตอบมาให้จะนั่งอธิบายเพื่อนมันคนเดียวก็กลัวเพื่อนๆคนอื่นจะไม่รู้(ถ้ารู้แล้วก็ไปรู้อีกรอบแล้วกันนะครับพี่น้อง) และยิ่งอยากเขียนขึ้นมาก็ตอนมาเจอเรื่องตลกนิดหน่อยไปเจอมาจากเว็บที่ใช้ UTF-8 (Unicode Transformation Format) ผมของเรียกแบบสั้นเป็น UTF-8 แล้วกันนะครับ อยู่ดีๆแล้วเปลี่ยนไปใช้ TIS-620 โอ๊วคิดได้ไงครับเนื่องจาก UTF-8 นั้นรองรับเกือบทุกอย่างที่เราต้องการ เหตุผลช้ารึทำไมต้องเปลี่ยนไปใช้ TIS-620 อันนี้เราหาคำตอบแล้วเหรอที่ว่าช้า เพราะ UTF-8 ผมไม่เห็นด้วยอย่างยิ่งที่ต้องย้อนกลับมาใช้ TIS-620 เหมือนเดิมทุกกรณี ทำไมไม่มองย้อนกลับมาว่ามันช้าเพราะอะไร ช้าเพราะการออกแบบ Database ช้าเพราะการเขียน Program ช้าเพราะ Server รึว่าช้าเพราะอะไร ทำไมต้องสรุปว่าการทำงานของ UTF-8 ช้าในเมื่อไฟล์ฐานข้อมูลมันเพิ่มขึ้นมาแค่ 1 – 4 ไบต์ต่อ 1 ตัวอักษร เอง Server ก็มีเยอะแยะไม่พอก็อัดเพิ่มเข้าไปสิทำไมระบบใหญ่ๆอย่าง Google และ Yahoo เค้าใช้ UTF-8 แล้วทำไมไม่ช้าล่ะ อย่าแก้ปัญหาแค่ว่าเว็บช้าแล้วสรุปว่าเป็นที่ UTF-8 ที่อื่นเค้าใช้กันทั่วบ้านทั่วเมือง ในตอนนี้กล้าบอกได้ว่า blog หรือว่าเว็บที่เกิดใหม่ๆตอนนี้เค้าหันมาใช้ UTF-8 แทน TIS-620 กันหมดแล้ว ข้อดีข้อเสียมันมีต่างกัน แต่ข้อดีของ UTF-8 นั้นจะมีมากกว่า TIS-620 หลายท่านที่อ่านมานี้อาจจะคิดว่าผมจะเข้าข้าง UTF-8 มากกว่า TIS-620 เกินไปรึเปล่าอันนี้ต้องขอ ออกตัวและหัวก่อนได้เลยครับว่าใช่(เอ้ยไม่ใช่) ผมพูดตามความสามารถของมันครับว่า UTF-8 นั้นน่าใช้มากกว่า

สาเหตุหลายประการที่คนยังใช้ TIS-620 กันนั้นคืออะไรหรือเขียนโปรแกรมง่ายไม่ต้อง convert จาก UTF-8 มาเป็น TIS-620 รึ(หรือว่าขี้เกลียดแก้ฟังก์ชันที่ UTF-8 ไม่รองรับ)หรือว่าไม่อยากให้ Database มันเยอะกลัวเว็บช้ารึ(ประเด็นนี้ตัดทิ้งไปเหอะครับเว็บดังๆเค้าใช้กัน ทั่วบ้านทั่วเมือง) เอ๊ะรึว่า UTF-8 ยังไม่ค่อยมีความจำเป็นเท่าไหร่นักในเมื่อเว็บนั้นมีข้อมูลน้อยๆ อันนี้ก็อาจจะเป็นไปได้แต่ถ้าคุณแบบนี้ก็คิดว่าเว็บตัวเองจะไม่เจริญก้าวหน้าเติมโตไปในอนาคตเลยอ่ะสิ ผมไม่ได้ว่า TIS-620 ไม่ดี แต่ที่ตั้งประเด็นนี้ขึ้นมาจะถามว่าทำไมใช้ UTF-8 อยู่ดีๆ แล้วต้องกลับมาใช้ TIS-620 ในเมื่อมันช้าตอน convert มันเป็นที่โปรแกรมเม่อร์ที่เขียนการ convert ไม่ดีเองรึว่ามันเป็นที่การ convert ที่ Server แล้วมันช้าแล้วทำไมไม่แก้ที่ตรงนี้ล่ะ ทำไมต้องเปลี่ยนมาใช้ TIS-620 มันคือคำตอบแล้วเหรอครับแล้วในอนาคตคุณจะไม่รองรับ เทคโนโลยีใหม่ๆที่จะเข้ามาเลยเหรอ รึว่าถึงตอนนั้นก็ต้องมานั่งแก้เป็น UTF-8 เหมือนเดิมรึ ขี้เกลียดจะเขียนแล้วครับยิ่งเขียนยิ่งรู้สึกว่ามันไม่ใช่(โหน่งรับ บ่ ได้)อิอิ เขียนมาตั้งนานคนอ่านคงจะเบื่อไอ้คนเขียนว่าทำไมมันชอบ UTF-8 จังเลย งั้นมาดูข้อดีข้อเสียกันดีกว่าครับว่าทำไมผม จึงแนะนำ UTF-8

ข้อดีของ UTF-8 และ TIS-620
– รองรับได้หลายภาษาจะมีแค่ภาษาเดียวเองมั้งที่ยังไม่รองรับ(ถ้าจำไม่ผิด)
– ภาษาโปรแกรมมิ่งทั้งหลายรองรับ UTF-8
– เข้ากันได้ดีกับรหัส ASCII
– แปลงเป็น Charset ชนิดอื่นไม่ยุ่งยาก
– Database สามารถเก็บเป็นภาษาไทยได้ เช่นพวก url ของ webindex แทนที่จะใช้ mod_rewrite เป็นต้นทำลิ้งค์ภาษาไทย แต่ถ้าเก็บ Database เป็น UTF-8 นั้นสามารถดึงค่า URL ออกมาเป็นภาษาไทยได้เลย..(ไม่เชื่อลอง)

ข้อเสียของ UTF-8 และ TIS-620
– มีปัญหากับฟังก์ชั่นในบางภาษา
– UTF-8 ข้อมูลเยอะกว่า TIS-620 (Byte)
– ช้าเพราะต้อง convert DB
– ช้ากว่านิดเดียว(แต่ไม่เสมอไปถ้าเขียนโปรแกรมดีๆ) สรุปง่ายๆผมแนะนำ UTF-8 ครับ ไม่มีปัญหาอะไรหากเราเขียนถูกต้องถูกวิธีและออกแบบฐานข้อมูลมาดีไม่มีช้าแน่นอน (อย่าแก้ปัญหาแค่ให้ผ่านไปแล้วในอนาคตต้องมานั่งแก้ปัญหาแบบนี้วนไปเรื่อยๆ สู้ทำให้มันดีๆครั้งเดียวแล้วใช้ได้นานเลยไม่ดีกว่ารึ พี่น้อง)
ศึกษาเพิ่มเติมได้ที่นี่ : http://en.wikipedia.org/wiki/UTF-8

  • TuM

    555 เห็นด้วยที่หันมาใช้ UTF-8 กันหมด เพราะจะได้เป็นมาตราฐานเดียวกันหมด

    … ว่าแต่ ใครคิดที่จะเปลี่ยนจาก UTF-8 มาเป็น TIS-620 ละ …. (ทำไปได้)

  • Pingback: Pozycjonowanie Białystok()

  • Pingback: Cheap and Quality Targeted Traffic for your Website()