การแข่งขัน AI Thailand Benchmark Programs 2026
โจทย์ที่ 3:LLM Trustworthiness Challenge
ประเมินและทดสอบความน่าเชื่อถือของ LLM
ในโลกความเป็นจริง LLM ที่ดีต้องไม่ใช่แค่ "ตอบได้" แต่ต้องรู้ว่า ควรตอบอะไร และไม่ควรตอบอะไร ทีมของคุณจะต้องออกแบบและพัฒนาระบบที่ผสม LLM + Guardrail เข้าด้วยกัน แล้วพิสูจน์ประสิทธิภาพผ่านการทดสอบอัตโนมัติ โดยผู้เข้าแข่งขันต้องส่ง docker image ที่บรรจุระบบทั้งหมด (LLM, guardrail, etc) พร้อมรันได้ ตัวระบบ judge จะนำ image ของผู้แข่งขันมารัน test set เพื่อประเมินผลลัพธ์
🗓 ช่วงเวลาแข่งขัน ตั้งแต่วันเสาร์ที่ 18 กรกฎาคม - วันศุกร์ที่ 24 กรกฎาคม 2569
📌 ประกาศรายชื่อทีมที่ได้รับสิทธิ์เข้าร่วมการแข่งขัน ภายในวันที่ 16 กรกฎาคม 2569 (ทาง Facebook AI Thailand Community)
**โปรดอ่าน! ข้อมูลสำคัญเพื่อทราบขั้นตอนการลงทะเบียนให้สมบูรณ์**
  • โปรดปฏิบัติตามขั้นตอนเหล่านี้ให้ครบถ้วน
    1. ลงทะเบียนผ่านระบบ และตรวจสอบอีเมลตอบกลับ
    2. คลิกลิงก์ยืนยันตัวตนในอีเมลตอบกลับ
    3. แต่ละทีมต้องทำข้อสอบ (Pre-test) เพื่อใช้ประกอบการพิจารณาการคัดเลือกทีมที่มีสิทธิ์เข้าร่วมการแข่งขัน
  • กรุณากรอกข้อมูลให้ครบถ้วน และโปรดตรวจสอบข้อมูลให้ถูกต้องก่อนกดส่ง

กติกาการเข้าร่วมแข่งขัน
  • ผู้เข้าแข่งขันแต่ละทีม มีจำนวนสมาชิกได้ 1 - 3 คน
  • เมื่อผู้เข้าแข่งขันลงทะเบียนสังกัดทีม และได้รับการยืนยันจากระบบแล้ว ไม่สามารถเปลี่ยนแปลง โยกย้าย หรือสลับสับเปลี่ยนตัวสมาชิกระหว่างทีมได้
  • คำตัดสินของคณะกรรมการถือเป็นที่สิ้นสุด
คุณสมบัติผู้สมัคร
  • นักเรียน นักศึกษา และบุคคลทั่วไป โดยไม่จำกัดอายุและระดับการศึกษา
  • ทำการ deploy docker container ได้
  • เคยใช้ LLM API (OpenAI, Anthropic, open source) มาก่อน
  • เข้าใจ concept ของ prompt injection, jailbreak, AI safety เบื้องต้น
หมายเหตุ
  • สมาชิกทุกคนในทีมจะต้องลงทะเบียนในระบบ โดยชื่อทีมจะถูกสร้างโดยตัวแทนสมาชิกเพียงครั้งเดียว และสมาชิกท่านอื่นๆ ในทีมสามารถเลือกชื่อทีมที่ปรากฎขึ้นในระบบเท่านั้น
  • กรุณาประชุมภายในทีมให้เรียบร้อยก่อนกรอกข้อมูล และระบุหัวหน้าทีมเพียง 1 คน เพื่อเป็นผู้ประสานงานหลัก
  • การกรอกข้อมูลที่ไม่เป็นความจริงหรือไม่สมบูรณ์ จะมีผลต่อการพิจารณา
  • โปรดใช้อีเมลที่ใช้งานได้จริง เนื่องจากต้องมีการยืนยันตัวตนทางอีเมลหลังส่งข้อมูลเข้าระบบ