
ปัจจุบันหากเรามองไปรอบ ๆ ตัวของเรา เราจะเห็นว่า AI หรือปัญญาประดิษฐ์ตอนนี้นั้นได้เข้ามาเป็นสิ่งที่อยู่รอบตัวของเรามากขึ้น AI เข้ามาแฝงในชีวิตประจำวัน เข้ามาเป็นเพื่อนของเรา โดยที่เรานั้นต่างใช้เทคโนโลยีกันอย่างมากขึ้นและบ่อยขึ้นทุกวัน โดยหนึ่ง AI ที่เป็นกระแสตอนนี้มากที่สุดก็คือ “ChatGPT” ปัญญาประดิษฐ์สุดล้ำ ที่ช่วยตอบโต้บทสนทนาอย่างเป็นธรรมชาติ ช่วยเขียนโค้ด เขียนบทความ ช่วยคิดหัวข้อ เป็นต้น
แล้ว “ChatGPT” ที่เรากล่าวมาข้างต้นนี้มันมีจุดเริ่มต้นหรือความเป็นมาอย่างไรกันแน่ เอาเป็นว่าเราลองมาทำความรู้จักปัญญาประดิษฐ์ตัวนี้ให้มากขึ้นกันดีกว่า
จุดกำเนิดกว่าจะมาเป็น “ChatGPT”
“ChatGPT” ได้รับการพัฒนาโดย “OpenAI” ในซานฟรานซิสโก ซึ่งเป็นบริษัทวิจัยที่นำโดย Sam Altman และได้รับการสนับสนุนมาจาก Microsoft
หากพูดให้เข้าใจง่าย ๆ ก็คือ “ChatGPT” เป็นรูปแบบหนึ่งของซอฟต์แวร์สร้างภาษา GPT-3.5 ยอดนิยมของ “OpenAI” ซึ่งทำการออกแบบมาเพื่อดำเนินการให้เกิดการสนทนากับผู้คน อีกทั้งฟีเจอร์บางอย่างของมัน รวมถึงการตอบคำถามที่ตามมา การท้าทายสถานที่ที่ไม่ถูกต้อง การปฏิเสธคำถามที่ไม่เหมาะสม และแม้กระทั่งการยอมรับข้อผิดพลาด มันก็สามารถทำได้
ก่อน “ChatGPT” จะถูกปล่อยออกมานั้น ระบบบอตได้ถูกนำไปฝึกด้วยข้อมูลในรูปแบบ ‘ข้อความ’ จำนวนมหาศาล (ย้ำว่ามหาศาลจริง ๆ) ระบบได้ถูกฝึกการเรียบรียง ตอบคำถามจนสามารถตรวจจับรูปแบบการเขียน เพื่อพัฒนาออกมาในรูปแบบของตัวเองอย่างไรก็ตาม ทาง “OpenAI” ไม่ได้เปิดเผยข้อมูลว่าใช้ข้อมูลใดบ้าง หากแต่บอกเพียงแค่ว่าใช้ข้อมูลจากหนังสือที่เก็บมา รวบรวมข้อมูลจากเว็บ และ Wikipedia

ซึ่งในปี 2015 “OpenAI” เกิดขึ้นเพื่อใช้ระบบปัญญาประดิษฐ์ให้เป็นประโยชน์กับมนุษย์ในรูปแบบที่ง่ายต่อการใช้งานมากที่สุด โดยมีแซม อัลท์แมน เป็นประธานเจ้าหน้าที่บริหาร “OpenAI” และเป็นอดีตประธานกรรมการของ VC ชื่อดังของ Y Combinator นอกจากนี้ยังมีผู้ร่วมก่อตั้งอื่น ๆ เช่น อีลอน มัสก์ จาก Tesla และ SpaceX (ก่อนที่จะลาออกจากการเป็นกรรมการในปี 2018 แต่ยังคงสนับสนุน “OpenAI” อยู่) และผู้สนับสนุนอื่น ๆ รวมถึง รีด ฮอฟฟ์แมน ผู้ร่วมก่อตั้ง LinkedIn และ ปีเตอร์ ธีล ผู้ร่วมก่อตั้ง Paypal และอีกหลายคน รวมทั้งการระดมทุนเริ่มต้นสูงถึง 1 พันล้านดอลลาร์หรือประมาณ 3.5 หมื่นล้านบาท และมีผู้สนับสนุนเพิ่มเติมในภายหลัง เช่น รีด ฮอฟฟ์แมน ผู้ร่วมก่อตั้ง LinkedIn และอีกหลายคน
จากเว็บไซต์ของ “OpenAI” ได้กล่าวถึงวิธีการเรียนรู้ของแชทบอตนี้ โดยใช้ Reinforcement Learning from Human Feedback (RLHF) ซึ่งหมายถึงการฝึกอบรมผ่านการส่งต่อความรู้จากมนุษย์ ทุกครั้งที่มีคำถามถูกส่งมา ระบบจะได้รับการฝึกฝนเกี่ยวกับการสนทนา และมีการปรับปรุงคุณภาพอยู่เรื่อย ๆ นอกจากนี้ยังมีการสร้างโมเดลผ่านข้อความโดยใช้วิธี Proximal Policy Optimization (PPO) ซึ่งช่วยให้สามารถเพิ่มความรู้ได้ด้วยตัวมันเอง
อย่างไรก็ดี “ChatGPT” เองก็ยังไม่ได้สมบูรณ์แบบร้อยเปอร์เซ็นต์ซะทีเดียว เพราะยังพบความผิดพลาดของข้อมูลและยังต้องพัฒนาอยู่เรื่อย ๆ สอดคล้องกับ StackOverflow เว็บไซต์ของกลุ่มนักพัฒนาซอฟต์แวร์ (software developers) ได้ประกาศแบนคำตอบของ “ChatGPT” โดยให้เหตุผลว่า ‘เพราะอัตราการได้คำตอบที่ถูกต้องจาก “ChatGPT” ยังต่ำเกินไป’ ซึ่งอาจทำให้เกิดความสับสนได้
เราเองหากเป็นหนึ่งในฐานะผู้ใช้งาน “ChatGPT” ด้วยล่ะก็ ก็ควรมีการหาข้อมูลหรือแหล่งที่มาอื่น ๆ เพิ่มเติมด้วยเพื่อช่วยเสริมให้ข้อมูลที่ได้มานั้นมีความสมบูรณ์มากยิ่งขึ้นนั่นเองครับ