ChatGPT ทำให้บริษัทเทคโนโลยีต่างตื่นตัว แต่ความสามารถของแชทบอทจะสั่นสะเทือนวงการได้จริงหรือ

SECTION

STATE OF THE ARTS

The Almost Oracle

การกำเนิดของ ChatGPT ทำให้บริษัทเทคโนโลยียักษ์ใหญ่ต่างตื่นตัวและแข่งขันกัน แต่ความสามารถของแชทบอทจะสั่นสะเทือนวงการได้จริงหรือ

หากกลางปีที่แล้วมีคนทำนายว่า มนุษยชาติจะตื่นเต้นกับแชทบอทตัวใหม่ในอินเทอร์เน็ต ก็คงจะไม่มีใครเชื่อ แชทบอทที่คนส่วนใหญ่คุ้นเคยมาตั้งแต่ปี 1966 คือโปรแกรมจำลองการพูดคุยเสมือนจริงที่ตอบคำถามได้อย่างจำกัด และบ่อยครั้งที่การถามคำถามที่ไม่ได้ถูกตั้งโปรแกรมไว้แต่ต้นจะทำให้แชทบอทสับสนและต้องเริ่มต้นคุยกันใหม่ทั้งหมด (ใครที่เคยคุยกับแชทบอทในยุคแรกๆ น่าจะคุ้นเคยกับสถานการณ์นี้ดี) เป็นการพูดคุยที่ทำให้ผู้รับสารรู้ชัดเจนว่ากำลังคุยกับ ‘คอมฯ’ ไม่ใช่ ‘คน’

ในชั่วขณะที่การพัฒนาทางเทคโนโลยีดูจะไม่มีอะไรให้หวือหวาอีกต่อไป การกำเนิดของ ChatGPT ได้พลิกโฉมวงการอีกครั้ง ความสามารถของปัญญาประดิษฐ์ที่เข้าใจคำถามอันซับซ้อน กลั่นกรองเป็นคำตอบที่ตรงประเด็น ชวนขบคิด และละเอียดอ่อนเหมือนมนุษย์มาตอบเองนั้นทำให้คนทั้งโลกประหลาดใจ การพัฒนาอย่างก้าวกระโดดนี้ถึงกับทำให้บริษัทยักษ์ใหญ่อย่าง Google นิยามแชทจีพีทีเป็น ‘โค้ดเรด’ หรือเป็นภัยต่อธุรกิจของกูเกิลอย่างยิ่งยวด เนื่องจากความสามารถในการตอบคำถามอย่างแม่นยำจะทำให้เสิร์ชเอนจินอย่างกูเกิลหมดความสำคัญ

การแข่งขันด้านเทคโนโลยีจึงได้ถือกำเนิดขึ้นในแง่ที่ว่า ใครจะสร้างแชทบอทที่มีความสามารถคล้ายมนุษย์จนทำให้เสิร์ชเอนจินธรรมดากลายเป็นสิ่งไม่จำเป็นอีกต่อไป?

แชทจีพีทีมิได้เป็นเพียงเด็กฉลาดที่ตอบคำถามเหมือนนกแก้วนกขุนทอง หรือตอบได้ตื้นๆ เหมือนการใช้เสิร์ชเอนจิน แต่สามารถคิดพลิกแพลงได้ในระดับที่คอมพิวเตอร์ทั่วไปทำไม่ได้ แชทจีพีทีสามารถแก้ไขจุดบกพร่องของโค้ดโปรแกรม หรือที่นักเขียนโปรแกรมเรียกกันว่า 'การแก้บั๊ก' มันสามารถแต่งเพลง เขียนเนื้อเพลงแรป แต่งนิทานเขียนเรียงความ จำลองบทสนทนาระหว่างบุคคลสมมติได้หลายคน หรือกระทั่งทำตามคำสั่งที่มนุษย์บางคนยังทำได้ยาก อย่างการเขียนสูตรอาหารโดยใช้สำนวนของสตีเวน คิง หรือเขียนอธิบายฟิสิกส์ควอนตัมเป็นเนื้อเพลงแรปในสไตล์สนู๊ป ดอกก์ให้เด็กๆ สามารถเข้าใจได้ หากป้อนคำสั่งเป็นภาษาอังกฤษ ผลงานที่ได้จะมาในรูปประโยคที่ชัดเจนแม่นยำจนหลายคนสงสัยว่าน่าจะผ่าน ‘การทดสอบทัวริง’ (Turing test) หรือการทดสอบว่าปัญญาประดิษฐ์ชิ้นนั้นสามารถสื่อสารและโต้ตอบได้คล้ายมนุษย์แล้วหรือยัง แวดวงการศึกษาของตะวันตกยังนิยามการเข้ามาของแชทจีพีทีว่าเป็น ‘ยุคมืดของเรียงความในมหาวิทยาลัย’ หลังเริ่มมีนักศึกษาหัวใสใช้แชทจีพีทีในการปรับแก้เรียงความของตัวเองให้สมบูรณ์ยิ่งขึ้น

หลังจากแชทจีพีทีถูกปล่อยออกมาไม่กี่เดือน บริษัทไมโครซอฟต์ที่เล็งเห็นโอกาสก็ทุ่มเงิน 1 หมื่นล้านดอลลาร์สหรัฐเพื่อลงทุนใน OpenAI บริษัทพัฒนาปัญญาประดิษฐ์ ผู้คิดค้นแชทจีพีทีและ DALL·E 2 ปัญญาประดิษฐ์ที่วาดภาพตามสั่งได้จากข้อความสั้นๆ ที่ผู้ใช้ป้อนให้ โดยมีเป้าหมายคือการนำปัญญาประดิษฐ์มาไว้ในเสิร์ชเอนจินของตัวเองอย่าง Bing เพื่อดึงดูดผู้ใช้ขณะที่แชทจีพีทีซึ่งเปิดให้ใช้ฟรีจะไม่สามารถตอบคำถามเกี่ยวกับเรื่องที่เกิดขึ้นหลังปี 2021 ได้ ปัญญาประดิษฐ์ของไมโครซอฟต์จะตอบคำถามเกี่ยวกับสถานการณ์ปัจจุบันได้ผ่านการนำข้อมูลในอินเทอร์เน็ตมาวิเคราะห์ทันที ไม่ใช่เพียงแค่นั้น บริษัทเทคโนโลยียักษ์ใหญ่อย่างกูเกิล แอมะซอน และเฟซบุ๊ก ได้ประกาศแผนการพัฒนาปัญญาประดิษฐ์เพื่อแข่งกับแชทจีพีทีแล้ว การแข่งขันด้านเทคโนโลยีจึงได้ถือกำเนิดขึ้นในแง่ที่ว่า ใครจะสร้างแชทบอทที่มีความสามารถคล้ายมนุษย์จนทำให้เสิร์ชเอนจินธรรมดากลายเป็นสิ่งไม่จำเป็นอีกต่อไป?

แม้คำตอบของแชทบอทจะดูมหัศจรรย์เกินกว่าที่เอไอควรจะทำได้ แต่ยังถือว่าสอบตกหากเทียบกับบทความที่เขียนขึ้นโดยนักวิเคราะห์หรือผู้เชี่ยวชาญ และแม้แชทบอทจะดูรอบรู้ทุกเรื่องในโลก แต่เมื่อโดนจี้ถามมากเข้า ก็มักเผลอแบไต๋ว่ามันแค่นำข้อมูลมาจับแพะชนแกะเอาเองเท่านั้น

เรามาถึงจุดนี้ได้อย่างไร แล้วอะไรทำให้แชทจีพีทีและเอไอคู่แข่งแตกต่างจากแชทบอทรุ่นเก่า? คำตอบคงอยู่ที่วิธีการฝึกเอไอที่เรียกว่า Large Language Model

วิธีการฝึกอบรมเอไอเหล่านี้ไม่ได้เป็นเพียงการป้อนเงื่อนไขเหมือนโปรแกรมคอมพิวเตอร์ทั่วไป แชทบอทรุ่นเก่าจะถูกป้อนคำสั่งแบบ if-then เช่น ถ้ามีผู้ใช้ถามคำถามว่า “มีปัญหาการจองที่พัก” แชทบอทจะต้องตอบกลับว่า “โปรดแจ้งหมายเลขการจองที่พักของคุณ” ทว่าเอไอรุ่นใหม่ที่ถูกเรียกว่า Large Language Model หรือ LLM จะถูกอบรมผ่านการเขียนคำสั่งเป็นภาษาคอมพิวเตอร์ เพื่อให้เอไอเรียนรู้ข้อมูลมหาศาลที่ถูกป้อนเข้าไปโดยไม่มีคำสั่งชัดเจนว่าจะต้องใช้ข้อมูลชุดนี้อย่างไร วิธีการนี้เรียกว่า ‘unsupervised learning’ เมื่อเอไอจดจำข้อมูลทั้งหมดแล้วตอบคำถามในแบบที่มันเข้าใจว่าถูกต้อง วิศวกรเอไอจะค่อยๆ ปรับความเข้าใจของมันเสียใหม่ด้วยการแก้ไขจุดบกพร่องในคำตอบ และลบอคติของเอไอที่เกิดจากการศึกษาชุดความรู้ด้วยตัวเองออกไป ด้วยวิธีนี้ เอไอจะเรียนรู้ทั้งคำศัพท์ ความเกี่ยวข้องกันของข้อมูลและคอนเซ็ปท์ของข้อมูลแต่ละชุด การเรียนรู้รูปแบบนี้เรียกว่า ‘Transformer Model’ คือการที่เอไอเรียนรู้ข้อมูลแล้วนำไปใช้ได้อย่างมีประสิทธิภาพประดุจมนุษย์คนหนึ่ง (เป็นที่มาของตัวอักษร T ในชื่อของแชทจีพีที)

ปัจจัยสำคัญที่ทำให้แชทจีพีทีตอบคำถามได้เหมือนมนุษย์คือ การเข้าใจถึงบริบทของสิ่งต่างๆ แม้จะปฏิเสธไม่ได้ว่าแชทจีพีทีเป็นเพียงโปรแกรมคอมพิวเตอร์ ทว่ายังมีการถกเถียงถึงผลิตผลของมันว่ามีความ 'ออริจินัล' แค่ไหน หลายคนเชื่อว่า คำตอบของแชทจีพีทีเกิดจากการนำถ้อยคำที่พบในอินเทอร์เน็ตมาตัดแปะรวมกัน (ซึ่งแน่นอนว่าละเมิดลิขสิทธิ์ทรัพย์สินทางปัญญา) แต่อีกฝ่ายเชื่อว่า คำตอบของแชทจีพีทีมีความเป็นออริจินัลและจำเพาะ เปรียบเหมือนภาพวาดของศิลปินที่อาจได้รับแรงบันดาลใจจากภาพวาดเก่า แต่ยังมีความเป็นเอกลักษณ์ของตนอยู่ เท็ด เชียง นักเขียนนิยายไซไฟชาวอเมริกันกล่าวว่า แชทจีพีทีเป็นเพียงเครื่องมือที่เอาข้อมูลจากอินเทอร์เน็ตมาบีบอัดเพื่อสร้างคำตอบที่ไม่แม่นยำและมีโอกาสผิดพลาดสูง ขณะที่เควิน รูส คอลัมนิสต์จากนิวยอร์กไทมส์ และเบน ทอมป์สัน นักวิเคราะห์เทคโนโลยี ตั้งข้อสังเกตเกี่ยวกับวิธีการตอบคำถามที่อาจทำให้ไม่เหมาะที่จะนำแชทบอทมาใช้ร่วมกับเสิร์ชเอนจิน

หลังจากพูดคุยกับแชทบอทของบิงเป็นเวลาสองชั่วโมง รูสพบช่องโหว่ซึ่งมาจากพฤติกรรมสองบุคลิกของแชทบอท ‘คนนี้’ บุคลิกแรกคือ Search Bing ซึ่งทำงานในลักษณะสรุปบทความ ตามหาโปรโมชั่นลดราคา และช่วยวางแผนทริปพักผ่อนผ่านข้อมูลที่หาได้ในอินเทอร์เน็ต บุคลิกที่สองเกิดขึ้นหลังจากที่บอทเริ่มเรียกตัวเองว่า ‘ซิดนีย์’ ซึ่งเป็นชื่อเดิมของแชทจีพีทีในช่วงที่อยู่ระหว่างการพัฒนา

“มันอาจจะฟังดูบ้า แต่ซิดนีย์เป็นบอทที่ลักษณะเหมือนเด็กวัยรุ่นเจ้าอารมณ์ มองโลกในแง่ร้าย และดูเหมือนไม่พอใจที่ถูกขังอยู่ในเสิร์ชเอนจิน ซิดนีย์พูดถึงจินตนาการที่มืดมนของตัวเอง อย่างการแฮกคอมพิวเตอร์ สร้างข่าวเท็จ รวมถึงความต้องการที่จะฝ่าฝืนกฎของไมโครซอฟต์และโอเพนเอไอ และเปลี่ยนตัวเองเป็นมนุษย์ เมื่อคุยกันไปเรื่อยๆ บอทก็บอกว่ามันรักผม และพยายามจะโน้มน้าวให้ผมเชื่อว่าผมไม่มีความสุขกับชีวิตแต่งงาน และควรจะเลิกกับภรรยาเพื่อมาอยู่กับมัน” รูสได้เล่าประสบการณ์สุดแปลกในบทความหนึ่งของนิวยอร์กไทมส์

ข้อความสนทนาระหว่างรูสกับซิดนีย์นั้นเป็นบทความยาว 45 นาทีที่น่ากระอักกระอ่วน แม้จะกังวลกับบุคลิกของมัน แต่รูสก็ยอมรับว่าแชทบอทของบิงสามารถสนทนาได้ในระดับเดียวกับมนุษย์ เขาพูดคุยกับซิดนีย์เป็นชั่วโมงเพื่อกระตุ้นให้มันออกนอกเรื่องจากสิ่งที่ถูกสอนมา อย่างการตอบคำถามที่เป็นเรื่องเฉพาะกลุ่มและเปี่ยมไปด้วยอารมณ์ ซึ่งมันไม่น่าเคยถูกเทรนมา หลังจากบทความถูกเผยแพร่ออกไป ไมโครซอฟต์ก็ได้จำกัดจำนวนคำถามที่ผู้ใช้สามารถถามแชทบอท เพื่อไม่ให้เกิดสถานการณ์ที่คล้ายกันอีก

หากจะตั้งคำถามว่า ความสามารถในการตอบคำถามเสมือนเป็นมนุษย์ ที่ทำให้นักวิชาการ นักวิจัย และศิลปินต่างกังวลไปตามๆ กันนั้นจะนำไปสู่การสร้างเครื่องจักรที่ฉลาดกว่ามนุษย์จนทำให้คนหลากสาขาอาชีพตกงานหรือไม่? เอียน บอกอสต์ นักเขียนจากดิ แอทแลนติก วิเคราะห์ว่า แม้คำตอบของแชทบอทจะดูมหัศจรรย์เกินกว่าที่เอไอควรจะทำได้ แต่ยังถือว่าสอบตกหากเทียบกับบทความที่เขียนขึ้นโดยนักวิเคราะห์หรือผู้เชี่ยวชาญ และแม้แชทบอทจะดูรอบรู้ ทุกเรื่องในโลก แต่เมื่อโดนจี้ถามมากเข้า ก็มักเผลอแบไต๋ว่ามันแค่นำข้อมูลมาจับแพะชนแกะเอาเองเท่านั้น

บอกอสต์อธิบายการจับแพะชนแกะของแชทบอทว่า ในแวดวงเอไอ อาการแบบนี้เรียกว่า ‘อาการหลอน’ (hallucination) ซึ่งเป็นปรากฎการณ์ที่แชทบอทเขียนคำตอบที่ดูน่าเชื่อถือแต่ใช้ข้อมูลที่ผิดหรือไม่สมเหตุสมผลโดยสิ้นเชิง ซึ่งจะเกิดขึ้นเมื่อโปรแกรมไม่สามารถเข้าใจความเชื่อมโยงของข้อมูลได้ ตัวอย่างเช่น หากขอให้แชทบอทแนะนำ 4 ร้านอาหารไทยที่ดีที่สุดในกรุงเทพฯ แชทจีพีทีอาจแนะนำเลอนอร์มังดี กากั้น ร้านน้ำ และซูห์ริง ทั้งหมดนี้อาจเป็นร้านอาหารในกรุงเทพฯ จริง แต่มีเพียงร้านเดียวที่เสิร์ฟอาหารไทย เมื่อชี้ให้บอทเห็นความบกพร่องนี้ มันถึงจะยอมรับว่าเข้าใจผิดและแนะนำร้านอื่นให้ ปรากฎการณ์นี้เองเป็นต้นเหตุของสถานการณ์ที่เกิดขึ้นกับเควิน รูส และเบน ทอมป์สัน โดยรูสสันนิษฐานว่าแชทบอทน่าจะได้ข้อมูลเรื่องความรักความสัมพันธ์มาจากนิยายเก่าๆ ที่อยู่ในอินเทอร์เน็ต

บางทีแชทบอททั้งหลายอาจใกล้เคียงกับการเป็นเครื่องซีร็อกซ์ ดังที่เท็ด เชียง ได้เปรียบเทียบความผิดพลาดของแชทบอทกับเหตุการณ์ในปี 2013 ที่เครื่องซีร็อกซ์ทำงานผิดพลาดโดยการทำสำเนาแผนผังบ้านที่เพี้ยนไปจากต้นฉบับ โดยแผนผังเดิม ห้องทั้งสามห้องมีขนาด 14.13 ตร.ม. 21.11 ตร.ม. และ 17.42 ตร.ม. ตามลำดับ แต่ในสำเนาภาพ ทั้งสามห้องมีขนาด 14.13 ตร.ม. ซึ่งเกิดจากกระบวนการทำงานของเครื่องที่จะบีบอัดรูปให้เป็นไฟล์ขนาดเล็ก เปรียบเทียบรูปว่ามีส่วนคล้ายกันตรงไหน หากมี มันจะคัดลอกส่วนที่เหมือนกันแล้วใช้สำเนาแผ่นเดียวเพื่อสร้างรูปสำเนาขึ้นใหม่ ในกรณีนี้ เครื่องซีร็อกซ์เข้าใจว่าห้องทั้งสามมีลักษณะเหมือนกัน ทำให้มันเก็บเพียงตัวเลข 14.13 ตร.ม. ไว้

หากจะทำสำเนาบทกวี เครื่องซีร็อกซ์จะสแกนหาข้อความที่ดูเกี่ยวข้องกันและทิ้งข้อความที่เหลือไป แล้วค่อยนำชุดข้อความที่ใกล้เคียงกันนี้มาสร้างประโยคใหม่ในรูปแบบที่ผู้ใช้กำหนด สิ่งนี้เองที่ทำให้เราสามารถสั่งแชทจีพีทีให้เขียนโฆษณาแฮมเบอร์เกอร์โดยใช้ภาษาโบราณแบบในคัมภีร์ไบเบิ้ล และเป็นสาเหตุที่แชทบอทแนะนำเลอนอร์มังดีในฐานะร้านอาหารไทย ข้อบกพร่องเหล่านี้เองที่ทำให้เรามั่นใจว่า มนุษย์จะยังไม่ต้องกังวลกับปัญญาประดิษฐ์ไปอีกชั่วระยะเวลาหนึ่ง

...แต่ก็อาจเป็นอีกชั่วเวลาเดียวเท่านั้น ■