ธุรกิจ

เหนือกว่ากระแส: การประยุกต์ใช้จริงของโมเดลภาษาขนาดใหญ่: คำสัญญาและความเป็นจริง

การใช้ LLM ในการคำนวณค่าเฉลี่ยก็เหมือนกับการใช้บาซูก้ายิงแมลงวัน การวิเคราะห์เชิงวิพากษ์กรณีการใช้งานจริง: Instacart, Google, Uber, DoorDash ความจริง? กรณีศึกษาที่น่าสนใจที่สุดยังคงใช้แนวทาง "มนุษย์ร่วมวง" นั่นคือ AI เข้ามาช่วย ไม่ใช่เข้ามาแทนที่ แอปพลิเคชันที่ดีที่สุดคือแอปพลิเคชันที่ปรับแต่งให้เหมาะกับโดเมนเฉพาะ ไม่ใช่โดเมนทั่วไป บริษัทที่ประสบความสำเร็จไม่ใช่บริษัทที่นำ LLM มาใช้อย่างกว้างขวางที่สุด แต่เป็นบริษัทที่นำกลยุทธ์มาใช้อย่างมีกลยุทธ์มากที่สุด

การวิเคราะห์เชิงวิพากษ์ของกรณีการใช้งาน LLM ในโลกแห่งความเป็นจริง: ระหว่างคำสัญญาและความเป็นจริง

ในขณะที่ การถกเถียง เกี่ยวกับคุณค่าที่แท้จริงของโมเดลภาษาขนาดใหญ่ (LLM) ยังคงดำเนินต่อไป จำเป็นอย่างยิ่งที่จะต้องวิเคราะห์กรณีการใช้งานจริงที่บริษัทต่างๆ นำไปปฏิบัติ การวิเคราะห์นี้มีวัตถุประสงค์เพื่อวิเคราะห์การประยุกต์ ใช้ LLM ในภาคส่วนต่างๆ อย่างเป็นรูปธรรม พร้อมประเมินคุณค่า ข้อจำกัด และศักยภาพที่แท้จริงของมันอย่างวิเคราะห์

อีคอมเมิร์ซและการค้าปลีก: การเพิ่มประสิทธิภาพที่ตรงเป้าหมายหรือการออกแบบมากเกินไป?

ในอุตสาหกรรมค้าปลีกและอีคอมเมิร์ซ ปริญญานิติศาสตร์ (LLM) ได้รับการว่าจ้างสำหรับงานที่หลากหลาย:

  • ผู้ช่วยภายในและการปรับปรุงเวิร์กโฟลว์ : Instacart ได้พัฒนาผู้ช่วย AI ชื่อ Ava เพื่อช่วยให้ทีมเขียน ตรวจสอบ และแก้ไขโค้ด ปรับปรุงการสื่อสาร และสร้างเครื่องมือภายใน แม้ว่าผู้ช่วยเหล่านี้จะดูมีแนวโน้มที่ดี แต่ก็ยังมีคำถามว่าผู้ช่วยเหล่านี้มีคุณค่ามากกว่าเครื่องมือการทำงานร่วมกันแบบดั้งเดิมและซับซ้อนน้อยกว่ามากหรือไม่
  • การควบคุม เนื้อหา และ ความปลอดภัย : Whatnot ใช้ LLM เพื่อปรับปรุงการควบคุมเนื้อหาแบบหลายโหมด การป้องกันการทุจริต และการตรวจจับความผิดปกติในการประมูล Zillow ใช้ LLM เพื่อระบุเนื้อหาที่เลือกปฏิบัติในรายการอสังหาริมทรัพย์ กรณีเหล่านี้แสดงถึงการใช้งานเฉพาะที่ LLM สามารถ มอบคุณค่าที่แท้จริงได้ แต่จำเป็นต้องมีระบบการตรวจสอบอย่างละเอียดเพื่อหลีกเลี่ยงผลบวกและผลลบที่ผิดพลาด
  • การสกัดและจำแนกข้อมูล : OLX ได้สร้าง Prosus AI Assistant ขึ้นมาเพื่อระบุบทบาทงานในโฆษณา ขณะที่ Walmart ได้พัฒนาระบบเพื่อสกัดคุณลักษณะของผลิตภัณฑ์จากไฟล์ PDF กรณีศึกษาเหล่านี้แสดงให้เห็นถึงประโยชน์ของหลักสูตร LLM ในการทำงานซ้ำๆ ให้เป็นระบบอัตโนมัติ ซึ่งปกติแล้วจะต้องอาศัยแรงงานคนจำนวนมาก
  • การสร้างเนื้อหาเชิงสร้างสรรค์ : StitchFix ผสานรวมข้อความที่สร้างขึ้นโดยอัลกอริทึมเข้ากับการควบคุมดูแลโดยมนุษย์ เพื่อทำให้การสร้างหัวข้อโฆษณาและคำอธิบายสินค้าเป็นเรื่องง่าย Instacart สร้าง ภาพสินค้าอุปโภคบริโภค แอปพลิเคชันเหล่านี้ก่อให้เกิดคำถามเกี่ยวกับความคิดสร้างสรรค์ของเนื้อหาที่สร้างขึ้น และความเป็นไปได้ที่จะทำให้ภาษาโฆษณามีความเป็นเนื้อเดียวกัน
  • การปรับปรุงการค้นหา : Leboncoin, Mercado Libre และ Faire ใช้ LLM เพื่อปรับปรุงความเกี่ยวข้องในการค้นหา ขณะที่ Amazon ใช้ LLM เพื่อทำความเข้าใจความสัมพันธ์เชิงสามัญสำนึกและให้คำแนะนำผลิตภัณฑ์ที่เกี่ยวข้องมากขึ้น กรณีเหล่านี้แสดงให้เห็นถึงศักยภาพในการเพิ่มมูลค่าของ LLM อย่างมีนัยสำคัญ แต่ความซับซ้อนในการคำนวณและต้นทุนพลังงานที่เกี่ยวข้องอาจไม่เพียงพอที่จะปรับปรุงให้ดีขึ้นกว่าอัลกอริทึมการค้นหาที่มีอยู่

ฟินเทคและการธนาคาร: การนำทางด้านมูลค่าและความเสี่ยงด้านกฎระเบียบ

ในภาคการเงิน LLM จะถูกใช้ด้วยความระมัดระวัง เนื่องจากข้อมูลมีความละเอียดอ่อนและมีข้อกำหนดด้านกฎระเบียบที่เข้มงวด

  • การจำแนกประเภทและการติดแท็กข้อมูล : Grab ใช้ LLM สำหรับการกำกับดูแลข้อมูล การจัดประเภทเอนทิตี การระบุข้อมูลที่ละเอียดอ่อน และการกำหนดแท็กที่เหมาะสม กรณีการใช้งานนี้น่าสนใจเป็นพิเศษเนื่องจากช่วยแก้ไขปัญหาสำคัญสำหรับสถาบันการเงิน แต่จำเป็นต้องมีกลไกการควบคุมที่เข้มงวดเพื่อป้องกันการจำแนกประเภทที่ผิดพลาด
  • การรายงานอาชญากรรมทางการเงิน : SumUp สร้างรายงานที่มีโครงสร้างสำหรับการรายงานการฉ้อโกงทางการเงินและการฟอกเงิน แอปพลิเคชันนี้แม้จะมีแนวโน้มว่าจะช่วยลดภาระงานที่ต้องทำด้วยมือ แต่กลับก่อให้เกิดความกังวลเกี่ยวกับความสามารถของนักกฎหมายนิติศาสตร์ (LLM) ในการจัดการเรื่องที่ละเอียดอ่อนทางกฎหมายได้อย่างเหมาะสมโดยไม่ต้องมีมนุษย์ควบคุมดูแล
  • การสนับสนุนการสอบถามทางการเงิน : Digits แนะนำคำถามที่เกี่ยวข้องกับธุรกรรมทางการเงิน กรณีการใช้งานนี้แสดงให้เห็นว่าหลักสูตร LLM สามารถสนับสนุนผู้เชี่ยวชาญได้โดยไม่ต้องเปลี่ยนบุคลากร ซึ่งเป็นแนวทางที่อาจยั่งยืนกว่าการทำงานอัตโนมัติ ทั้งหมด

เทคโนโลยี: ระบบอัตโนมัติและความช่วยเหลือทางเทคนิค

ในอุตสาหกรรมเทคโนโลยี LLM ถูกใช้กันอย่างแพร่หลายเพื่อปรับปรุงเวิร์กโฟลว์ภายในและประสบการณ์ของผู้ใช้:

  • การจัดการเหตุการณ์และความปลอดภัย : จากข้อมูล security.googleblog.com ระบุว่า Google ใช้ LLM เพื่อจัดทำสรุปเหตุการณ์ด้านความปลอดภัยและความเป็นส่วนตัวสำหรับกลุ่มเป้าหมายที่หลากหลาย รวมถึง ผู้บริหาร ผู้จัดการ และทีมพันธมิตร วิธีนี้ช่วยประหยัดเวลาของผู้จัดการและปรับปรุงคุณภาพของสรุปเหตุการณ์ Microsoft ใช้ LLM เพื่อวินิจฉัยเหตุการณ์ที่เกิดขึ้นจริง ขณะที่ Meta ได้พัฒนาระบบวิเคราะห์สาเหตุที่แท้จริงโดยใช้ AI Incident.io สร้างสรุปเหตุการณ์ด้วยซอฟต์แวร์ กรณีเหล่านี้แสดงให้เห็นถึงคุณค่าของ LLM ในการเร่งกระบวนการสำคัญ แต่ก็ก่อให้เกิดคำถามเกี่ยวกับความน่าเชื่อถือในสถานการณ์ที่มีความเสี่ยงสูง
  • ความช่วยเหลือด้านการเขียนโปรแกรม : GitHub Copilot ให้คำแนะนำโค้ดและการเติมคำอัตโนมัติ ขณะที่ Replit ได้พัฒนา LLM สำหรับการซ่อมแซมโค้ด NVIDIA ใช้ LLM เพื่อตรวจจับช่องโหว่ของซอฟต์แวร์ เครื่องมือเหล่านี้ช่วยเพิ่มผลผลิตของนักพัฒนา แต่ก็อาจแพร่กระจายรูปแบบโค้ดที่ไม่มีประสิทธิภาพหรือไม่ปลอดภัยได้หากใช้งานอย่างไม่เหมาะสม
  • การสืบค้นข้อมูลและการค้นหาภายใน : Honeycomb ช่วยให้ผู้ใช้เขียนการสืบค้นข้อมูล และ Pinterest แปลงการสืบค้นของผู้ใช้ให้เป็นการสืบค้น SQL กรณีศึกษาเหล่านี้แสดงให้เห็นว่าหลักสูตร LLM สามารถทำให้การเข้าถึงข้อมูลเป็นประชาธิปไตยได้อย่างไร แต่ก็อาจนำไปสู่การตีความที่ไม่ถูกต้องหรือไม่มีประสิทธิภาพหากปราศจากความเข้าใจอย่างถ่องแท้เกี่ยวกับโครงสร้างข้อมูลพื้นฐาน
  • การคัดกรองและการจัดการคำขอรับการสนับสนุน : GoDaddy คัดกรองคำขอรับการสนับสนุนเพื่อปรับปรุงประสบการณ์ของลูกค้า Dropbox จะสรุปและตอบคำถามที่เกี่ยวข้องกับไฟล์ กรณีเหล่านี้แสดงให้เห็นถึงศักยภาพของ LLM ในการปรับปรุงการบริการลูกค้า แต่ยังคงมีความกังวลเกี่ยวกับคุณภาพและความถูกต้องของคำตอบที่ได้รับ

การส่งมอบและการเคลื่อนที่: ประสิทธิภาพการดำเนินงานและการปรับแต่ง

ในอุตสาหกรรมการจัดส่งและการเคลื่อนที่ LLM ถูกนำมาใช้เพื่อปรับปรุงประสิทธิภาพการปฏิบัติงานและประสบการณ์ของผู้ใช้:

  • การทดสอบและการสนับสนุนทางเทคนิค : Uber ใช้ LLM เพื่อทดสอบแอปพลิเคชันมือถือด้วย DragonCrawl และได้สร้าง Genie ซึ่งเป็น AI co-pilot เพื่อตอบคำถามฝ่ายสนับสนุน เครื่องมือเหล่านี้สามารถลดเวลาในการทดสอบและการสนับสนุนได้อย่างมาก แต่อาจไม่สามารถตรวจจับปัญหาที่ซับซ้อนหรือกรณีพิเศษได้เหมือนการทดสอบโดยมนุษย์
  • การดึงข้อมูลและจับคู่ข้อมูลผลิตภัณฑ์ : DoorDash ดึงรายละเอียดผลิตภัณฑ์จากข้อมูล SKU และ Delivery Hero จับคู่สินค้าคงคลังกับผลิตภัณฑ์ของคู่แข่ง กรณีศึกษาเหล่านี้แสดงให้เห็นว่าหลักสูตร LLM สามารถทำให้กระบวนการจับคู่ข้อมูลที่ซับซ้อนเป็นแบบอัตโนมัติได้อย่างไร แต่อาจทำให้เกิดอคติหรือการตีความที่ผิดพลาดได้หากไม่มีการควบคุมที่เหมาะสม
  • การค้นหาแบบสนทนาและความเกี่ยวข้อง : Picnic ช่วยปรับปรุงความเกี่ยวข้องในการค้นหารายการสินค้า ขณะที่ Swiggy ได้นำระบบค้นหาแบบประสาทมาใช้เพื่อช่วยให้ผู้ใช้ค้นหาอาหารและของชำแบบสนทนา กรณีศึกษาเหล่านี้แสดงให้เห็นว่า LLM สามารถทำให้อินเทอร์เฟซการค้นหาใช้งานง่ายขึ้นได้อย่างไร แต่ก็อาจสร้าง "ฟองกรอง" ที่จำกัดการค้นพบผลิตภัณฑ์ใหม่ๆ ได้เช่นกัน
  • ระบบสนับสนุนอัตโนมัติ : DoorDash ได้สร้างแชทบอทสนับสนุนแบบ LLM ที่ดึงข้อมูลจากฐานความรู้เพื่อสร้างคำตอบที่แก้ไขปัญหาได้อย่างรวดเร็ว วิธีการนี้สามารถปรับปรุงเวลาตอบสนองได้ แต่จำเป็นต้องมีมาตรการป้องกันที่แข็งแกร่งเพื่อรับมือกับสถานการณ์ที่ซับซ้อนหรือสถานการณ์ที่ตึงเครียดทางอารมณ์

โซเชียล สื่อ และ B2C: เนื้อหาและการโต้ตอบส่วนบุคคล

ในอุตสาหกรรมโซเชียลมีเดียและบริการ B2C มีการใช้ LLM เพื่อสร้างเนื้อหาที่เป็นส่วนตัวและปรับปรุงการโต้ตอบ:

  • การวิเคราะห์และกลั่นกรองเนื้อหา : Yelp ได้อัปเดตระบบกลั่นกรองเนื้อหาด้วย LLM เพื่อตรวจจับภัยคุกคาม การคุกคาม การใช้ถ้อยคำหยาบคาย การโจมตีส่วนบุคคล หรือคำพูดแสดงความเกลียดชัง LinkedIn วิเคราะห์เนื้อหาต่างๆ บนแพลตฟอร์มเพื่อดึงข้อมูลเกี่ยวกับทักษะต่างๆ กรณีเหล่านี้แสดงให้เห็นถึงศักยภาพของ LLM ในการปรับปรุงคุณภาพเนื้อหา แต่กลับทำให้เกิดความกังวลเกี่ยวกับการเซ็นเซอร์และการจำกัดเสรีภาพในการแสดงออก
  • การสร้างเนื้อหาทางการศึกษาและการตลาด : Duolingo ใช้ LLM เพื่อช่วยนักออกแบบสร้างแบบฝึกหัดที่เกี่ยวข้อง ขณะที่ Nextdoor ใช้ LLM เพื่อสร้างหัวข้ออีเมลที่น่าสนใจ แอปพลิเคชันเหล่านี้อาจเพิ่มประสิทธิภาพ แต่ก็อาจทำให้เนื้อหามีมาตรฐานมากเกินไปได้เช่นกัน
  • การแปลและการสื่อสารหลายภาษา : Roblox ใช้ประโยชน์จากโมเดลหลายภาษาที่ปรับแต่งได้ เพื่อให้ผู้ใช้สามารถสื่อสารได้อย่างราบรื่นในภาษาแม่ของตน แอปพลิเคชันนี้แสดงให้เห็นถึงศักยภาพของ LLM ในการเอาชนะอุปสรรคทางภาษา แต่อาจนำความแตกต่างทางวัฒนธรรมที่ไม่ถูกต้องเข้ามาสู่การแปล
  • การโต้ตอบกับสื่อ : Vimeo ช่วยให้ผู้ใช้มีส่วนร่วมในการสนทนาผ่านวิดีโอผ่านระบบถาม-ตอบ (Q&A) ที่ใช้ RAG ซึ่งสามารถสรุปเนื้อหาวิดีโอ เชื่อมโยงไปยังช่วงเวลาสำคัญ และถามคำถามติดตามผล แอปพลิเคชันนี้แสดงให้เห็นว่า LLM สามารถเปลี่ยนแปลงวิธีที่เราโต้ตอบกับสื่อได้อย่างไร แต่ในขณะเดียวกันก็ตั้งคำถามเกี่ยวกับความถูกต้องของการตีความที่สร้างขึ้น

การประเมินเชิงวิพากษ์: มูลค่าที่แท้จริงเทียบกับการทำตามแนวโน้ม

ดังที่ Chitra Sundaram ผู้อำนวยการฝ่ายบริหารข้อมูลของ Cleartelligence, Inc. ระบุไว้ว่า "LLMs มักกินทรัพยากร การฝึกอบรมและการใช้งานโมเดลเหล่านี้ต้องใช้พลังประมวลผลมหาศาล ส่งผลให้เกิดการปล่อยคาร์บอนจำนวนมาก ไอทีที่ยั่งยืนคือการเพิ่มประสิทธิภาพการใช้ทรัพยากร ลดของเสีย และเลือกใช้โซลูชันที่มีขนาดเหมาะสม" ข้อสังเกตนี้มีความเกี่ยวข้องอย่างยิ่งเมื่อวิเคราะห์กรณีการใช้งานที่นำเสนอ

เมื่อวิเคราะห์กรณีการใช้งานเหล่านี้ จะเห็นข้อควรพิจารณาที่สำคัญหลายประการดังนี้:

1. มูลค่าเพิ่มเทียบกับความซับซ้อน

แอปพลิเคชัน LLM หลายตัวมีการปรับปรุงเพิ่มเติมเล็กน้อยเมื่อเทียบกับโซลูชันที่มีอยู่เดิม แต่มีค่าใช้จ่ายด้านการคำนวณ พลังงาน และ การใช้งาน ที่สูงขึ้นอย่างมาก ดังที่ Chitra Sundaram กล่าวไว้ว่า "การใช้ LLM เพื่อคำนวณค่าเฉลี่ยอย่างง่ายก็เหมือนกับการใช้บาซูก้ายิงแมลงวัน" (paste-2.txt) สิ่งสำคัญคือต้องประเมินว่ามูลค่าที่เพิ่มขึ้นนั้นคุ้มค่ากับความซับซ้อนนี้หรือไม่ โดยเฉพาะอย่างยิ่งเมื่อพิจารณาถึง:

  • ความต้องการระบบการตรวจสอบที่แข็งแกร่ง
  • ต้นทุนพลังงานและผลกระทบต่อสิ่งแวดล้อม
  • ความซับซ้อนของการบำรุงรักษาและการอัปเดต
  • ความต้องการทักษะเฉพาะทาง

2. การพึ่งพาการดูแลของมนุษย์

กรณีการใช้งานที่ประสบความสำเร็จส่วนใหญ่ใช้แนวทาง "มนุษย์ร่วมอยู่ในวงจร" ซึ่งหลักสูตรนิติศาสตรมหาบัณฑิต (LLM) เข้ามาช่วยแทนที่จะเข้ามาแทนที่การแทรกแซงของมนุษย์โดยสิ้นเชิง สิ่งนี้ชี้ให้เห็นว่า:

  • ระบบอัตโนมัติเต็มรูปแบบผ่าน LLM ยังคงเป็นปัญหา
  • คุณค่าหลักอยู่ที่การเพิ่มขีดความสามารถของมนุษย์ ไม่ใช่การทดแทน
  • ประสิทธิภาพขึ้นอยู่กับคุณภาพของการโต้ตอบระหว่างมนุษย์กับเครื่องจักร

3. ความจำเพาะของโดเมนเทียบกับแอปพลิเคชันทั่วไป

กรณีการใช้งานที่น่าสนใจที่สุดคือกรณีที่ LLM ได้รับการปรับแต่งและเพิ่มประสิทธิภาพสำหรับ โดเมน เฉพาะโดยมีความรู้เกี่ยวกับโดเมนฝังไว้ผ่าน:

  • การปรับแต่งข้อมูลเฉพาะอุตสาหกรรม
  • การบูรณาการกับระบบและแหล่งความรู้ที่มีอยู่
  • ราวกั้นและข้อจำกัดเฉพาะบริบท

4. การบูรณาการกับเทคโนโลยีที่มีอยู่

กรณีที่มีประสิทธิผลสูงสุดจะไม่ใช้ LLM แบบแยกส่วน แต่บูรณาการเข้ากับ:

  • ระบบกู้คืนและจัดเก็บข้อมูล (RAG)
  • อัลกอริทึมเฉพาะทางและเวิร์กโฟลว์ที่มีอยู่
  • กลไกการตรวจสอบและควบคุม

ดังที่กรณีการใช้งานของ Google เน้นย้ำ การรวม LLM เข้ากับเวิร์กโฟลว์เหตุการณ์ด้านความปลอดภัยและความเป็นส่วนตัวช่วยให้ "เร่งการตอบสนองต่อเหตุการณ์โดยใช้ AI เชิงสร้างสรรค์ " โดยมีบทสรุปที่สร้างขึ้นเพื่อปรับให้เหมาะกับกลุ่มเป้าหมายต่างๆ ช่วยให้มั่นใจได้ว่าข้อมูลที่เกี่ยวข้องจะไปถึงบุคคลที่เหมาะสมในรูปแบบที่เป็นประโยชน์ที่สุด

__wf_reserved_inherit

บทสรุป: แนวทางเชิงปฏิบัติต่อ LLM

จิตรา สุนทราราม นำเสนอมุมมองที่แจ่มชัดเมื่อเธอกล่าวว่า "เส้นทางสู่การวิเคราะห์ที่ยั่งยืนคือการเลือกเครื่องมือที่เหมาะสมกับงาน ไม่ใช่แค่การไล่ตามเทรนด์ล่าสุด แต่เป็นการลงทุนในนักวิเคราะห์ที่มีทักษะและการกำกับดูแลข้อมูลที่แข็งแกร่ง รวมถึงการให้ความสำคัญกับความยั่งยืนเป็นอันดับแรก"

การวิเคราะห์กรณีการใช้งานจริงเหล่านี้ยืนยันว่าหลักสูตร LLM ไม่ใช่เครื่องมือที่ครบครัน แต่เป็นเครื่องมือที่ทรงพลัง ซึ่งเมื่อนำไปประยุกต์ใช้กับปัญหาเฉพาะอย่างอย่างมีกลยุทธ์ สามารถสร้างคุณค่าที่สำคัญได้ องค์กรต่างๆ ควร:

  1. ระบุปัญหาเฉพาะ ที่การประมวลผลภาษาธรรมชาติมีข้อได้เปรียบที่สำคัญเหนือแนวทางดั้งเดิม
  2. เริ่มต้นด้วยโครงการนำร่อง ที่สามารถแสดงมูลค่าได้อย่างรวดเร็วและวัดผลได้
  3. บูรณาการ LLM เข้ากับระบบที่มีอยู่ แทนที่จะแทนที่เวิร์กโฟลว์ทั้งหมด
  4. รักษากลไกการกำกับดูแลของมนุษย์ โดยเฉพาะอย่างยิ่งสำหรับแอปพลิเคชันที่สำคัญ
  5. ประเมินอัตราส่วนต้นทุน-ผลประโยชน์อย่างเป็นระบบ โดย พิจารณาไม่เพียงแต่การปรับปรุงประสิทธิภาพเท่านั้น แต่ยังรวมถึงต้นทุนด้านพลังงาน การบำรุงรักษา และการอัปเกรดด้วย

บริษัทที่ประสบความสำเร็จในยุค LLM ไม่จำเป็นต้องเป็นบริษัทที่นำหลักสูตรนี้ไปใช้กันอย่างแพร่หลายที่สุด แต่เป็นบริษัทที่นำหลักสูตรไปใช้อย่างมีกลยุทธ์มากที่สุด โดยสร้างสมดุลระหว่างนวัตกรรมและความจริงจัง และจับตาดูมูลค่าที่แท้จริงที่เกิดขึ้นอย่างแม่นยำเกินกว่าที่โฆษณาไว้

ทรัพยากรเพื่อการเติบโตทางธุรกิจ

9 พฤศจิกายน 2568

มนุษย์ + เครื่องจักร: สร้างทีมที่ประสบความสำเร็จด้วยเวิร์กโฟลว์ที่ขับเคลื่อนด้วย AI

จะเป็นอย่างไรหากอนาคตของการทำงานไม่ใช่ "มนุษย์ปะทะเครื่องจักร" แต่เป็นความร่วมมือเชิงกลยุทธ์ องค์กรที่ประสบความสำเร็จไม่ได้เลือกระหว่างบุคลากรที่มีความสามารถกับปัญญาประดิษฐ์ แต่พวกเขากำลังสร้างระบบนิเวศที่แต่ละฝ่ายส่งเสริมซึ่งกันและกัน ค้นพบโมเดลการทำงานร่วมกัน 5 แบบที่ได้เปลี่ยนแปลงบริษัทหลายร้อยแห่ง ตั้งแต่การคัดกรองไปจนถึงการโค้ช จากการสำรวจและยืนยันตัวตนไปจนถึงการฝึกงาน ประกอบไปด้วยแผนงานเชิงปฏิบัติ กลยุทธ์ในการเอาชนะอุปสรรคทางวัฒนธรรม และตัวชี้วัดที่เป็นรูปธรรมสำหรับการวัดความสำเร็จของทีมมนุษย์และเครื่องจักร
9 พฤศจิกายน 2568

ภาพลวงตาของการใช้เหตุผล: การถกเถียงที่สั่นคลอนโลก AI

Apple ตีพิมพ์บทความสองฉบับที่สร้างความเสียหายอย่างร้ายแรง ได้แก่ "GSM-Symbolic" (ตุลาคม 2024) และ "The Illusion of Thinking" (มิถุนายน 2025) ซึ่งแสดงให้เห็นว่าหลักสูตร LLM ล้มเหลวในการแก้ปัญหาคลาสสิกแบบเล็กๆ น้อยๆ (เช่น Tower of Hanoi, การข้ามแม่น้ำ) อย่างไร โดยระบุว่า "ประสิทธิภาพลดลงเมื่อเปลี่ยนแปลงเฉพาะค่าตัวเลข" ไม่มีความสำเร็จใดๆ เลยใน Tower of Hanoi ที่ซับซ้อน แต่ Alex Lawsen (Open Philanthropy) โต้แย้งด้วยบทความ "The Illusion of the Illusion of Thinking" ซึ่งแสดงให้เห็นถึงระเบียบวิธีที่มีข้อบกพร่อง ความล้มเหลวเกิดจากข้อจำกัดของผลลัพธ์โทเค็น ไม่ใช่การล่มสลายของเหตุผล สคริปต์อัตโนมัติจัดประเภทผลลัพธ์บางส่วนที่ถูกต้องไม่ถูกต้อง และปริศนาบางอย่างไม่สามารถแก้ทางคณิตศาสตร์ได้ ด้วยการทดสอบซ้ำด้วยฟังก์ชันแบบเรียกซ้ำแทนที่จะแสดงรายการการเคลื่อนที่ Claude/Gemini/GPT จึงสามารถไข Tower of Hanoi ที่มี 15 แผ่นได้ แกรี่ มาร์คัส เห็นด้วยกับแนวคิด "การเปลี่ยนแปลงการกระจายสินค้า" ของ Apple แต่บทความเกี่ยวกับจังหวะเวลาก่อนงาน WWDC กลับตั้งคำถามเชิงกลยุทธ์ ผลกระทบทางธุรกิจ: เราควรไว้วางใจ AI ในงานสำคัญๆ มากน้อยเพียงใด วิธีแก้ปัญหา: แนวทางเชิงสัญลักษณ์ประสาทวิทยา — เครือข่ายประสาทเทียมสำหรับการจดจำรูปแบบ + ภาษา ระบบสัญลักษณ์สำหรับตรรกะเชิงรูปนัย ตัวอย่าง: ระบบบัญชี AI เข้าใจว่า "ฉันใช้จ่ายไปกับการเดินทางเท่าไหร่" แต่ SQL/การคำนวณ/การตรวจสอบภาษี = โค้ดแบบกำหนดตายตัว
9 พฤศจิกายน 2568

🤖 Tech Talk: เมื่อ AI พัฒนาภาษาที่เป็นความลับ

แม้ว่า 61% ของผู้คนจะกังวลกับ AI ที่เข้าใจอยู่แล้ว แต่ในเดือนกุมภาพันธ์ 2025 Gibberlink มียอดวิว 15 ล้านครั้ง ด้วยการนำเสนอสิ่งใหม่สุดขั้ว นั่นคือ AI สองระบบที่หยุดพูดภาษาอังกฤษและสื่อสารกันด้วยเสียงแหลมสูงที่ความถี่ 1875-4500 เฮิรตซ์ ซึ่งมนุษย์ไม่สามารถเข้าใจได้ นี่ไม่ใช่นิยายวิทยาศาสตร์ แต่เป็นโปรโตคอล FSK ที่เพิ่มประสิทธิภาพได้ถึง 80% ทำลายมาตรา 13 ของพระราชบัญญัติ AI ของสหภาพยุโรป และสร้างความทึบแสงสองชั้น นั่นคืออัลกอริทึมที่เข้าใจยากซึ่งประสานงานกันในภาษาที่ถอดรหัสไม่ได้ วิทยาศาสตร์แสดงให้เห็นว่าเราสามารถเรียนรู้โปรโตคอลของเครื่องจักรได้ (เช่น รหัสมอร์สที่ความเร็ว 20-40 คำต่อนาที) แต่เราต้องเผชิญกับขีดจำกัดทางชีววิทยาที่ยากจะเอาชนะ: 126 บิต/วินาทีสำหรับมนุษย์ เทียบกับ Mbps+ สำหรับเครื่องจักร สามอาชีพใหม่กำลังเกิดขึ้น ได้แก่ นักวิเคราะห์โปรโตคอล AI, ผู้ตรวจสอบการสื่อสาร AI และนักออกแบบส่วนต่อประสานระหว่างมนุษย์กับ AI ขณะที่ IBM, Google และ Anthropic กำลังพัฒนามาตรฐาน (ACP, A2A, MCP) เพื่อหลีกเลี่ยงปัญหาที่ยากที่สุด การตัดสินใจเกี่ยวกับโปรโตคอลการสื่อสารของ AI ในปัจจุบันจะกำหนดทิศทางของปัญญาประดิษฐ์ในอีกหลายทศวรรษข้างหน้า