ฟาบิโอ ลอเรีย

Outliers: เมื่อวิทยาศาสตร์ข้อมูลพบกับเรื่องราวความสำเร็จ

11 สิงหาคม 2568
แชร์บนโซเชียลมีเดีย

วิวัฒนาการของแนวคิดนอกรีต

วิทยาศาสตร์ข้อมูลสมัยใหม่ได้ปฏิวัติความเข้าใจของเราเกี่ยวกับค่าผิดปกติ เปลี่ยนจาก "ข้อผิดพลาด" ง่ายๆ ให้กลายเป็นแหล่งข้อมูลอันทรงคุณค่า ขณะเดียวกัน หนังสือ " Outliers: The Story of Success " ของมัลคอล์ม แกลดเวลล์ นำเสนอมุมมองเสริมเกี่ยวกับความสำเร็จของมนุษย์ในฐานะปรากฏการณ์ที่แม้จะผิดปกติทางสถิติแต่ก็มีความหมาย

จากเครื่องมือที่เรียบง่ายไปจนถึงวิธีการที่ซับซ้อน

ในสถิติแบบดั้งเดิม ค่าผิดปกติจะถูกระบุโดยใช้วิธีที่ค่อนข้างง่าย เช่น กราฟกล่อง คะแนน Z (ซึ่งใช้วัดว่าค่าเบี่ยงเบนจากค่าเฉลี่ยมากน้อยเพียงใด) และช่วงควอร์ไทล์ (IQR)

แม้ว่าวิธีการเหล่านี้จะเป็นประโยชน์ แต่ก็มีข้อจำกัดสำคัญ ค่าผิดปกติเพียงค่าเดียวอาจทำให้แบบจำลองการถดถอยเชิงเส้นบิดเบือนไปอย่างสิ้นเชิง เช่น เพิ่มความชันจาก 2 เป็น 10 ซึ่งทำให้แบบจำลองทางสถิติแบบดั้งเดิมมีความเสี่ยงในสภาวะแวดล้อมจริง

การเรียนรู้ของเครื่องจักรได้นำเสนอแนวทางที่ซับซ้อนมากขึ้นซึ่งสามารถเอาชนะข้อจำกัดเหล่านี้ได้:

  • Isolation Forest : อัลกอริทึมที่ "แยก" ค่าผิดปกติโดยการสร้างต้นไม้ตัดสินใจแบบสุ่ม ค่าผิดปกติมักจะถูกแยกออกได้เร็วกว่าจุดปกติ ทำให้ต้องแบ่งออกน้อยกว่า
  • ปัจจัยค่าผิดปกติในท้องถิ่น : วิธีการนี้จะวิเคราะห์ความหนาแน่นในท้องถิ่นรอบแต่ละจุด จุดใดจุดหนึ่งในภูมิภาคที่มีความหนาแน่นต่ำเมื่อเทียบกับพื้นที่ใกล้เคียงจะถือว่าเป็นค่าผิดปกติ
  • ออโต้เอ็นโค้ดเดอร์ : เครือข่ายประสาทเทียมที่เรียนรู้การบีบอัดและสร้างข้อมูลปกติใหม่ เมื่อจุดใดจุดหนึ่งสร้างใหม่ได้ยาก (ทำให้เกิดข้อผิดพลาดสูง) จุดนั้นจะถือว่าเป็นจุดที่ผิดปกติ

ประเภทของค่าผิดปกติในโลกแห่งความเป็นจริง

วิทยาศาสตร์ข้อมูล จะแบ่งแยกหมวดหมู่ของค่าผิดปกติหลายประเภท โดยแต่ละประเภทจะมีนัยสำคัญเฉพาะตัว:

  • ค่าผิดปกติทั่วโลก : ค่าที่ไม่อยู่ในมาตราส่วนอย่างชัดเจนกับชุดข้อมูลทั้งหมด เช่น อุณหภูมิ -10°C ที่บันทึกในภูมิอากาศแบบร้อนชื้น
  • ค่าผิดปกติตามบริบท : ค่าที่ดูเหมือนปกติโดยทั่วไป แต่ผิดปกติในบริบทเฉพาะ ตัวอย่างเช่น ค่าใช้จ่าย 1,000 ยูโรในย่านที่มีรายได้น้อย หรือปริมาณการเข้าชมเว็บที่เพิ่มขึ้นอย่างกะทันหันในเวลาตี 3
  • ค่าผิดปกติโดยรวม : กลุ่มค่าที่เมื่อนำมารวมกันแล้วแสดงพฤติกรรมที่ผิดปกติ ตัวอย่างคลาสสิกคือการเพิ่มขึ้นของปริมาณการรับส่งข้อมูลเครือข่ายแบบซิงโครไนซ์ ซึ่งอาจบ่งชี้ถึงการโจมตีทางไซเบอร์

ความคล้ายคลึงกับทฤษฎีความสำเร็จของแกลดเวลล์

“กฎ 10,000 ชั่วโมง” และข้อจำกัดของมัน

ในหนังสือของเขา แกลดเวลล์ได้นำเสนอ "กฎ 10,000 ชั่วโมง" อันโด่งดัง โดยโต้แย้งว่าความเชี่ยวชาญนั้นจำเป็นต้องอาศัยการฝึกฝนอย่างตั้งใจในปริมาณที่จำกัด เขายกตัวอย่างอย่างเช่น บิล เกตส์ ผู้ซึ่งมีสิทธิ์เข้าถึงเครื่องคอมพิวเตอร์เทอร์มินัลตั้งแต่ยังเป็นวัยรุ่น และสะสมเวลาอันมีค่าในการเขียนโปรแกรมไว้มากมาย

ถึงแม้ทฤษฎีนี้จะน่าสนใจ แต่ก็ถูกวิพากษ์วิจารณ์มาโดยตลอด ดังที่พอล แม็กคาร์ทนีย์กล่าวไว้ว่า "มีวงดนตรีมากมายที่ฝึกซ้อมในฮัมบูร์กมาแล้ว 10,000 ชั่วโมงแต่ก็ไม่ประสบความสำเร็จ ดังนั้นทฤษฎีนี้จึงไม่ใช่ทฤษฎีที่ไร้ข้อผิดพลาด"

แนวคิดเบื้องหลังกฎข้อนี้ถูกโต้แย้งโดยนักเขียนและนักวิชาการหลายท่าน และตัวเราเองก็มีข้อสงสัยอย่างมากเกี่ยวกับความถูกต้องของทฤษฎีนี้หรือความเป็นสากลของมัน สำหรับผู้ที่สนใจเรียนรู้เพิ่มเติมเกี่ยวกับหัวข้อต่างๆ ที่กล่าวถึงในหนังสือเล่มนี้ ผมขอแนะนำ ตัวอย่างนี้ แต่หากคุณสนใจ คุณสามารถหาตัวอย่างอื่นๆ ได้อีกมากมาย

ในทำนองเดียวกัน ในศาสตร์ข้อมูล เราได้เรียนรู้ว่าไม่ใช่แค่ปริมาณข้อมูลเท่านั้นที่สำคัญ แต่ยังรวมถึงคุณภาพและบริบทของข้อมูลด้วย อัลกอริทึมไม่ได้พัฒนาขึ้นโดยอัตโนมัติเมื่อมีข้อมูลมากขึ้น แต่จำเป็นต้องอาศัยความเข้าใจเชิงบริบทและคุณภาพที่เหมาะสม

ความสำคัญของบริบททางวัฒนธรรม

แกลดเวลล์เน้นย้ำว่าวัฒนธรรมมีอิทธิพลอย่างลึกซึ้งต่อโอกาสที่จะประสบความสำเร็จ เขาอภิปรายถึงปัจจัยต่างๆ เช่น ลูกหลานชาวนาชาวเอเชียมีแนวโน้มที่จะประสบความสำเร็จทางคณิตศาสตร์ ไม่ใช่เพราะเหตุผลทางพันธุกรรม แต่เป็นเพราะปัจจัยทางภาษาและวัฒนธรรม

  • ระบบตัวเลขของภาษาจีนเป็นระบบที่เข้าใจง่ายกว่าและต้องการพยางค์น้อยกว่าในการออกเสียงตัวเลข
  • การปลูกข้าวแตกต่างจากเกษตรกรรมแบบตะวันตก ตรงที่ต้องอาศัยการปรับปรุงเทคนิคที่มีอยู่อย่างต่อเนื่องและพิถีพิถัน แทนที่จะขยายไปสู่พื้นที่ใหม่

การสังเกตทางวัฒนธรรมนี้สอดคล้องกับแนวทางเชิงบริบทต่อค่าผิดปกติในวิทยาศาสตร์ข้อมูลสมัยใหม่ เช่นเดียวกับที่ค่าหนึ่งอาจผิดปกติในบริบทหนึ่ง แต่กลับเป็นปกติในอีกบริบทหนึ่ง ความสำเร็จก็ขึ้นอยู่กับบริบทอย่างลึกซึ้งเช่นกัน

กลยุทธ์การบรรเทาผลกระทบ: เราทำอะไรได้บ้าง?

ในวิทยาศาสตร์ข้อมูลสมัยใหม่ มีการใช้ กลยุทธ์หลายประการ เพื่อจัดการกับค่าผิดปกติ:

  1. การลบออก : มีเหตุผลเพียงพอสำหรับข้อผิดพลาดที่ชัดเจน (เช่น อายุเชิงลบ) แต่มีความเสี่ยงเนื่องจากอาจตัดสัญญาณสำคัญออกไป
  2. การแปลง : เทคนิคต่างๆ เช่น "winsorizing" (การแทนที่ค่าสุดขั้วด้วยค่าที่น้อยกว่า) จะรักษาข้อมูลโดยลดผลกระทบจากการบิดเบือน
  3. การเลือกอัลกอริทึม : ใช้โมเดลที่มีความทนทานต่อค่าผิดปกติ เช่น Random Forest แทนการถดถอยเชิงเส้น
  4. การซ่อมแซมแบบสร้าง : การใช้เทคนิคขั้นสูง เช่น เครือข่ายการต่อต้านแบบสร้าง (GAN) เพื่อสังเคราะห์การทดแทนที่เป็นไปได้สำหรับค่าผิดปกติ

กรณีศึกษาในโลกแห่งความเป็นจริงเกี่ยวกับการตรวจจับค่าผิดปกติในการเรียนรู้ของเครื่องจักรและปัญญาประดิษฐ์

การประยุกต์ใช้วิธีการตรวจจับค่าผิดปกติและความผิดปกติล่าสุดได้เปลี่ยนแปลงวิธีที่องค์กรต่างๆ ระบุรูปแบบที่ผิดปกติในอุตสาหกรรมต่างๆ อย่างสิ้นเชิง:

ธนาคารและประกันภัย

กรณีศึกษาที่น่าสนใจเป็นพิเศษเกี่ยวข้องกับการนำเทคนิคการตรวจจับค่าผิดปกติที่อิงกับการเรียนรู้แบบเสริมแรง (Reinforcement Learning) มาประยุกต์ใช้ เพื่อวิเคราะห์ข้อมูลรายละเอียดที่รายงานโดยกองทุนประกันภัยและกองทุนบำเหน็จบำนาญของเนเธอร์แลนด์ ภายใต้กรอบการกำกับดูแล Solvency II และ FTK สถาบันการเงินเหล่านี้ต้องส่งชุดข้อมูลขนาดใหญ่ที่ต้องผ่านการตรวจสอบความถูกต้องอย่างละเอียด นักวิจัยได้พัฒนาวิธีการแบบกลุ่ม (Ensemble) ที่ผสมผสานอัลกอริทึมการตรวจจับค่าผิดปกติหลายแบบเข้าด้วยกัน ซึ่งรวมถึงการวิเคราะห์พิสัยระหว่างควอไทล์ เมตริกระยะทางเพื่อนบ้านที่ใกล้ที่สุด และการคำนวณปัจจัยค่าผิดปกติเฉพาะที่ เสริมด้วยการเรียนรู้แบบเสริมแรงเพื่อปรับค่าถ่วงน้ำหนักของกลุ่มให้เหมาะสม ที่สุด 1

ระบบนี้แสดงให้เห็นถึงการพัฒนาที่สำคัญเมื่อเทียบกับวิธีการทางสถิติแบบเดิม โดยพัฒนาความสามารถในการตรวจจับอย่างต่อเนื่องทุกครั้งที่มีความผิดปกติที่ได้รับการยืนยัน ทำให้ระบบนี้มีประโยชน์อย่างยิ่งต่อการกำกับดูแลด้านกฎระเบียบที่มีต้นทุนการตรวจสอบสูง แนวทางการปรับตัวนี้ช่วยจัดการกับความท้าทายของการเปลี่ยนแปลงรูปแบบข้อมูลเมื่อเวลาผ่านไป และเพิ่มประโยชน์สูงสุดจากความผิดปกติที่ได้รับการยืนยันแล้ว เพื่อปรับปรุงความแม่นยำในการตรวจจับในอนาคต

อีกหนึ่งโครงการที่โดดเด่น ธนาคารแห่งหนึ่งได้นำระบบตรวจจับความผิดปกติแบบบูรณาการมาใช้ ซึ่งผสานรวมข้อมูลพฤติกรรมลูกค้าในอดีตเข้ากับอัลกอริทึมการเรียนรู้ของเครื่องขั้นสูง เพื่อระบุธุรกรรมที่อาจเป็นการฉ้อโกง ระบบจะตรวจสอบรูปแบบธุรกรรมเพื่อตรวจจับความเบี่ยงเบนจากพฤติกรรมของลูกค้า เช่น การเปลี่ยนแปลงกิจกรรมทางภูมิศาสตร์อย่างฉับพลัน หรือปริมาณการใช้จ่ายที่ผิดปกติ 5

การดำเนินการนี้มีความโดดเด่นเป็นพิเศษ เนื่องจากเป็นตัวอย่างของการเปลี่ยนจากการป้องกันการทุจริตแบบรับมือเป็นเชิงรุก มีรายงานว่าภาคการเงินของสหราชอาณาจักรสามารถกู้คืนความเสียหายที่อาจเกิดขึ้นได้ประมาณ 18% ผ่านระบบตรวจจับความผิดปกติแบบเรียลไทม์ที่คล้ายคลึงกัน ซึ่งถูกนำไปใช้ในทุกธุรกรรมของธนาคาร วิธีการนี้ช่วยให้สถาบันการเงินสามารถบล็อกธุรกรรมที่น่าสงสัยได้ทันที พร้อมกับแจ้งเตือนบัญชีเพื่อการตรวจสอบเพิ่มเติม ซึ่งช่วยป้องกันความเสียหายทางการเงินจำนวนมากก่อนที่จะเกิดขึ้น ได้ อย่างมีประสิทธิภาพ

นักวิจัยได้พัฒนาและประเมินอัลกอริทึมการตรวจจับความผิดปกติโดยใช้การเรียนรู้ของเครื่อง ซึ่งออกแบบมาโดยเฉพาะสำหรับการตรวจสอบความถูกต้องของข้อมูลการวิจัยทางคลินิกจากฐานข้อมูลประสาทวิทยาหลายแห่ง การศึกษานี้แสดงให้เห็นถึงประสิทธิภาพของอัลกอริทึมในการระบุรูปแบบที่ผิดปกติในข้อมูลที่เกิดจากการขาดความใส่ใจ ความผิดพลาดอย่างเป็นระบบ หรือการสร้างค่าโดยเจตนา 4

นักวิจัยได้ประเมินตัวชี้วัดระยะทางหลายตัว และพบว่าการคำนวณระยะทางแบบผสมผสานระหว่างแคนเบอร์รา แมนฮัตตัน และมาฮาลาโนบิส ให้ประสิทธิภาพสูงสุด การใช้งานนี้มีความไวในการตรวจจับมากกว่า 85% เมื่อตรวจสอบความถูกต้องกับชุดข้อมูลอิสระ ทำให้เป็นเครื่องมือที่มีประโยชน์สำหรับการรักษาความสมบูรณ์ของข้อมูลในการวิจัยทางคลินิก กรณีศึกษานี้แสดงให้เห็นว่าการตรวจจับความผิดปกติมีส่วนช่วยในการแพทย์เชิงประจักษ์อย่างไร โดยการทำให้มั่นใจว่าข้อมูลมีคุณภาพสูงสุดเท่าที่จะเป็นไปได้ในการทดลองทางคลินิกและการลงทะเบียน 4

ระบบนี้ได้แสดงให้เห็นถึงความสามารถในการนำไปประยุกต์ใช้อย่างแพร่หลาย แสดงให้เห็นถึงศักยภาพในการนำไปประยุกต์ใช้กับระบบบันทึกข้อมูลอิเล็กทรอนิกส์ (EDC) อื่นๆ นอกเหนือจากระบบที่ใช้ในระบบทะเบียนประสาทวิทยาเดิม ความสามารถในการปรับตัวนี้เน้นย้ำถึงความสามารถในการถ่ายโอนวิธีการตรวจจับความผิดปกติที่ออกแบบมาอย่างดีไปยังแพลตฟอร์มการจัดการข้อมูลการดูแลสุขภาพต่างๆ

การผลิต

บริษัทผู้ผลิตได้นำระบบตรวจจับความผิดปกติที่ใช้เทคโนโลยีคอมพิวเตอร์วิชันอันซับซ้อนมาใช้งานเพื่อระบุข้อบกพร่องในชิ้นส่วนที่ผลิตขึ้น ระบบเหล่านี้ตรวจสอบส่วนประกอบที่คล้ายคลึงกันหลายพันชิ้นในสายการผลิต โดยใช้อัลกอริทึมการจดจำภาพและแบบจำลองการเรียนรู้ของเครื่องที่ฝึกอบรมจากชุดข้อมูลขนาดใหญ่ที่มีทั้งตัวอย่างที่มีข้อบกพร่องและไม่มีข้อบกพร่อง 3

การนำระบบเหล่านี้ไปใช้ในทางปฏิบัติถือเป็นความก้าวหน้าที่สำคัญเหนือกระบวนการตรวจสอบด้วยมือ ด้วยการตรวจจับความเบี่ยงเบนแม้เพียงเล็กน้อยจากมาตรฐานที่กำหนด ระบบตรวจจับความผิดปกติเหล่านี้สามารถระบุข้อบกพร่องที่อาจเกิดขึ้นซึ่งอาจมองข้ามไป ความสามารถนี้มีความสำคัญอย่างยิ่งในอุตสาหกรรมที่ความล้มเหลวของส่วนประกอบอาจนำไปสู่ผลลัพธ์ที่ร้ายแรง เช่น การผลิตอากาศยาน ซึ่งชิ้นส่วนที่ชำรุดเพียงชิ้นเดียวอาจนำไปสู่อุบัติเหตุเครื่องบินตก ได้

นอกเหนือจากการตรวจสอบส่วนประกอบแล้ว ผู้ผลิตยังได้ขยายการตรวจจับความผิดปกติไปยังตัวเครื่องจักรเองด้วย การใช้งานเหล่านี้จะตรวจสอบพารามิเตอร์การทำงานอย่างต่อเนื่อง เช่น อุณหภูมิเครื่องยนต์และระดับน้ำมันเชื้อเพลิง เพื่อระบุความผิดปกติที่อาจเกิดขึ้นก่อนที่จะทำให้เกิดการหยุดการผลิตหรือความเสี่ยงด้านความ ปลอดภัย

องค์กรต่างๆ ในอุตสาหกรรมต่างๆ ได้นำระบบตรวจจับความผิดปกติที่ขับเคลื่อนด้วยการเรียนรู้เชิงลึกมาใช้งาน เพื่อปรับเปลี่ยนแนวทางการจัดการประสิทธิภาพแอปพลิเคชัน ซึ่งแตกต่างจากวิธีการตรวจสอบแบบเดิมที่ตอบสนองต่อปัญหาหลังจากส่งผลกระทบต่อการดำเนินงาน การนำระบบเหล่านี้มาใช้ช่วยให้สามารถระบุปัญหาสำคัญที่อาจเกิดขึ้น ได้

ประเด็นสำคัญของการใช้งานคือการเชื่อมโยงสตรีมข้อมูลต่างๆ เข้ากับตัวชี้วัดประสิทธิภาพแอปพลิเคชันหลัก ระบบเหล่านี้ได้รับการฝึกฝนจากชุดข้อมูลประวัติจำนวนมาก เพื่อจดจำรูปแบบและพฤติกรรมที่บ่งชี้ถึงการทำงานปกติของแอปพลิเคชัน เมื่อเกิดความคลาดเคลื่อน อัลกอริทึมการตรวจจับความผิดปกติจะระบุปัญหาที่อาจเกิดขึ้นก่อนที่จะลุกลามจนทำให้บริการหยุดชะงัก

การใช้งานทางเทคนิคนี้ใช้ประโยชน์จากความสามารถของโมเดลการเรียนรู้ของเครื่องในการเชื่อมโยงข้อมูลระหว่างตัวชี้วัดประสิทธิภาพต่างๆ โดยอัตโนมัติ ทำให้สามารถระบุสาเหตุที่แท้จริงได้แม่นยำยิ่งขึ้นกว่าวิธีการตรวจสอบแบบอิงเกณฑ์มาตรฐานทั่วไป ทีมไอทีที่ใช้ระบบเหล่านี้สามารถวินิจฉัยและแก้ไขปัญหาที่เกิดขึ้นได้รวดเร็วยิ่งขึ้น ช่วยลดระยะเวลาหยุดทำงานของแอปพลิเคชันและผลกระทบต่อธุรกิจที่เกี่ยวข้องได้อย่างมาก

มัน

การนำระบบตรวจจับความผิดปกติไปใช้งานด้านความปลอดภัยทางไซเบอร์ มุ่งเน้นการตรวจสอบปริมาณการใช้งานเครือข่ายและรูปแบบพฤติกรรมผู้ใช้อย่างต่อเนื่อง เพื่อระบุสัญญาณการบุกรุกหรือกิจกรรมที่ผิดปกติที่อาจหลบเลี่ยงมาตรการรักษาความปลอดภัยแบบเดิม ระบบเหล่านี้จะวิเคราะห์รูปแบบปริมาณการใช้งานเครือข่าย พฤติกรรมการเข้าสู่ระบบของผู้ใช้ และความพยายามในการเข้าถึงระบบ เพื่อตรวจจับภัยคุกคามด้านความปลอดภัยที่อาจเกิดขึ้น

การใช้งานมีประสิทธิภาพอย่างยิ่งในการระบุรูปแบบการโจมตีใหม่ๆ ที่ระบบตรวจจับแบบอิงลายเซ็นอาจพลาดไป การตรวจจับความผิดปกติสามารถระบุกิจกรรมที่เบี่ยงเบนไปจากบรรทัดฐานเหล่านี้ ได้ โดยการกำหนดพฤติกรรมพื้นฐานสำหรับผู้ใช้และระบบ ซึ่งอาจบ่งชี้ถึงการละเมิดความปลอดภัยที่กำลังดำเนินอยู่ ความสามารถนี้ทำให้การตรวจจับความผิดปกติเป็นองค์ประกอบสำคัญของสถาปัตยกรรมความปลอดภัยทางไซเบอร์สมัยใหม่ ซึ่งช่วยเสริมมาตรการป้องกันแบบดั้งเดิม

จากกรณีศึกษาเหล่านี้ ทำให้เกิดแนวทางการนำไปใช้งานทั่วไปหลายประการ โดยทั่วไปองค์กรต่างๆ จะใช้เทคนิคสถิติเชิงพรรณนาและการเรียนรู้ของเครื่องร่วมกัน โดยเลือกวิธีการเฉพาะเจาะจงตามลักษณะของข้อมูลและลักษณะของความผิดปกติที่อาจเกิดขึ้น 2 .

บทสรุป

กรณีศึกษาจากสถานการณ์จริงเหล่านี้แสดงให้เห็นถึงคุณค่าเชิงปฏิบัติของการตรวจจับค่าผิดปกติและความผิดปกติในหลากหลายอุตสาหกรรม ตั้งแต่การป้องกันการฉ้อโกงทางการเงิน การตรวจสอบความถูกต้องของข้อมูลด้านการดูแลสุขภาพ การควบคุมคุณภาพการผลิต ไปจนถึงการตรวจสอบระบบไอที องค์กรต่างๆ ประสบความสำเร็จในการนำวิธีการตรวจจับที่ซับซ้อนมากขึ้นมาใช้ เพื่อระบุรูปแบบที่ผิดปกติซึ่งควรค่าแก่การตรวจสอบ

วิวัฒนาการจากวิธีการทางสถิติล้วนๆ ไปสู่ระบบตรวจจับความผิดปกติที่ใช้ AI ถือเป็นความก้าวหน้าครั้งสำคัญในด้านขีดความสามารถ ช่วยให้สามารถระบุรูปแบบความผิดปกติที่ซับซ้อนได้แม่นยำยิ่งขึ้นและลดผลบวกลวง (false positive) เมื่อเทคโนโลยีเหล่านี้พัฒนาอย่างต่อเนื่องและมีกรณีศึกษาใหม่ๆ เกิดขึ้นมากขึ้น เราคาดว่าจะมีการปรับปรุงกลยุทธ์การใช้งานและขยายขอบเขตการใช้งานไปสู่ขอบเขตการใช้งานอื่นๆ เพิ่มเติม

วิทยาศาสตร์ข้อมูลสมัยใหม่แนะนำแนวทางแบบผสมผสานในการรักษาค่าผิดปกติ โดยผสมผสานความแม่นยำทางสถิติกับปัญญาเชิงบริบทของการเรียนรู้ของเครื่องจักร:

  1. ใช้สถิติวิธีดั้งเดิมสำหรับการสำรวจข้อมูลเบื้องต้น
  2. ใช้ขั้นตอนวิธี ML ขั้นสูงเพื่อการวิเคราะห์ที่ซับซ้อนยิ่งขึ้น
  3. รักษาความระมัดระวังทางจริยธรรมต่ออคติการกีดกัน
  4. พัฒนาความเข้าใจเฉพาะโดเมนเกี่ยวกับสิ่งที่ถือเป็นความผิดปกติ

ในขณะที่ Gladwell สนับสนุนให้เราพิจารณาความสำเร็จเป็นปรากฏการณ์ที่ซับซ้อนซึ่งได้รับอิทธิพลจากวัฒนธรรม โอกาส และจังหวะเวลา วิทยาศาสตร์ข้อมูลสมัยใหม่ผลักดันให้เราเห็นค่าที่ผิดปกติไม่ใช่แค่ข้อผิดพลาดธรรมดา แต่เป็นสัญญาณสำคัญในบริบทที่กว้างขึ้น

การยอมรับสิ่งแปลกแยกในชีวิต

ในขณะที่วิทยาศาสตร์ข้อมูลได้เปลี่ยนจากการมองค่าผิดปกติเป็นเพียงข้อผิดพลาดเล็กๆ น้อยๆ ไปเป็นการมองว่าเป็นแหล่งข้อมูลอันมีค่า เราเองก็ต้องเปลี่ยนวิธีมองอาชีพที่ไม่ธรรมดาเช่นกัน จากการวิเคราะห์เชิงตัวเลขง่ายๆ ไปสู่การทำความเข้าใจความสำเร็จที่ลึกซึ้งและอยู่ในบริบทมากขึ้น

ความสำเร็จในทุกสาขาอาชีพล้วนเกิดจากการผสมผสานกันอย่างลงตัวระหว่างพรสวรรค์ ประสบการณ์ที่สั่งสม เครือข่าย และบริบททางวัฒนธรรม เช่นเดียวกับอัลกอริทึมการเรียนรู้ของเครื่องจักรสมัยใหม่ที่ไม่ขจัดสิ่งผิดปกติออกไป แต่แสวงหาความเข้าใจในสิ่งเหล่านั้น เราก็ต้องเรียนรู้ที่จะมองเห็นคุณค่าในเส้นทางที่หาได้ยากยิ่งเช่นกัน

ฟาบิโอ ลอเรีย

CEO & ผู้ก่อตั้ง | Electe

ซีอีโอของ Electe ฉันช่วยเหลือธุรกิจขนาดเล็กและขนาดกลางในการตัดสินใจโดยใช้ข้อมูล ฉันเขียนเกี่ยวกับปัญญาประดิษฐ์ในธุรกิจ

ได้รับความนิยมมากที่สุด
ลงทะเบียนเพื่อรับข่าวสารล่าสุด

รับข่าวสารและข้อมูลเชิงลึกในกล่องจดหมายของคุณทุกสัปดาห์
กล่องข้อความอีเมล อย่าพลาด!

ขอบคุณ! เราได้รับการส่งของคุณแล้ว!
อุ๊ย! เกิดข้อผิดพลาดบางอย่างขณะส่งแบบฟอร์ม