649 การอ่าน
649 การอ่าน

AI ของคุณฉลาดเพียงเท่ากับข้อมูลของมันเท่านั้น และมนุษย์ก็ยังคงเป็นผู้ที่เก่งที่สุดในการติดป้ายกำกับมัน

โดย Keymakr5m2025/03/24
Read on Terminal Reader

นานเกินไป; อ่าน

ความเห็นพ้องต้องกันเกิดขึ้นได้จากการรวบรวมความคิดเห็นของผู้เชี่ยวชาญหลายคน Google, Tesla, Amazon และ Meta ใช้คำอธิบายประกอบตามความเห็นพ้องกันเพื่อปรับปรุงประสิทธิภาพของ AI Google Health ใช้ความเห็นพ้องกันเพื่อปรับปรุงความแม่นยำในการวินิจฉัย Tesla ใช้ความเห็นพ้องกันในการติดฉลากข้อมูลจากกล้องออโตไพลอต
featured image - AI ของคุณฉลาดเพียงเท่ากับข้อมูลของมันเท่านั้น และมนุษย์ก็ยังคงเป็นผู้ที่เก่งที่สุดในการติดป้ายกำกับมัน
Keymakr HackerNoon profile picture

วิธีการฉันทามติมีบทบาทสำคัญในการอธิบายข้อมูลเมื่อจำเป็นต้องรับรองความแม่นยำสูงและลดความคิดเห็นส่วนตัวในการติดฉลาก จากประสบการณ์ของ Keymakr การนำวิธีการฉันทามติร่วมกับผู้เชี่ยวชาญหลายคนมาใช้ในกรณีเฉพาะสามารถลดข้อผิดพลาดในการอธิบายข้อมูลได้ 30–50% วิธีการฉันทามติช่วยลดข้อผิดพลาด ทำให้การควบคุมคุณภาพเป็นแบบอัตโนมัติ และช่วยสร้างชุดข้อมูลมาตรฐาน ซึ่งมีความสำคัญอย่างยิ่งในพื้นที่ที่มีความรับผิดชอบสูง เช่น การแพทย์และการขับขี่อัตโนมัติ


Tatiana Verbitskaya สถาปนิกโซลูชันทางเทคนิคที่ Keymakr พูดถึงวิธีการทำงานของวิธีนี้และโครงการต่างๆ ที่ได้นำวิธีนี้ไปใช้งานอย่างประสบความสำเร็จ

มันทำงานอย่างไร

การบรรลุฉันทามติทำได้โดยการรวบรวมความคิดเห็นของผู้เชี่ยวชาญหลายคน เมื่อกำหนดข้อมูล "พื้นฐาน" จำเป็นอย่างยิ่งที่จะต้องกำหนดมาตรฐานความถูกต้องที่ตกลงกันไว้ การบรรลุฉันทามติมีความสำคัญเมื่อฝึกโมเดลโดยใช้ข้อมูลเชิงอัตนัย เช่น สีและรูปร่าง หรือเมื่อต้องการความแม่นยำสูง วิธีนี้ใช้จริงในระยะเริ่มต้นเมื่อโมเดลยังไม่ได้รับการฝึกโดยใช้ข้อมูลที่เพียงพอหรือเมื่อจำเป็นต้องมีการฝึกเพิ่มเติม โดยเฉพาะในกรณีเฉพาะ (เช่น การตัดสินเชิงอัตนัย) นอกจากนี้ การบรรลุฉันทามติยังมีความสำคัญในโครงการขนาดใหญ่ เช่น การใส่คำอธิบายประกอบข้อมูลสำหรับรถยนต์ขับเคลื่อนอัตโนมัติหรือการติดตามการขนส่ง เนื่องจากช่วยเพิ่มความแม่นยำและลดข้อผิดพลาด


หลักการสำคัญของฉันทามติ:

  • จำนวนผู้เชี่ยวชาญเป็นคี่: เพื่อหลีกเลี่ยงทางตัน ความเห็นพ้องต้องกันจะต้องอาศัยจำนวนผู้ให้คำอธิบายเป็นคี่ เพื่อให้แน่ใจว่าจะได้ผลลัพธ์ที่ชัดเจนแม้ในกรณีที่ไม่เห็นด้วย
  • การวิเคราะห์ความไม่เห็นด้วย: วิธีนี้ไม่เพียงแต่อาศัยการลงคะแนนเสียงส่วนใหญ่เท่านั้น แต่ยังพิจารณาถึงความถี่ของความไม่เห็นด้วยด้วย หากความแตกต่างมีมากเกินไป ข้อมูลอาจถูกทำเครื่องหมายเพื่อตรวจสอบเพิ่มเติมหรือไม่นำไปใช้ในการฝึกโมเดลก็ได้
  • กลไกการตรวจจับข้อผิดพลาด: แม้แต่ข้อมูลที่อิงตามฉันทามติก็อาจมีข้อผิดพลาดได้หากกรณีมีความลำเอียงเกินไปและไม่ชัดเจน


ผู้นำด้านเทคโนโลยีระดับโลก เช่น Google, Tesla, Amazon และ Meta ต่างก็ใช้คำอธิบายประกอบตามฉันทามติเพื่อปรับปรุงประสิทธิภาพของโมเดล AI ตัวอย่างเช่น Google Health ใช้คำอธิบายประกอบของรังสีแพทย์หลายรายกับภาพเอกซเรย์เพื่อเพิ่มความแม่นยำในการวินิจฉัย Tesla ใช้ฉันทามติเพื่อติดฉลากข้อมูลจากกล้องออโตไพลอต ซึ่งช่วยลดข้อผิดพลาดในการฝึกสอนในการขับขี่อัตโนมัติ Amazon SageMaker Ground Truth นำคำอธิบายประกอบตามฉันทามติมาใช้ใน NLP วิสัยทัศน์คอมพิวเตอร์ และการวิเคราะห์ภาพถ่ายดาวเทียม ขณะที่ Meta ใช้คำอธิบายประกอบนี้สำหรับโครงการจดจำใบหน้าและวัตถุ


สร้างเวิร์กโฟลว์การติดป้ายข้อมูลแบบกำหนดเองด้วย Amazon SageMaker Ground Truth/https://aws.amazon.com/blogs/machine-learning/build-a-custom-data-labeling-workflow-with-amazon-sagemaker-ground-truth/



ฉันทามติทางการแพทย์: สภาคำอธิบายประกอบ

การประยุกต์ใช้ฉันทามติที่สำคัญที่สุดอย่างหนึ่งคือการใส่คำอธิบายภาพทางการแพทย์เพื่อการวินิจฉัยโรค ผู้เชี่ยวชาญกล่าวว่าการวินิจฉัยของรังสีแพทย์อาจแตกต่างกันได้มากถึง 20–30% ซึ่งส่งผลกระทบโดยตรงต่อผลลัพธ์ของผู้ป่วย เมื่อใช้แนวทางที่อิงตามฉันทามติ ซึ่งรังสีแพทย์หลายคนใส่คำอธิบายภาพแยกกันและรวมข้อมูลอินพุตของพวกเขาตามคะแนนถ่วงน้ำหนักตามความเชี่ยวชาญ ความแม่นยำของคำอธิบายสามารถปรับปรุงได้มากถึง 40%


Keymakr นำแนวทางนี้ไปใช้ในโครงการทางการแพทย์ที่ซับซ้อนอย่างจริงจัง ซึ่งช่วยให้สามารถระบุภาพได้อย่างแม่นยำสำหรับโมเดล AI ที่ได้รับการฝึกให้ตรวจจับพยาธิวิทยาที่ซับซ้อน โดยกระบวนการนี้สร้างขึ้นโดยใช้แพลตฟอร์ม Keylabs ซึ่งคุณสามารถเปรียบเทียบความคิดเห็นของผู้เชี่ยวชาญหลายคน ระบุความคลาดเคลื่อน และสร้างชุดข้อมูลที่มีความแม่นยำสูง แนวทางนี้ช่วยเพิ่มความน่าเชื่อถือของอัลกอริทึมที่ใช้ในการวินิจฉัยอัตโนมัติได้อย่างมาก ซึ่งช่วยลดความเสี่ยงของการวินิจฉัยผิดพลาด



ฉันทามติในการติดตามการใช้เนื้อหาลิขสิทธิ์

ปัจจุบัน Keymakr ร่วมมือกับ SoundAware ซึ่งเป็นบริษัทที่ใช้เทคโนโลยีการจดจำเพลงอัตโนมัติเพื่อระบุการใช้งานเพลงที่มีลิขสิทธิ์ ทีมงานตรวจสอบ URL จำนวน 10,000 รายการเพื่อประเมินการมีอยู่ของเนื้อหาที่มีลิขสิทธิ์


แพลตฟอร์มวิดีโอเต็มไปด้วยเนื้อหาที่อาจมีเนื้อหาของผู้เขียน เช่น เพลง ฉากจากภาพยนตร์ หรือส่วนต่างๆ ของรายการทีวี เนื่องจากมีข้อมูลจำนวนมากและการตีความลิขสิทธิ์นั้นค่อนข้างเป็นอัตวิสัย การวิเคราะห์วิดีโอแต่ละรายการด้วยตนเองจึงไม่สามารถทำได้ในทางปฏิบัติ

อย่างไรก็ตาม Keymakr ระบุถึงกรณีที่เนื้อหาที่มีลิขสิทธิ์ถูกใช้หรือแก้ไขในลักษณะที่ระบบอัตโนมัติยังไม่สามารถตรวจจับได้อย่างน่าเชื่อถือ ซึ่งได้แก่ การล้อเลียน แฟนอาร์ต และการแสดงความเคารพ


เพื่อขจัดความคิดเห็นส่วนตัว Keymakr ใช้แนวทางที่อิงตามฉันทามติ โดยผู้เชี่ยวชาญอิสระหลายคนจะประเมินวิดีโอแต่ละรายการ ซึ่งจะตอบคำถามต่อไปนี้

  • วีดีโอนี้มีเพลงที่มีลิขสิทธิ์หรือเปล่า?
  • มีฉากจากภาพยนตร์หรือรายการทีวีไหม?
  • เนื้อหามีการปรับเปลี่ยน เช่น ตัดต่อ หรือ รีมิกซ์ หรือไม่?

การตัดสินใจขั้นสุดท้ายเกี่ยวกับปัญหาลิขสิทธิ์ที่อาจเกิดขึ้นจะเกิดขึ้นตามคำตอบของผู้เชี่ยวชาญ

โครงการดังกล่าวมีความจำเป็นสำหรับการบังคับใช้ลิขสิทธิ์และการรับรองว่าผู้ถือสิทธิ์ได้รับค่าตอบแทนที่ยุติธรรม นอกจากนี้ กระบวนการนี้ยังช่วยให้บริษัทที่เชี่ยวชาญด้านการตรวจสอบเนื้อหาปรับปรุงอัลกอริทึมและเร่งการตรวจจับสื่อที่มีลิขสิทธิ์

ฉันทามติในการติดตามยานพาหนะและคนเดินถนน

นอกจากนี้ หลักการฉันทามติยังถูกนำไปใช้ในการฝึกอบรม AI สำหรับยานยนต์ไร้คนขับ โดยเฉพาะอย่างยิ่งในการจดจำวัตถุบนท้องถนน (เช่น ยานพาหนะอื่น คนเดินถนน ป้ายจราจร) ตัวอย่างเช่น กล้องอาจจับภาพคนเดินถนนขณะเคลื่อนที่ และคำอธิบายประกอบที่เป็นมนุษย์อาจไม่เห็นด้วยว่าวัตถุนั้นเป็นบุคคลหรือเงา หลักการฉันทามติช่วยให้ระบุป้ายกำกับได้อย่างแม่นยำในสถานการณ์ดังกล่าว


ทีมงาน Keymakr ได้วิเคราะห์วิดีโอที่บันทึกในกล้องเพื่อติดตามยานพาหนะเมื่อไม่นานมานี้ โดยจำเป็นต้องติดตามการเคลื่อนที่ของยานพาหนะผ่านกล้องหลายตัวที่ทางแยก และต้องแน่ใจว่าระบบสามารถระบุยานพาหนะคันเดียวกันในเฟรมที่แตกต่างกันได้อย่างถูกต้อง

กล้องบันทึกวัตถุหนึ่งชิ้น (รถยนต์) ในหลายจุด ผู้เชี่ยวชาญหลายคนดูวิดีโอจากกล้องหลายตัว พวกเขาประเมินว่าวัตถุนี้เป็นรถคันเดียวกันหรือไม่ เนื่องจากอาจมีความแตกต่างในการรับรู้ลักษณะที่ปรากฏ (เช่น ตามสีหรือยี่ห้อ) ข้อมูลดังกล่าวจะถูกใช้เพื่อฝึกโมเดลหากผู้ให้คำอธิบายห้าคนยืนยันตัวตนของวัตถุ มิฉะนั้น ข้อมูลดังกล่าวจะถูกแยกออกจากชุดข้อมูล วิธีนี้ช่วยลดจำนวนการแจ้งเตือนที่ผิดพลาดและเพิ่มความแม่นยำของระบบจดจำรถยนต์ ซึ่งมีความสำคัญต่อระบบความปลอดภัยในเมืองและระบบควบคุมการจราจรอัตโนมัติ



แนวทางเดียวกันนี้สามารถนำไปใช้เพื่อระบุตัวบุคคลในห้างสรรพสินค้าหรือบนท้องถนนได้ กล้องจะจับภาพการเคลื่อนไหวโดยการวิเคราะห์ เช่น สีของเสื้อผ้า ส่วนสูง หรือลักษณะอื่นๆ วิธีนี้ใช้เพื่อ:

  • การตรวจสอบความปลอดภัยที่ได้รับการปรับปรุง
  • การป้องกันอาชญากรรม
  • การวิเคราะห์พฤติกรรมผู้มาเยี่ยมชมร้านค้าปลีก
  • การประเมินการไหลของฝูงชนในพื้นที่สาธารณะ

อนาคตของฉันทามติใน AI

อนาคตของการอธิบายข้อมูลตามฉันทามติมีแนวโน้มที่ดี โดยเฉพาะอย่างยิ่งเมื่อโมเดล AI มีความซับซ้อนมากขึ้นและปริมาณข้อมูลเพิ่มขึ้น ตลาดการอธิบายข้อมูลและการติดฉลากทั่วโลก คาดว่า จะมีมูลค่าถึง 3.6 พันล้านดอลลาร์ภายในปี 2027 และบริษัทหลายแห่งกำลังนำการตรวจสอบการอธิบายข้อมูลแบบหลายชั้นมาใช้เพื่อปรับปรุงคุณภาพข้อมูล การศึกษาแสดงให้เห็นว่าโมเดลที่ฝึกบนชุดข้อมูลที่มีการอธิบายข้อมูลตามฉันทามติแสดงให้เห็นถึงความแม่นยำที่สูงกว่าโมเดลที่ฝึกบนการติดฉลากจากแหล่งเดียวอย่างเห็นได้ชัด


แม้จะมีการพัฒนาระบบการอธิบายประกอบอัตโนมัติและปัญญาประดิษฐ์ แต่ปัจจัยด้านมนุษย์ยังคงมีความสำคัญ: ความเห็นส่วนตัวและความไม่ลงรอยกันของระบบการอธิบายประกอบทำให้จำเป็นต้องมีการตรวจสอบหลายขั้นตอน ดังนั้น วิธีการฉันทามติจะยังคงถูกนำมาใช้ต่อไป เพื่อให้แน่ใจว่าข้อมูลมีความน่าเชื่อถือและลดข้อผิดพลาดในพื้นที่สำคัญๆ เช่น ระบบอัตโนมัติ ยา และการวิเคราะห์ทางการเงิน

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks