एआई पूर्वाग्रह क्या है और डेवलपर्स इससे कैसे बच सकते हैं?

आर्टिफिशियल इंटेलिजेंस क्षमताओं का तेजी से विस्तार हो रहा है, एआई का उपयोग अब विज्ञापन से लेकर चिकित्सा अनुसंधान तक उद्योगों में किया जा रहा है। अधिक संवेदनशील क्षेत्रों जैसे चेहरे की पहचान सॉफ्टवेयर, हायरिंग एल्गोरिदम और स्वास्थ्य देखभाल प्रावधान में एआई के उपयोग ने पूर्वाग्रह और निष्पक्षता के बारे में बहस छेड़ दी है।

पूर्वाग्रह मानव मनोविज्ञान का एक अच्छी तरह से शोधित पहलू है। अनुसंधान नियमित रूप से हमारी अचेतन प्राथमिकताओं और पूर्वाग्रहों को उजागर करता है, और अब हम देखते हैं कि AI अपने एल्गोरिदम में इनमें से कुछ पूर्वाग्रहों को दर्शाता है।

तो, कृत्रिम बुद्धि कैसे पक्षपाती हो जाती है? और यह क्यों मायने रखता है?

एआई पक्षपाती कैसे बनता है?

सरलता के लिए, इस लेख में, हम मशीन लर्निंग और डीप लर्निंग एल्गोरिदम को एआई एल्गोरिदम या सिस्टम के रूप में संदर्भित करेंगे।

शोधकर्ता और डेवलपर दो तरह से एआई सिस्टम में पूर्वाग्रह पेश कर सकते हैं।

सबसे पहले, शोधकर्ताओं के संज्ञानात्मक पूर्वाग्रहों को गलती से मशीन लर्निंग एल्गोरिदम में एम्बेड किया जा सकता है। संज्ञानात्मक पूर्वाग्रह अचेतन मानवीय धारणाएं हैं जो प्रभावित कर सकती हैं कि लोग कैसे निर्णय लेते हैं। यह एक महत्वपूर्ण मुद्दा बन जाता है जब पक्षपात लोगों या लोगों के समूहों के संबंध में होता है और उन लोगों को नुकसान पहुंचा सकता है।

इन पूर्वाग्रहों को सीधे लेकिन गलती से पेश किया जा सकता है, या शोधकर्ता एआई को ऐसे डेटासेट पर प्रशिक्षित कर सकते हैं जो स्वयं पूर्वाग्रह से प्रभावित थे। उदाहरण के लिए, चेहरे की पहचान करने वाले AI को एक डेटासेट का उपयोग करके प्रशिक्षित किया जा सकता है जिसमें केवल हल्की चमड़ी वाले चेहरे शामिल होते हैं। इस मामले में, एआई अंधेरे की तुलना में हल्के चमड़ी वाले चेहरों के साथ काम करते समय बेहतर प्रदर्शन करेगा। एआई पूर्वाग्रह के इस रूप को नकारात्मक विरासत के रूप में जाना जाता है।

दूसरे, जब एआई को अधूरे डेटासेट पर प्रशिक्षित किया जाता है, तो पूर्वाग्रह उत्पन्न हो सकते हैं। उदाहरण के लिए, यदि एआई को ऐसे डेटासेट पर प्रशिक्षित किया जाता है जिसमें केवल कंप्यूटर वैज्ञानिक शामिल हैं, तो यह पूरी आबादी का प्रतिनिधित्व नहीं करेगा। यह एल्गोरिदम की ओर जाता है जो सटीक भविष्यवाणियां प्रदान करने में विफल रहता है।

रियल वर्ल्ड एआई बायस के उदाहरण

एआई पूर्वाग्रह के कई हालिया, अच्छी तरह से रिपोर्ट किए गए उदाहरण हैं जो इन पूर्वाग्रहों को रेंगने की अनुमति देने के खतरे को दर्शाते हैं

यूएस-आधारित हेल्थकेयर प्राथमिकता

2019 में, अस्पतालों और बीमा कंपनियों को यह निर्धारित करने में मदद करने के लिए एक मशीन लर्निंग एल्गोरिदम तैयार किया गया था कि कौन से रोगियों को कुछ स्वास्थ्य कार्यक्रमों से सबसे अधिक लाभ होगा। लगभग 200 मिलियन लोगों के डेटाबेस के आधार पर, एल्गोरिथम ने अश्वेत रोगियों की तुलना में श्वेत रोगियों का पक्ष लिया।

यह निर्धारित किया गया था कि यह काले और सफेद लोगों के बीच अलग-अलग स्वास्थ्य देखभाल लागतों के संबंध में एल्गोरिदम में एक दोषपूर्ण धारणा के कारण था, और पूर्वाग्रह अंततः 80% तक कम हो गया था।

कम्पस

वैकल्पिक प्रतिबंधों के लिए सुधारात्मक अपराधी प्रबंधन रूपरेखा, या COMPAS, एक AI एल्गोरिथ्म था जिसे यह अनुमान लगाने के लिए डिज़ाइन किया गया था कि क्या विशेष लोग फिर से अपराध करेंगे। एल्गोरिथ्म ने श्वेत अपराधियों की तुलना में काले अपराधियों के लिए दुगनी झूठी सकारात्मकता उत्पन्न की। इस मामले में, डेटासेट और मॉडल दोनों त्रुटिपूर्ण थे, जिससे भारी पक्षपात हुआ।

वीरांगना

आवेदकों की उपयुक्तता का निर्धारण करने के लिए अमेज़ॅन जिस हायरिंग एल्गोरिदम का उपयोग करता है, वह 2015 में महिलाओं के ऊपर पुरुषों का पक्ष लेने के लिए पाया गया था। ऐसा इसलिए था क्योंकि डेटासेट में लगभग विशेष रूप से पुरुष और उनके रिज्यूमे शामिल थे क्योंकि अधिकांश अमेज़ॅन कर्मचारी पुरुष हैं।

एआई पूर्वाग्रह को कैसे रोकें

एआई पहले से ही हर उद्योग में हमारे काम करने के तरीके में क्रांति ला रहा है । संवेदनशील निर्णय लेने की प्रक्रियाओं को नियंत्रित करने वाली पक्षपाती प्रणाली वांछनीय से कम है। सबसे अच्छे रूप में, यह एआई-आधारित अनुसंधान की गुणवत्ता को कम करता है। कम से कम, यह सक्रिय रूप से अल्पसंख्यक समूहों को नुकसान पहुंचाता है।

मानव संज्ञानात्मक पूर्वाग्रहों के प्रभाव को कम करके मानव निर्णय लेने में सहायता के लिए एआई एल्गोरिदम के उदाहरण पहले से ही उपयोग किए जा रहे हैं। मशीन लर्निंग एल्गोरिदम को कैसे प्रशिक्षित किया जाता है, इस वजह से वे एक ही स्थिति में मनुष्यों की तुलना में अधिक सटीक और कम पक्षपाती हो सकते हैं, जिसके परिणामस्वरूप बेहतर निर्णय लिया जा सकता है।

लेकिन, जैसा कि हमने दिखाया है, विपरीत भी सच है। मानव पूर्वाग्रहों को एआई द्वारा पकाने और प्रवर्धित करने की अनुमति देने के जोखिम कुछ संभावित लाभों से अधिक हो सकते हैं।

दिन के अंत में, एआई केवल उतना ही अच्छा है जितना कि वह डेटा जिसके साथ इसे प्रशिक्षित किया जाता है । निष्पक्ष एल्गोरिदम विकसित करने के लिए डेटासेट के व्यापक और गहन पूर्व-विश्लेषण की आवश्यकता होती है, यह सुनिश्चित करते हुए कि डेटा निहित पूर्वाग्रहों से मुक्त है। यह जितना लगता है उससे कहीं अधिक कठिन है क्योंकि हमारे बहुत से पूर्वाग्रह बेहोश हैं और अक्सर पहचानना मुश्किल होता है।

एआई पूर्वाग्रह को रोकने में चुनौतियां

एआई सिस्टम विकसित करने में, एल्गोरिथ्म में पूर्वाग्रह को एम्बेड करने की क्षमता के लिए हर कदम का मूल्यांकन किया जाना चाहिए। पूर्वाग्रह को रोकने में प्रमुख कारकों में से एक यह सुनिश्चित करना है कि पूर्वाग्रह के बजाय निष्पक्षता, एल्गोरिथम में "पकाया" जाता है।

निष्पक्षता को परिभाषित करना

निष्पक्षता एक अवधारणा है जिसे परिभाषित करना अपेक्षाकृत कठिन है। वास्तव में, यह एक ऐसी बहस है जिस पर कभी सहमति नहीं बन पाई है। चीजों को और अधिक कठिन बनाने के लिए, एआई सिस्टम विकसित करते समय निष्पक्षता की अवधारणा को गणितीय रूप से परिभाषित करना होगा।

उदाहरण के लिए, अमेज़ॅन हायरिंग एल्गोरिथम के संदर्भ में, क्या निष्पक्षता पुरुष से महिला श्रमिकों के पूर्ण 50/50 विभाजन की तरह दिखेगी? या एक अलग अनुपात?

समारोह का निर्धारण

एआई विकास में पहला कदम यह निर्धारित करना है कि यह वास्तव में क्या हासिल करने जा रहा है। यदि COMPAS उदाहरण का उपयोग किया जाता है, तो एल्गोरिथ्म अपराधियों के फिर से अपराध करने की संभावना का अनुमान लगाएगा। फिर, एल्गोरिथ्म को काम करने के लिए सक्षम करने के लिए स्पष्ट डेटा इनपुट को निर्धारित करने की आवश्यकता है। इसके लिए महत्वपूर्ण चरों को परिभाषित करने की आवश्यकता हो सकती है, जैसे कि पिछले अपराधों की संख्या या किए गए अपराधों के प्रकार।

एल्गोरिदम की निष्पक्षता सुनिश्चित करने के लिए इन चरों को ठीक से परिभाषित करना एक कठिन लेकिन महत्वपूर्ण कदम है।

डेटासेट बनाना

जैसा कि हमने कवर किया है, एआई पूर्वाग्रह का एक प्रमुख कारण अधूरा, गैर-प्रतिनिधि या पक्षपाती डेटा है। चेहरे की पहचान एआई के मामले की तरह, मशीन सीखने की प्रक्रिया से पहले पूर्वाग्रह, उपयुक्तता और पूर्णता के लिए इनपुट डेटा की पूरी तरह से जांच की जानी चाहिए।

गुण चुनना

एल्गोरिदम में, कुछ विशेषताओं पर विचार किया जा सकता है या नहीं। विशेषताओं में लिंग, जाति या शिक्षा शामिल हो सकती है—मूल रूप से ऐसी कोई भी चीज़ जो एल्गोरिथम के कार्य के लिए महत्वपूर्ण हो सकती है। किस विशेषताओं के आधार पर चुना जाता है, एल्गोरिदम की भविष्यवाणी सटीकता और पूर्वाग्रह गंभीर रूप से प्रभावित हो सकता है। समस्या यह है कि यह मापना बहुत मुश्किल है कि एल्गोरिदम कितना पक्षपातपूर्ण है।

एआई बायस यहां रहने के लिए नहीं है

एआई पूर्वाग्रह तब होता है जब एल्गोरिदम पक्षपाती इनपुट के कारण पक्षपाती या गलत भविष्यवाणियां करते हैं। यह तब होता है जब एल्गोरिथम के विकास और प्रशिक्षण के दौरान पक्षपाती या अधूरा डेटा परिलक्षित या प्रवर्धित होता है।

अच्छी खबर यह है कि एआई अनुसंधान के लिए धन की वृद्धि के साथ, हमें एआई पूर्वाग्रह को कम करने और यहां तक ​​कि समाप्त करने के नए तरीकों को देखने की संभावना है।