कीवर्डहरू -

किन टिकटकलाई तपाईंलाई के चाहिन्छ, तपाईंले माग्नुअघि नै थाहा हुन्छ ? सिफारिस एल्गोरिदम कसरी काम गर्छ ?

सिफारिस एल्गोरिदमहरूको भित्री संसार

किन टिकटकलाई तपाईंलाई के चाहिन्छ, तपाईंले माग्नुअघि नै थाहा हुन्छ ? सिफारिस एल्गोरिदम कसरी काम गर्छ ?

काठमाडौं । साँझ पर्न लागेको छ । भान्साबाट चिया उम्लिएको बासना आइरहेको छ । एकछिन मोबाइल खोल्नुभयो, टिकटक स्क्रोल गर्न थाल्नुभयो, र अचानक एउटा भिडियो आयो, पुरानो नेपाली लोक गीतको नयाँ रिमिक्स ।

वर्षौँदेखि नसुनेको धुन, तर कतै मनको कुनामा अझै पनि सम्झनाको रुपमा रहेको छ । अर्को भिडियोमा उही जुत्ताको अनबक्सिङ, जुन तपाईंले भोलि किन्ने सोच बनाइसक्नुभएको थियो । त्यतिबेला लाग्छ, टिकटक लगायतका सामाजिक सञ्जालले तपाईंको मन पढिरहेको छ । तर वास्तवमा त्यो जादू होइन । त्यो हो, सिफारिस एल्गोरिदमको सूक्ष्म, तीक्ष्ण र निरन्तर चलिरहने गणना ।

आज हामीले हेर्ने नेटफ्लिक्स, सुन्ने स्पोटिफाई, खोल्ने यूट्यूब र स्क्रोल गर्ने टिकटक, यी सबै प्लेटफर्महरू अब केवल सामाग्री राख्ने ठाउँ मात्र होइनन् । यी सबै हाम्रो रुचि पढ्ने, बुझ्ने र अनुमान गर्ने डिजिटल दिमागजस्ता बनेका छन् । अनि तीमध्ये पनि टिकटकले यो खेललाई सबैभन्दा तीव्र बनाएको छ । प्रश्न यही हो: टिकटकलाई तपाईंले के चाहिन्छ भन्ने कुरा तपाईंले बुझ्नुअघि नै कसरी थाहा हुन्छ ?
null

यो कथा टिकटकबाट सुरु भएको होइन । यसको जरा इन्टरनेटको प्रारम्भिक दशकसम्म पुग्छ । जब १९९० को दशकमा इन्टरनेट विस्तार हुँदै गयो, सूचनाको मात्रा यति धेरै बढ्यो कि मानिसलाई आफूलाई चाहिएको कुरा भेट्टाउनै मुस्किल हुन थाल्यो । एउटा फिल्म, एउटा गीत, एउटा समाचार, एउटा पुस्तक, सबै कुरा देखिने तर छान्न गाह्रो । यही समस्याबाट जन्मियो सिफारिस प्रणाली (Algorithm Suggestion) को विचार ।

सुरुवाती चरणमा content-based filtering प्रयोग गरिन्थ्यो । यसको अर्थ सरल थियो, मानिसले पहिले जे मन पराएको छ, त्यसैसँग मिल्ने अर्को वस्तु देखाउने । उदाहरणका लागि, तपाईंले एक्शन फिल्म मन पराउनुभएको छ भने अर्को एक्शन फिल्म सुझाउने ।

पछि collaborative filtering आयो । यसले अर्को महत्वपूर्ण कुरा भन्यो: “तपाईं जस्तै अरू मानिसले जे मन पराए, त्यो तपाईंलाई पनि मन पर्न सक्छ ।” यही विचारले सिफारिस प्रणालीलाई व्यक्तिगत अनुमानबाट सामूहिक बुद्धिमत्तातर्फ धकेल्यो । यहीँबाट सुरु भयो आधुनिक सिफारिस प्रविधिको लामो यात्रा ।

null

नेटफ्लिक्सले बदलिदियो नियम

सिफारिस प्रणालीलाई व्यावसायिक रूपमा चर्चित बनाउने नाम हो, नेटफ्लिक्स ।

सन् २००६ मा नेटफ्लिक्सले एउटा ऐतिहासिक चुनौती घोषणा गर्‍यो । उसले आफ्नै सिफारिस प्रणालीभन्दा १० प्रतिशत राम्रो अनुमान गर्ने मोडेल बनाउनेलाई एक मिलियन डलर पुरस्कार दिने भन्यो । त्यो केवल प्रतियोगिता थिएन; त्यो एउटा सन्देश थियो, अब दर्शकलाई कुन फिल्म देखाउने भन्ने कुरा साधारण सूची मिलाएर हुँदैन, त्यसका लागि गहिरो गणना चाहिन्छ ।

वर्षौँको प्रतिस्पर्धापछि matrix factorization जस्ता प्रविधिले बाटो खोल्यो । यसले प्रयोगकर्ता र फिल्मलाई सानो–साना लुकेका आयाममा भाँचेर बुझ्न थाल्यो । कसैलाई भावनात्मक कथा मन पर्छ, कसैलाई चाँडो गति भएको सामग्री, कसैलाई हल्का हास्य मिसिएको फिल्म । बाहिरबाट देखिने कुरा फरक हुन सक्छन्, तर भित्र लुकेको रुचि एउटै गणनाबाट समातिन्छ ।

आज नेटफ्लिक्सका सिफारिसहरू केवल “के हेर्नुहुन्छ ?” भन्ने प्रश्नको जवाफ होइनन् । ती प्रयोगकर्तालाई लामो समय टिकाइराख्ने रणनीति पनि हुन् । कुन सामाग्रीको पोस्टर देखाउने, कुन शीर्षक देखाउने, कुन अनुहार अगाडि ल्याउने, यी सबै कुरा व्यक्तिगत रूपमा फरक पारिन्छ । यही कारणले नेटफ्लिक्सले हामीलाई बारम्बार “यो त मैले हेर्नै पर्छ” भन्ने भाव दिन सफल भएको छ ।
null

यूट्यूबले सिकायो स्केल कसरी चलाउने

नेटफ्लिक्सले व्यक्तिगत रुचि बुझ्न मद्दत गर्‍यो भने यूट्यूबले अर्को समस्या देखायो, अर्बौँ भिडियोमध्ये कुन देखाउने ?

यूट्यूबमा चुनौती केवल सिफारिस गर्नु थिएन । चुनौती थियो, विशाल सामग्रीलाई कसरी केही सेकेन्डभित्र छान्ने । यही समस्या समाधान गर्न गूगलले दुई-चरणीय मोडेल विकास गर्‍यो। पहिलो चरणमा एल्गोरिदमले धेरै सामग्रीमध्ये सम्भावित भिडियोहरू छान्छ । दोस्रो चरणमा ती भिडियोहरूलाई क्रम मिलाएर तपाईंको लागि उपयुक्त बनाइन्छ ।

यूट्यूबको एल्गोरिदमले हेराइको इतिहास, खोजिएको शब्द, भिडियोमा बिताइएको समय, लाइक, कमेन्ट, स्किप, र पुनःहेराइलाई सबैलाई संकेतका रूपमा प्रयोग गर्छ । तपाईं कुन विषयमा कति बेर रोकनुहुन्छ, कुन सामग्री छोडेर जानुहुन्छ, कुन भिडियो फेरि हेर्न खोज्नुहुन्छ, यी साना व्यवहारहरूले नै तपाईंको डिजिटल प्रोफाइल बनाउँछन् ।

अझ रोचक कुरा के भने, यूट्यूबले “कति सान्दर्भिक ?” मात्र होइन, “कति लामो समयसम्म रोक्न सक्छ ?” भन्ने हिसाब पनि गर्छ । त्यसैले कहिले काहीँ तपाईंले सोचेको भन्दा फरक भिडियो पनि त्यही कारण देखिन्छ, किनकि एल्गोरिदमले तपाईंको ध्यान समात्ने अर्को ढोका खोजिरहेको हुन्छ ।

null

स्पोटिफाईले संगीतलाई व्यवहारसँग जोड्यो

सिफारिसको संसारमा स्पोटिफाईको प्रवेश अलि फरक थियो । संगीत केवल सुन्ने कुरा होइन; त्यो मुड, स्मृति, समय, वातावरण र बानीको मिश्रण हो ।

स्पोटिफाईको Discover Weekly प्रत्येक हप्ता तपाईंका लागि नयाँ गीतहरूको सूची लिएर आउँछ । तर यो केवल तपाईंले सुनेका गीतहरूकै पुनरावृत्ति होइन । यसले तपाईंको सुन्ने बानी, तपाईंजस्तै स्वाद भएका अरू प्रयोगकर्ताको व्यवहार, अनि गीतको आवाज, गति, शैली र संरचना समेत पढ्छ ।

कहिलेकाहीँ तपाईंलाई लाग्छ, “मलाई यो कलाकारबारे केही थाहा थिएन, तर यो गीत किन यति मिल्यो ?” यही नै स्पोटिफाईको कौशल हो । उसले तपाईंलाई आफूले नचिनेको, तर तपाईंकै स्वादसँग मिल्ने धुन सुनाउँछ ।

यसमा केवल डेटा छैन; सन्दर्भ पनि छ । कहिले कुन बेला कुन प्रकारको संगीत सुन्नुहुन्छ, कुन गीत फेरि सुन्नुहुन्छ, कुनमा छोड्नुहुन्छ, यी सबै कुरा सिफारिसको हिस्सा बन्छन् ।

null

टिकटक: जहाँ एल्गोरिदमले सबैभन्दा छिटो सिक्छ

अब मूल केन्द्रमा फर्कौं, टिकटक ।

टिकटकको शक्ति यसको छोटो भिडियोमा मात्र छैन, त्यसको सिक्ने गतिमा छ । तपाईंले कुनै भिडियो पूरै हेर्नुभयो की भएन, बीचमै स्किप गर्नुभयो की फेरि हेर्नुभयो, लाइक गर्नुभयो कि नगरेरै अगाडि बढ्यौं, टिकटकले यी सबै कुरा तुरुन्तै पढ्छ । र त्यसै आधारमा अर्को भिडियो छान्न थाल्छ ।

यसको For You Page कुनै स्थिर सूची होइन । त्यो तपाईंले हरेक सेकेन्डमा दिएको संकेतबाट फेरिँदै जाने जीवित फिड हो । तपाईंले देखाउन चाहेकोभन्दा तपाईंले वास्तवमै केमा रोकिनुहुन्छ भन्ने कुरा टिकटकका लागि बढी महत्वपूर्ण हुन्छ ।

टिकटकले भिडियोको क्याप्सन, ह्यासट्याग, आवाज, दृश्य, अनुहार, हाउभाउ, कपडा, विषय र प्रयोगकर्ताको व्यवहार; सबैलाई एकैसाथ पढ्न खोज्छ। त्यसैले कुनै भिडियोले तपाईंको ध्यान अलिकति पनि समात्यो भने, एल्गोरिदमले त्यसलाई एउटा सन्देश ठान्छ।

त्यसपछि उसले त्यो सन्देशलाई दोहोर्‍याएर पुष्टि गर्छ । अनि अर्को, अर्को, र अर्को भिडियो त्यसैअनुसार आउन थाल्छ । केही मिनेटमै तपाईंको फिड एउटा अनौठो रूपमा व्यक्तिगत संसार बन्न पुग्छ ।

यही कारण हो, टिकटकले तपाईंलाई “के चाहिएको छ” भन्ने उत्तर खोजेर होइन, “तपाईं कुन कुरामा रोकनुहुन्छ ?” भन्ने प्रश्नको उत्तर खोजेर काम गर्छ ।

रुचि पहिचान होइन, रुचि निर्माण

टिकटकको सबैभन्दा रोचक पक्ष के हो भने यसले केवल तपाईंको रुचि पहिचान गर्दैन; कहिलेकाहीँ त त्यो रुचि निर्माण पनि गरिदिन्छ ।

तपाईं सुरुमा कुनै विषयमा खासै चासो राख्नुहुन्न । तर केही भिडियोहरू दोहोरिएर आउँछन् । एकचोटि हेरिन्छ, अर्कोचोटि अलि लामो हेरिन्छ, त्यसपछि लाइक, कमेन्ट, सेयर र विस्तारै त्यही विषय तपाईंको नयाँ रुचि बनिदिन्छ । त्यो मौरीपालन होस्, नेपाली कला होस्, पुराना फिल्म हुन्, वा कुनै DIY सीप एल्गोरिदमले तपाईंलाई तपाईंमै अझ नयाँ तह देखाइदिन्छ । 

यो नै सिफारिस प्रणालीको आकर्षण हो । उसले तपाईंलाई केवल मनपर्ने कुरा देखाउँदैन; कहिले काहीँ तपाईंले मन पराउन सुरु गर्ने कुरा पनि उसैले बाटो देखाइदिन्छ ।

तर यो सहजताभित्र एउटा जोखिम पनि छ

यो सुविधा आकर्षक छ । छरितो छ । मनपर्ने सामाग्री तुरुन्तै भेटिन्छ । समय बचत हुन्छ । तर यसैसँग एउटा जोखिम पनि जोडिएको छ, फिल्टर बबल ।

जब एल्गोरिदमले बारम्बार तपाईंलाई उस्तै प्रकारको सामग्री मात्र देखाउँछ, तपाईं फरक विचार, नयाँ शैली, वा असहज तर आवश्यक दृष्टिकोणबाट टाढा हुन थाल्नुहुन्छ । तपाईंको डिजिटल संसार साँघुरो हुँदै जान्छ। यही कारणले अहिले धेरै प्लेटफर्महरू पारदर्शितातर्फ धकेलिँदै छन् । प्रयोगकर्तालाई फिड कसरी बनाइन्छ, कुन आधारमा सामाग्री छानिन्छ, किन एउटै किसिमको भिडियो दोहोरिन्छ, यी प्रश्नहरू अब महत्त्वपूर्ण हुँदै गएका छन् ।

सिफारिस एल्गोरिदमहरू अब हाम्रो डिजिटल जीवनका अदृश्य सम्पादकजस्तै बनेका छन् । तिनले हाम्रा बानी पढ्छन्, हाम्रो रुचि नाप्छन्, र कहिलेकाहीँ हाम्रो चाहनाभन्दा चाँडो चाहना अनुमान गर्छन् ।

तर यो बुझ्नुपर्ने कुरा हो, एल्गोरिदमले हाम्रो इच्छा बनाउँदैन; उसले हाम्रो व्यवहार पढ्छ । हामीले के हेर्‍यौं, कति बेर रोकियौं, के छोड्यौं, के दोहोर्‍यायौं, यिनै साना व्यवहारहरूबाट ऊ हामीलाई बुझ्ने प्रयास गर्छ ।

त्यसैले टिकटकलाई तपाईंले माग्नुअघि नै के चाहिन्छ भनेर थाहा हुन्छ जस्तो लाग्नु कुनै जादू होइन । त्यो हो; डेटा, व्यवहार, गणना र निरन्तर सिकाइको परिणाम ।

र सायद यही नै आजको डिजिटल युगको सबैभन्दा ठूलो सत्य हो: हामीले मात्र सामग्री हेर्दैनौँ , सामाग्रीले पनि हामीलाई हेर्छ ।