कंप्यूटर इंजीनियरिंग और सूचना प्रौद्योगिकी जर्नल

रैंडम फ़ॉरेस्ट स्पैम ईमेल वर्गीकरण प्रणाली

खोंगबंताबम सुशीला देवी

ईमेल एक तेज़ संचार उपकरण है और उपयोगकर्ताओं के लिए किफ़ायती है। इसके विपरीत, पिछले कुछ समय में ईमेल उपयोगकर्ताओं की संख्या में वृद्धि के कारण स्पैम मेल की संख्या में तीव्र वृद्धि हुई है। स्पैम मेल की यह समस्या इंटरनेट के साथ होने वाले बड़े जोखिमों में से एक है। स्पैम मेल की बढ़ती संख्या के कारण भरोसेमंद एंटी-स्पैम फ़िल्टर का महत्व बढ़ गया है। आमतौर पर स्पैमर विभिन्न प्राप्तकर्ताओं को अवांछित और अनचाहे ईमेल भेजते हैं और ये स्पैम मेल अपनी विशेषताओं में अधिकतर एक जैसे होते हैं। इसलिए एक ऐसी सुरक्षा प्रणाली तैयार करना आवश्यक है जो स्पैम मेल को प्रभावी ढंग से खोज सके और स्टैंड-अलोन फ़िल्टर के लिए एक वैकल्पिक प्रक्रिया प्रदान कर सके। इस प्रकार, इस पत्र में विशेषता आधारित यादृच्छिक वन वर्गीकरण का उपयोग करके ईमेल को स्पैम और हैम मेल में वर्गीकृत करने के लिए एक नया ढाँचा प्रस्तावित किया गया है। प्रक्रिया प्रत्येक टोकन के लिए बायेसियन स्पैमनेस संभावना गणना से शुरू होती है, TF-IDF भार योजना प्रत्येक टोकन और मेल के लिए भार की गणना करती है, आनुवंशिक फिटनेस के आधार पर स्कोर गणना की जाती है और अंत में ईमेल को स्पैम और हैम ईमेल में वर्गीकृत करने के लिए रैंडम फ़ॉरेस्ट क्लासिफायर का उपयोग करके वर्गीकरण प्रक्रिया की जाती है। परिणामों की तुलना वर्गीकरण सटीकता, भारित सटीकता और F1 माप के संदर्भ में मौजूदा स्पैम वर्गीकरण विधियों से की जाती है। परिणाम बताते हैं कि प्रस्तावित प्रणाली अन्य मौजूदा एल्गोरिदम के साथ तुलना करने पर आशाजनक परिणाम दिखाती है।

अस्वीकृति: इस सारांश का अनुवाद कृत्रिम बुद्धिमत्ता उपकरणों का उपयोग करके किया गया है और इसे अभी तक समीक्षा या सत्यापित नहीं किया गया है।