परमाणु ऊर्जा विज्ञान और विद्युत उत्पादन प्रौद्योगिकी जर्नल

पाठ निष्कर्षण के लिए ज्ञान-आधारित डेटा निष्कर्षण विधियों का उपयोग

अरुण बी प्रसाद, विकास राववादी, ए प्रकाश, पवित्रा एम, ए वेलायुधम और एमडी साजिद अनवर

इंटरनेट पर उपलब्ध अकादमिक पत्रों की उपलब्ध जानकारी को संयोजित करना अकादमिक शोध में एक महत्वपूर्ण कार्य है। उद्धरण कार्यों के लिए मुख्य जोर जानकारी एकत्र करना डेटा के विभिन्न माध्यमिक स्रोतों के माध्यम से सामग्री के विकास के लिए आवश्यक है। इस कार्य में, हम डेटा प्राप्त करने के लिए एक समझ विधि का उपयोग करते हैं, जिसमें छात्र जर्नल डेटा माइनिंग एल्गोरिदम पर ध्यान केंद्रित किया जाता है। हम डेटा स्रोत को यांत्रिक रूप से प्राप्त करने के लिए INFO-MAP नामक एक ज्ञानात्मक सूचना पुनर्प्राप्ति योजना का उपयोग करते हैं। निष्कर्ष बताते हैं कि हम एक साथ INFO-MAP का उपयोग करके कई उद्धरण प्रारूपों से लेखक, नाम, प्रकाशन, वॉल्यूम, अंक, तिथि और पृष्ठों की जानकारी ठीक से प्राप्त कर सकते हैं। जीनोमिक्स डेटाबेस के लिए संदर्भ पुनर्प्राप्ति की औसत कुल क्षेत्र विश्वसनीयता 6 उद्धरण श्रेणियों के लिए 97.87% है।

अस्वीकृति: इस सारांश का अनुवाद कृत्रिम बुद्धिमत्ता उपकरणों का उपयोग करके किया गया है और इसे अभी तक समीक्षा या सत्यापित नहीं किया गया है।