कंप्यूटर इंजीनियरिंग और सूचना प्रौद्योगिकी जर्नल

छोटे डेटा के अर्थ और खनन के लिए एक अलग दृष्टिकोण

रयान एच. रिंडलिसबैकर

डेटा माइनिंग में बड़ा डेटा बहुत प्रचलित है, लेकिन यह आम तौर पर केवल बड़े व्यवसायों तक ही सीमित है। छोटे डेटा को आम तौर पर बड़े डेटा का एक उपसमूह माना जाता है। उदाहरण के लिए, Google के पास खोज के लिए उपयोग किए जाने वाले खरबों रिकॉर्ड हैं, लेकिन यह अपने आप में उपयोगी नहीं है। जब कोई Google पर कुछ खोजता है, तो आम तौर पर पहले पेज पर केवल दस से पंद्रह परिणाम ही दिखाए जाते हैं। ऐसा होने के लिए, Google ने बड़ा डेटा लिया और छोटे डेटा का उत्पादन किया। असली मूल्य छोटे डेटा उपसमूहों में है। हालाँकि, यह विचार कि छोटा डेटा बड़े डेटा का उपसमूह है, छोटे डेटा की एकमात्र परिभाषा नहीं है। छोटे व्यवसाय, जो केवल छोटे डेटा का उत्पादन करते हैं, वे भी डेटा माइनिंग प्रथाओं से लाभ उठा सकते हैं। केवल छोटे डेटा को देखने पर क्या समस्याएँ आती हैं?

अस्वीकृति: इस सारांश का अनुवाद कृत्रिम बुद्धिमत्ता उपकरणों का उपयोग करके किया गया है और इसे अभी तक समीक्षा या सत्यापित नहीं किया गया है।