रयान एच. रिंडलिसबैकर
डेटा माइनिंग में बड़ा डेटा बहुत प्रचलित है, लेकिन यह आम तौर पर केवल बड़े व्यवसायों तक ही सीमित है। छोटे डेटा को आम तौर पर बड़े डेटा का एक उपसमूह माना जाता है। उदाहरण के लिए, Google के पास खोज के लिए उपयोग किए जाने वाले खरबों रिकॉर्ड हैं, लेकिन यह अपने आप में उपयोगी नहीं है। जब कोई Google पर कुछ खोजता है, तो आम तौर पर पहले पेज पर केवल दस से पंद्रह परिणाम ही दिखाए जाते हैं। ऐसा होने के लिए, Google ने बड़ा डेटा लिया और छोटे डेटा का उत्पादन किया। असली मूल्य छोटे डेटा उपसमूहों में है। हालाँकि, यह विचार कि छोटा डेटा बड़े डेटा का उपसमूह है, छोटे डेटा की एकमात्र परिभाषा नहीं है। छोटे व्यवसाय, जो केवल छोटे डेटा का उत्पादन करते हैं, वे भी डेटा माइनिंग प्रथाओं से लाभ उठा सकते हैं। केवल छोटे डेटा को देखने पर क्या समस्याएँ आती हैं?