टॉम ज़िमर
सांख्यिकी खनन भविष्य के प्रभावों की अपेक्षा करने के लिए विशाल डेटासेट के अंदर विसंगतियों; शैलियों और सहसंबंधों को खोजने की विधि है। यह परस्पर जुड़े विषयों के तथ्यों, सिंथेटिक इंटेलिजेंस और मशीन लर्निंग को मिलाकर हासिल किया जाता है। वास्तविक दुनिया में सांख्यिकी खनन के उपयोगों, सूचना खनन और विभिन्न संबंधित डेटा कार्यों और डेटा खनन गियर और रणनीतियों के बीच महत्वपूर्ण अंतरों के बारे में अधिक अध्ययन करने के लिए आगे पढ़ें। उदाहरण के लिए, जलवायु पूर्वानुमान मुख्य रूप से सांख्यिकी खनन विधियों पर आधारित है। जलवायु पूर्वानुमान पैटर्न को समझने और वर्ष के समय, जलवायु और विभिन्न चर के आधार पर भविष्य की जलवायु स्थितियों की अपेक्षा करने के लिए ऐतिहासिक अभिलेखों के भंडार का विश्लेषण करता है। यह विश्लेषण एल्गोरिदम या मॉडल में प्रभाव डालता है जो बढ़ती सटीकता के साथ परिणामों की अपेक्षा करने के लिए सांख्यिकी प्राप्त और विश्लेषण करते हैं। रिकॉर्ड एकत्र किए जाते हैं, व्यवस्थित किए जाते हैं और सीधे सूचना गोदाम में लोड किए जाते हैं। तथ्यों को इन-हाउस सर्वर या क्लाउड नॉलेज में संग्रहीत और नियंत्रित किया जाता है। व्यवसाय विश्लेषक और तथ्य वैज्ञानिक रिकॉर्ड के सकल या सतही घरों को देखेंगे और फिर वाणिज्यिक उद्यम द्वारा परिभाषित समस्या कथन के कोण से अधिक गहन मूल्यांकन करेंगे। इसे क्वेरी, रिपोर्टिंग और विज़ुअलाइज़ेशन शिक्षा का उपयोग करके संबोधित किया जाएगा। जैसे ही उपलब्ध डेटा संसाधन दिखाए जाते हैं, उन्हें साफ करना, निर्माण करना और वांछित आकार में स्वरूपित करना होता है। इस स्तर में अतिरिक्त डेटा अन्वेषण को अधिक गहराई से शामिल किया जा सकता है, जो कि पिछले स्तर के भीतर उजागर की गई अंतर्दृष्टि के माध्यम से सूचित किया जाता है।