डेटा माइनिंग कंप्यूटर सहायता प्राप्त प्रक्रिया द्वारा बड़े डेटा वेयरहाउस से डेटा के संबंध में ज्ञान की खोज करना है। डेटा माइनिंग उपकरण ज्ञान-संचालित निर्णयों के साथ भविष्य के रुझानों और व्यवहारों में मदद करते हैं और मौजूदा सूचना संसाधनों और नए उत्पादों और प्रणालियों से जुड़े मूल्य को बढ़ाने के लिए मौजूदा सॉफ्टवेयर और हार्डवेयर प्लेटफार्मों पर काम करते हैं।
यह क्षेत्र बड़े डिजिटल संग्रहों का विश्लेषण करने के लिए डेटाबेस प्रबंधन के साथ सांख्यिकी और कृत्रिम बुद्धिमत्ता (जैसे तंत्रिका नेटवर्क और मशीन लर्निंग) के उपकरणों को जोड़ता है, जिन्हें डेटा सेट के रूप में जाना जाता है।
डेटा माइनिंग का उपयोग व्यापक रूप से व्यवसाय (बीमा, बैंकिंग, खुदरा), विज्ञान अनुसंधान (खगोल विज्ञान, चिकित्सा), और सरकारी सुरक्षा (अपराधियों और आतंकवादियों का पता लगाने) में किया जाता है।