एडम मोहम्मद अली फदलल्ला
डेटा माइनिंग डेटा में वैध, नवीन, उपयोगी और समझने योग्य पैटर्न की पहचान करने और बड़ी मात्रा में डेटा से डेटा पैटर्न या ज्ञान के उपयोगी सारांशों को निकालने या खोजने की प्रक्रिया है और इसे डेटाबेस में KDD ज्ञान खोज भी कहा जाता है। KDD प्रक्रिया में डेटा की सफाई, डेटा माइनिंग, डेटा चयन, परिवर्तन, डेटा एकीकरण, पैटर्न मूल्यांकन और ज्ञान प्रस्तुति शामिल है। यह टेराबाइट्स से पेटाबाइट्स तक डेटा की एक विस्फोटक वृद्धि है। कई विषयों के संगम में मशीन लर्निंग, सांख्यिकी, आर्टिफिशियल इंटेलिजेंस, विज़ुअलाइज़ेशन, हाई परफॉरमेंस कंप्यूटिंग, डेटाबेस टेक्नोलॉजी, एल्गोरिदम, पैटर्न पहचान शामिल हैं, इसके अनुप्रयोगों में जैविक और चिकित्सा डेटा विश्लेषण शामिल हैं: वर्गीकरण, क्लस्टर विश्लेषण और माइक्रोएरे डेटा विश्लेषण, वेब माइनिंग