डाटा किसे कहते हैं?

92 बार देखा गया
डेटा कच्चा माल है, जैसे संख्याएँ या तथ्य। ये अपने आप में उपयोगी नहीं होते। जब हम इस डेटा को व्यवस्थित करते हैं और इसका विश्लेषण करते हैं, तभी यह सूचना बन जाती है। "डेटा वह कच्चा माल है जो सूचना बनने के लिए संसाधित किया जाता है।"
प्रतिक्रिया 0 बार पसंद किया गया

डाटा क्या होता है? समझाएँ।

डेटा क्या होता है? सीधा समझो तो, डेटा मतलब कच्चा माल। वो फैक्ट्स और फिगर्स जो अभी तक पके नहीं हैं। जैसे, किसी दुकान में कितने पेन बिके - 50, 100, 25 - ये डेटा है। बस इतना ही। अब ये डेटा तब तक बेकार है जब तक पता न चले कि ये जानकारी कब की है, किस दुकान की है। तब ये इन्फॉर्मेशन बनेगा।

डेटा, इन्फॉर्मेशन, ज्ञान और बुद्धि - ये सब एक-दूसरे से जुड़े हैं, पर अलग-अलग। मेरा मानना है, डेटा पहली सीढ़ी है। फिर उस डेटा को प्रोसेस करके इन्फॉर्मेशन बनाते हैं, जानकारी। फिर उस जानकारी से हम सीखते हैं, ज्ञान हासिल करते हैं। और आखिर में, उस ज्ञान को सही जगह इस्तेमाल करना ही बुद्धि है।

मुझे याद है, 2010 में, मैंने एक एक्सेल शीट बनाई थी। उसमें हर दिन का पेट्रोल का दाम लिखती थी। वो डेटा था। फिर मैंने देखा कि दाम कब बढ़ रहे हैं, कब घट रहे हैं - ये इन्फॉर्मेशन थी। फिर मैंने समझा कि तेल कंपनियां कैसे दाम बढ़ाती हैं - ये ज्ञान था। और फिर मैंने सोचा कि मुझे कब गाड़ी में तेल भरवाना चाहिए ताकि कम पैसे लगे - ये बुद्धि थी। सीधा हिसाब!

डेटा को समझना जरूरी है। ये वो नींव है जिस पर सब कुछ टिका है। ये मत सोचो कि ये बोरिंग है। असली मज़ा तो डेटा को छान-बीनकर कुछ निकालने में है। ये मानो एक खजाना है, बस ढूंढना आना चाहिए।

डेटा प्रकार क्या है डेटा प्रकार का वर्गीकरण दीजिए?

कल रात डेटा वर्गीकरण पे प्रेजेंटेशन देना था, भयानक! सोचा था simple होगा, पर थोड़ा मुश्किल सा लगा। मुझे डेटा के प्रकार समझ आए, लेकिन वर्गीकरण में उलझन हुई।

डेटा के प्रकार: मुझे याद है हमने पाँच मुख्य प्रकार पढ़े थे: संख्यात्मक (numerical), श्रेणीबद्ध (categorical), कालानुक्रमिक (temporal), भौगोलिक (geographical), और पाठात्मक (textual)। संख्यात्मक में उदाहरण के तौर पर बिक्री के आंकड़े, श्रेणीबद्ध में उत्पाद के नाम, कालानुक्रमिक में बिक्री की तारीखें।

वर्गीकरण का सबसे मुश्किल हिस्सा था उसके स्तर तय करना। कंपनी के डेटा को कितने स्तरों में बाँटना है? ये निर्भर करता है कंपनी की नीति और कानूनों पर। जैसे गोपनीय डेटा, संवेदनशील डेटा, सार्वजनिक डेटा।

गोपनीय डेटा में क्या आता है? कर्मचारियों की व्यक्तिगत जानकारी जैसे पैन कार्ड नंबर, बैंक डिटेल्स। संवेदनशील में फिर क्या आएगा? ये तो बहुत जटिल है। शायद ग्राहकों की मेडिकल रिपोर्ट्स या वित्तीय रिकॉर्ड्स। सार्वजनिक डेटा में वैसे ज़्यादा सोचने की ज़रूरत नहीं है। ये वो डेटा होगा जिसको कोई भी देख सकता है।

फ़िर ये सारा डेटा कैसे स्टोर करना है? कौन सी फ़ाइलें किस सर्वर पे? ये सब सोचते-सोचते मेरा सिर घूम गया। मुझे लगता है मुझे ये सब फ़िर से पढ़ना पड़ेगा। यह काम आसान नहीं है।

डाटा क्या है और कितने प्रकार के होते हैं?

डेटा, मूल रूप से, अपरिष्कृत तथ्य और आंकड़े हैं। जब इस डेटा को व्यवस्थित और व्याख्यायित किया जाता है, तो यह सूचना बन जाता है, जो ज्ञान और समझ प्रदान करती है। डेटा के प्रकारों को इस प्रकार वर्गीकृत किया जा सकता है:

  • संख्यात्मक डेटा: यह मात्रात्मक डेटा है जिसमें संख्याएँ शामिल होती हैं, जिनका उपयोग गणना और माप के लिए किया जा सकता है। उदाहरण के लिए, किसी उत्पाद की कीमत, किसी व्यक्ति की आयु, या किसी शहर की जनसंख्या। संख्यात्मक डेटा को आगे असतत (discrete) और सतत (continuous) डेटा में विभाजित किया जा सकता है। असतत डेटा पूर्णांक होते हैं, जबकि सतत डेटा कोई भी मान ले सकते हैं।

  • वर्णानुक्रमिक डेटा: इसमें अक्षर, प्रतीक और विशेष वर्ण शामिल होते हैं। यह डेटा आमतौर पर नाम, पते और विवरण जैसी गैर-संख्यात्मक जानकारी का प्रतिनिधित्व करने के लिए उपयोग किया जाता है। वर्णानुक्रमिक डेटा का विश्लेषण पैटर्न और रुझानों को उजागर करने के लिए किया जा सकता है, लेकिन इसे सीधे गणितीय गणनाओं में उपयोग नहीं किया जा सकता है।

  • अक्षरांकीय डेटा: यह वर्णानुक्रमिक और संख्यात्मक डेटा का संयोजन है। इसका उपयोग आईडी, कोड और अन्य मिश्रित प्रारूप वाली जानकारी का प्रतिनिधित्व करने के लिए किया जाता है। उदाहरण के लिए, एक उत्पाद कोड जिसमें अक्षर और संख्याएँ दोनों शामिल हों।

डेटा का वर्गीकरण महत्वपूर्ण है क्योंकि यह डेटा विश्लेषण और प्रसंस्करण के लिए उपयुक्त तकनीकों के चयन में मदद करता है। डेटा का प्रकार यह भी निर्धारित करता है कि इसे कैसे संग्रहीत और प्रबंधित किया जाना चाहिए। जिस तरह दर्शन में अनुभववाद ज्ञान के लिए इंद्रियों पर निर्भर करता है, उसी तरह डेटा विश्लेषण वास्तविक दुनिया को समझने के लिए डेटा पर निर्भर करता है।