paint-brush
टाइटैनिक पर किसी के जीवित बचने की कितनी संभावना थी?द्वारा@dotslashbit
3,501 रीडिंग
3,501 रीडिंग

टाइटैनिक पर किसी के जीवित बचने की कितनी संभावना थी?

द्वारा Sahil12m2023/08/09
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

क्या वर्ग भेद ने जहाज पर सवार लोगों के भाग्य का निर्धारण करने, विशेषाधिकार और खतरे के बीच विभाजन पैदा करने में कोई भूमिका निभाई? उम्र और लिंग ने कैसे प्रभावित किया कि कौन बच गया और कौन निरंतर समुद्र की भेंट चढ़ गया? अराजकता के बीच, क्या परिवार के सदस्यों की उपस्थिति ने आराम और सहायता प्रदान की, यात्रियों से एक साथ तूफान का सामना करने का आग्रह किया? और क्या आरोहण के बंदरगाह ने उन लोगों की नियति को प्रभावित किया जो विभिन्न स्थानों से चढ़े थे? शुक्र है, हम कागल पर उपलब्ध टाइटैनिक डेटासेट का उपयोग करके इन सवालों का जवाब दे सकते हैं। इसके डूबने के सौ से अधिक वर्षों के बाद, हम डेटा का उपयोग यह समझने के लिए कर सकते हैं कि टिकट की कीमत ने जीवित रहने को कैसे प्रभावित किया होगा और क्या कुछ केबिन स्थानों ने दुखद घटनाओं के दौरान आश्रय प्रदान किया था। यह खोजपूर्ण डेटा विश्लेषण (ईडीए) यात्रियों के अनुभवों के बारे में अंतर्दृष्टि प्रकट करेगा, उस भयावह रात में उनके साहस और नुकसान की कहानियों पर प्रकाश डालेगा।
featured image - टाइटैनिक पर किसी के जीवित बचने की कितनी संभावना थी?
Sahil HackerNoon profile picture
0-item
1-item

1912 में आरएमएस टाइटैनिक का डूबना इतिहास की सबसे घातक समुद्री आपदाओं में से एक है। जब जहाज एक हिमखंड से टकराकर उत्तरी अटलांटिक महासागर में डूब गया तो 1,500 से अधिक लोगों की जान चली गई। इसके बाद के वर्षों में, उच्च मृत्यु दर में योगदान देने वाले कारकों को समझने के लिए व्यापक शोध किया गया है।


इस विनाशकारी घटना में केवल 38% यात्री ही बच पाए, जिससे मुझे उन व्यक्तियों के बारे में आश्चर्य हुआ जो उस भयानक रात टाइटैनिक पर सवार थे।


क्या वर्ग भेद ने जहाज पर सवार लोगों के भाग्य का निर्धारण करने, विशेषाधिकार और खतरे के बीच विभाजन पैदा करने में कोई भूमिका निभाई? उम्र और लिंग ने कैसे प्रभावित किया कि कौन बच गया और कौन निरंतर समुद्र की भेंट चढ़ गया? अराजकता के बीच, क्या परिवार के सदस्यों की उपस्थिति ने आराम और सहायता प्रदान की, यात्रियों से एक साथ तूफान का सामना करने का आग्रह किया? और क्या आरोहण के बंदरगाह ने उन लोगों की नियति को प्रभावित किया जो विभिन्न स्थानों से चढ़े थे?


शुक्र है, हम कागल पर उपलब्ध टाइटैनिक डेटासेट का उपयोग करके इन सवालों का जवाब दे सकते हैं। इसके डूबने के सौ से अधिक वर्षों के बाद, हम डेटा का उपयोग यह समझने के लिए कर सकते हैं कि टिकट की कीमत ने जीवित रहने को कैसे प्रभावित किया होगा और क्या कुछ केबिन स्थानों ने दुखद घटनाओं के दौरान आश्रय प्रदान किया था। यह खोजपूर्ण डेटा विश्लेषण (ईडीए) यात्रियों के अनुभवों के बारे में अंतर्दृष्टि प्रकट करेगा, उस भयावह रात में उनके साहस और नुकसान की कहानियों पर प्रकाश डालेगा।

प्रश्न/अंतर्दृष्टि

यहां कुछ जानकारियां दी गई हैं जिन्हें हम विश्लेषण के दौरान तलाशेंगे:


  1. टाइटैनिक पर यात्रियों की कुल जीवित रहने की दर क्या है?
  2. लिंग के आधार पर जीवित रहने की दर कैसे भिन्न होती है? क्या पुरुषों की तुलना में महिलाओं के जीवित रहने की संभावना अधिक है?
  3. टाइटैनिक पर यात्रियों की आयु का वितरण क्या है? क्या कोई उल्लेखनीय पैटर्न हैं?
  4. क्या विभिन्न यात्री श्रेणियों (पहली, दूसरी, तीसरी) के यात्रियों की जीवित रहने की दर अलग-अलग थी?
  5. विभिन्न आयु समूहों (जैसे, बच्चे, वयस्क, बुजुर्ग) के बीच जीवित रहने की दर क्या है?
  6. क्या आरोहण के बंदरगाह ने जीवित रहने की संभावना को प्रभावित किया?
  7. परिवार की उपस्थिति जीवित रहने की दर को कैसे प्रभावित करती है?
  8. क्या अधिक किराए वाले यात्रियों के बचने की बेहतर संभावना थी?
  9. यात्री केबिन स्थानों का वितरण क्या है? क्या कुछ केबिनों में यात्रियों की जीवित रहने की दर अधिक थी?

आंकड़े

टाइटैनिक डेटासेट आरएमएस टाइटैनिक के यात्रियों और चालक दल के बारे में डेटा का एक संग्रह है, जो 1912 में डूब गया था। डेटासेट में प्रत्येक यात्री के नाम, उम्र, लिंग, टिकट वर्ग और क्या वे डूबने से बच गए थे, के बारे में जानकारी शामिल है। टाइटैनिक डेटासेट मशीन लर्निंग और डेटा विज्ञान परियोजनाओं के लिए एक लोकप्रिय डेटासेट है। इसका उपयोग अक्सर मॉडलों को प्रशिक्षित करने के लिए किया जाता है ताकि यह अनुमान लगाया जा सके कि यात्री अपनी विशेषताओं के आधार पर डूबने से बच गए या नहीं। टाइटैनिक डेटासेट का उपयोग सामाजिक नेटवर्क और मानव व्यवहार का अध्ययन करने के लिए भी किया जाता है।


टाइटैनिक डेटासेट एक डेटा विज्ञान समुदाय कागल द्वारा बनाया गया था। डेटासेट कागल वेबसाइट पर मुफ्त डाउनलोड के लिए उपलब्ध है।


आप यहां डेटासेट प्राप्त कर सकते हैं

आवश्यक शर्तें

  • पांडा
  • matplotlib
  • सीबॉर्न

डेटा लोड हो रहा है

आइए आवश्यक मॉड्यूल और टाइटैनिक डेटासेट लोड करके अपना विश्लेषण शुरू करें

 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Load the Titanic dataset df = pd.read_csv('/kaggle/input/titanic/train.csv') df.head() 

टाइटैनिक डेटासेट पहली 5 पंक्तियाँ

आप देख सकते हैं कि इस डेटासेट में प्रत्येक यात्री के बारे में सारी जानकारी शामिल है जिसकी चर्चा मैंने इस लेख के परिचय अनुभाग में की है।


अब, आइए पांडा का उपयोग करके अपना विश्लेषण शुरू करें और मैटप्लोटलिब और सीबॉर्न का उपयोग करके अंतर्दृष्टि की कल्पना करें।

अन्वेषणात्मक डेटा विश्लेषण

टाइटैनिक पर यात्रियों की कुल जीवित रहने की दर क्या है?

 # Calculate the overall survival rate survival_rate = df['Survived'].mean() * 100 # Create a bar plot to visualize the survival rate sns.set(style='darkgrid') plt.figure(figsize=(6, 4)) sns.countplot(x='Survived', data=df) plt.xlabel('Survived') plt.ylabel('Passenger Count') plt.title('Survival Rate: {:.2f}%'.format(survival_rate)) plt.xticks([0, 1], ['No', 'Yes']) plt.show() 

प्रतिशत यात्री बच गए

बार प्लॉट टाइटैनिक पर यात्रियों की समग्र जीवित रहने की दर का स्पष्ट और संक्षिप्त दृश्य प्रतिनिधित्व प्रदान करता है। इससे पता चलता है कि केवल 38% यात्री ही इस आपदा से बच पाए।


सलाखों की ऊंचाई प्रत्येक श्रेणी में यात्रियों की संख्या दर्शाती है (गैर-जीवित लोगों के लिए 0 और जीवित बचे लोगों के लिए 1)। कथानक के शीर्षक में दर्शाई गई जीवित रहने की दर, दुखद घटना में जीवित बचे यात्रियों के प्रतिशत पर प्रकाश डालती है।

लिंग के आधार पर जीवित रहने की दर कैसे भिन्न होती है? क्या पुरुषों की तुलना में महिलाओं के जीवित रहने की संभावना अधिक है?

 # Calculate the survival rate by gender survival_by_gender = df.groupby('Sex')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rate by gender sns.set(style='darkgrid') plt.figure(figsize=(6, 4)) sns.barplot(x=survival_by_gender.index, y=survival_by_gender.values) plt.xlabel('Gender') plt.ylabel('Survival Rate') plt.title('Survival Rate by Gender') plt.show() 

लिंग के आधार पर जीवित बचे यात्रियों का प्रतिशत

आप देख सकते हैं कि जीवित बचे सभी यात्रियों में से 70% से अधिक महिलाएँ हैं। पुरुषों की तुलना में महिलाओं की जीवित रहने की दर काफी अधिक होना एक आश्चर्यजनक अवलोकन है।


यह विसंगति बताती है कि टाइटैनिक त्रासदी के दौरान जीवित रहने की संभावना निर्धारित करने में लिंग ने महत्वपूर्ण भूमिका निभाई।

टाइटैनिक पर यात्रियों की आयु का वितरण क्या है? क्या कोई उल्लेखनीय पैटर्न हैं?

 # Plot the distribution of passenger ages sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.histplot(data=df, x='Age', bins=20, kde=True) plt.xlabel('Age') plt.ylabel('Count') plt.title('Distribution of Passenger Ages') plt.show() 

यात्री आयु का वितरण

केडीई प्लॉट वाला हिस्टोग्राम टाइटैनिक पर यात्रियों की उम्र के वितरण को दर्शाता है। डेटा बाएं-तिरछे वितरण को दर्शाता है, जो दर्शाता है कि यात्रियों में वृद्ध वयस्कों या बच्चों की तुलना में युवा वयस्क अधिक थे, विशेष रूप से 18 से 35 वर्ष की आयु के बीच।


यात्री आयु के वितरण का विश्लेषण करने के लिए, हमने केडीई (कर्नेल घनत्व अनुमान) प्लॉट के साथ एक हिस्टोग्राम का उपयोग किया। एक्स-अक्ष विभिन्न आयु अंतराल (डिब्बे) का प्रतिनिधित्व करता है, जबकि वाई-अक्ष प्रत्येक आयु वर्ग में आने वाले यात्रियों की गिनती प्रदर्शित करता है। इस तरीके से डेटा की कल्पना करके, हम टाइटैनिक पर आयु वितरण की विषम प्रकृति को समझने में सक्षम थे, जिससे यात्रियों के बीच युवा वयस्कों की व्यापकता पर प्रकाश डाला गया।


क्या विभिन्न यात्री श्रेणियों (पहली, दूसरी, तीसरी) के यात्रियों की जीवित रहने की दर अलग-अलग थी?

 # Calculate the survival rates by passenger class survival_by_class = df.groupby('Pclass')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by passenger class sns.set(style='darkgrid') plt.figure(figsize=(6, 4)) sns.barplot(x=survival_by_class.index, y=survival_by_class.values) plt.xlabel('Passenger Class') plt.ylabel('Survival Rate') plt.title('Survival Rate by Passenger Class') plt.show() 

यात्री वर्ग द्वारा जीवित रहने की दर

बार प्लॉट टाइटैनिक डेटासेट में यात्रियों के लिए यात्री वर्ग के आधार पर जीवित रहने की दर को दर्शाता है। कथानक से यह स्पष्ट है कि यात्री वर्ग जितना ऊँचा होगा, जीवित रहने की दर उतनी ही अधिक होगी। यह अवलोकन उस ऐतिहासिक समझ से मेल खाता है कि उच्च श्रेणी (प्रथम श्रेणी) के यात्रियों के पास जीवनरक्षक नौकाओं और सुरक्षा उपायों तक बेहतर पहुंच थी, जिससे संभवतः उनके जीवित रहने की संभावना अधिक थी। इसके विपरीत, निचली श्रेणी (तीसरी श्रेणी) के यात्रियों को निकासी प्रक्रिया के दौरान अधिक चुनौतियों का सामना करना पड़ा, जिससे संभावित रूप से उस समूह के लिए जीवित रहने की दर कम हो गई।


यात्री वर्ग के आधार पर जीवित रहने की दर का विश्लेषण करने के लिए, हमने एक बार प्लॉट बनाया। प्रत्येक बार प्रत्येक श्रेणी श्रेणी (प्रथम, द्वितीय, या तृतीय श्रेणी) के लिए जीवित बचे यात्रियों के प्रतिशत का प्रतिनिधित्व करता है। कथानक की दृष्टि से जांच करके, हम विभिन्न यात्री वर्गों के बीच जीवित रहने की दर में किसी भी असमानता की पहचान करने में सक्षम थे। सलाखों की ऊंचाई जीवित रहने की दर को दर्शाती है, ऊंची सलाखों से विशिष्ट यात्री वर्गों के लिए जीवित बचे लोगों के उच्च प्रतिशत का संकेत मिलता है।

विभिन्न आयु समूहों (जैसे, बच्चे, वयस्क, बुजुर्ग) के बीच जीवित रहने की दर क्या है?

 # Create age groups age_bins = [0, 12, 18, 30, 50, 100] # Define the age group boundaries age_labels = ['Child', 'Teenager', 'Young Adult', 'Adult', 'Elderly'] # Define the age group labels df['AgeGroup'] = pd.cut(df['Age'], bins=age_bins, labels=age_labels, right=False) # Calculate the survival rates by age group survival_by_age_group = df.groupby('AgeGroup')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by age group sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.barplot(x=survival_by_age_group.index, y=survival_by_age_group.values) plt.xlabel('Age Group') plt.ylabel('Survival Rate') plt.title('Survival Rate by Age Group') plt.show() 

आयु समूह के अनुसार जीवित रहने की दर

बार प्लॉट टाइटैनिक डेटासेट में यात्रियों के बीच विभिन्न आयु समूहों के लिए जीवित रहने की दर को दर्शाता है। इससे पता चलता है कि कुछ आयु समूहों, जैसे बच्चों, वयस्कों और बुजुर्गों के आपदा के दौरान जीवित रहने की संभावना अधिक थी। यह अवलोकन इंगित करता है कि निकासी प्रक्रिया के दौरान इन कमजोर आयु समूहों को प्राथमिकता दी गई थी, जिसके परिणामस्वरूप उनके जीवित रहने की दर अधिक थी।


आयु समूहों के आधार पर जीवित रहने की दर का विश्लेषण करने के लिए, हमने एक बार प्लॉट बनाया। प्रत्येक बार एक विशिष्ट आयु वर्ग में जीवित बचे लोगों के प्रतिशत का प्रतिनिधित्व करता है। कथानक की जांच करके, हम विभिन्न आयु समूहों के बीच जीवित रहने की दर में भिन्नता का निरीक्षण करने में सक्षम थे। इससे हमें यह अनुमान लगाने की अनुमति मिली कि बच्चों, वयस्कों और बुजुर्गों जैसे कुछ आयु समूहों को प्राथमिकता मिली और दुखद घटना के दौरान जीवित रहने की बेहतर संभावना थी। यहां नियोजित कार्यप्रणाली ने जीवित रहने के परिणामों पर उम्र के प्रभाव में मूल्यवान अंतर्दृष्टि प्रदान की, जो आपदा के दौरान सबसे कमजोर यात्रियों की सुरक्षा के मानवीय प्रयासों को दर्शाती है।

क्या आरोहण के बंदरगाह ने जीवित रहने की संभावना को प्रभावित किया?

 # Calculate the survival rates by port of embarkation survival_by_embarkation = df.groupby('Embarked')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by port of embarkation sns.set(style='darkgrid') plt.figure(figsize=(6, 4)) sns.barplot(x=survival_by_embarkation.index, y=survival_by_embarkation.values) plt.xlabel('Port of Embarkation') plt.ylabel('Survival Rate') plt.title('Survival Rate by Port of Embarkation') plt.show() 

आरोहण के बंदरगाह द्वारा जीवित रहने की दर

बार प्लॉट टाइटैनिक डेटासेट में यात्रियों के लिए आरोहण के बंदरगाह के आधार पर जीवित रहने की दर को दर्शाता है। कथानक का विश्लेषण करके, हम स्पष्ट रूप से देख सकते हैं कि उच्चतम जीवित रहने की दर उन यात्रियों से जुड़ी है जो चेरबर्ग से रवाना हुए थे, जबकि सबसे कम जीवित रहने की दर उन लोगों से जुड़ी है जो साउथेम्प्टन से रवाना हुए थे।


यह विज़ुअलाइज़ेशन आरोहण के बंदरगाह के आधार पर जीवित रहने की दर में भिन्नता के बारे में मूल्यवान अंतर्दृष्टि प्रदान करता है, संभावित कारकों का सुझाव देता है जो यात्रियों के जीवित रहने की संभावनाओं को प्रभावित कर सकते हैं।


आरोहण के बंदरगाह के आधार पर जीवित रहने की दर का विश्लेषण करने के लिए, हमने एक बार प्लॉट बनाया। प्रत्येक बार आरोहण श्रेणी (चेरबर्ग, क्वीन्सटाउन, साउथेम्प्टन) के प्रत्येक बंदरगाह के लिए जीवित बचे लोगों के प्रतिशत का प्रतिनिधित्व करता है। कथानक की दृष्टि से जांच करके, हम विभिन्न आरोहण बिंदुओं के बीच जीवित रहने की दर में महत्वपूर्ण अंतर की पहचान करने में सक्षम थे।

क्या अधिक किराए वाले यात्रियों के बचने की बेहतर संभावना थी?

 # Create fare groups fare_bins = [0, 50, 100, 150, 200, 300, 1000] # Define the fare group boundaries fare_labels = ['0-50', '50-100', '100-150', '150-200', '200-300', '300+'] # Define the fare group labels df['FareGroup'] = pd.cut(df['Fare'], bins=fare_bins, labels=fare_labels, right=False) # Calculate the survival rates by fare group survival_by_fare_group = df.groupby('FareGroup')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by fare group sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.barplot(x=survival_by_fare_group.index, y=survival_by_fare_group.values) plt.xlabel('Fare Group') plt.ylabel('Survival Rate') plt.title('Survival Rate by Fare Group') plt.show() 

किराये के हिसाब से जीवित रहने की दर

ग्राफ़ दर्शाता है कि उच्चतम किराया समूह (300+) के यात्रियों के लिए जीवित रहने की दर सबसे अधिक थी, उसके बाद दूसरे उच्चतम किराया समूह (200-300) का स्थान था। इसके विपरीत, किराया समूह घटने से जीवित रहने की दर कम हो गई, सबसे कम किराया समूह (0-50) में यात्रियों के लिए जीवित रहने की दर सबसे कम हो गई।


इस विश्लेषण से पता चलता है कि भुगतान किए गए किराये ने टाइटैनिक पर जीवित रहने की संभावना निर्धारित करने में महत्वपूर्ण भूमिका निभाई। जिन यात्रियों ने अधिक किराया चुकाया, उनके प्रथम श्रेणी में होने की अधिक संभावना थी, जिनकी कुल मिलाकर जीवित रहने की दर अधिक थी।


इसके अतिरिक्त, इन उच्च-भुगतान वाले यात्रियों को बचाव प्रयासों के दौरान प्राथमिकता दी गई होगी, जिससे उनकी उच्च जीवित रहने की दर में योगदान होगा। किराया समूहों और जीवित रहने की दरों के बीच संबंधों का विश्लेषण करने के लिए, हमने प्रत्येक किराया समूह के लिए जीवित रहने के प्रतिशत को प्रदर्शित करने वाला एक बार प्लॉट बनाया। ग्राफ़ ने हमें किराया समूहों के आधार पर जीवित रहने की दर की प्रवृत्ति का निरीक्षण करने की अनुमति दी, जिससे पता चला कि उच्च किराया उच्च जीवित रहने की दर से जुड़ा था।

यात्री केबिन स्थानों का वितरण क्या है? क्या कुछ केबिनों में यात्रियों की जीवित रहने की दर अधिक थी?

 # Extract the cabin deck from the Cabin column df['CabinDeck'] = df['Cabin'].str.extract(r'([A-Za-z])') # Plot the distribution of passenger cabin locations sns.set(style='darkgrid') plt.figure(figsize=(10, 6)) sns.countplot(data=df, x='CabinDeck', order=sorted(df['CabinDeck'].dropna().unique())) plt.xlabel('Cabin Deck') plt.ylabel('Count') plt.title('Distribution of Passenger Cabin Locations') plt.show() # Calculate the survival rates by cabin deck survival_by_cabin_deck = df.groupby('CabinDeck')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by cabin deck sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.barplot(x=survival_by_cabin_deck.index, y=survival_by_cabin_deck.values) plt.xlabel('Cabin Deck') plt.ylabel('Survival Rate') plt.title('Survival Rate by Cabin Deck') plt.show() 

यात्री केबिन स्थानों का वितरण

केबिन डेक द्वारा जीवित रहने की दर

ग्राफ स्पष्ट रूप से जीवित रहने की दर में कमी की प्रवृत्ति को दर्शाता है क्योंकि केबिन डेक का स्तर कम हो गया है, ए डेक पर यात्रियों के लिए सबसे कम जीवित रहने की दर देखी गई है।


इस विश्लेषण से पता चलता है कि टाइटैनिक पर यात्री के केबिन का स्थान वास्तव में उनके जीवित रहने की संभावना में एक महत्वपूर्ण कारक था। ऊंचे डेक पर यात्रियों को जीवनरक्षक नौकाओं तक बेहतर पहुंच मिलने की संभावना थी और उन्हें अधिक आसानी से बचाया गया था।


इसके अतिरिक्त, बचाव कार्यों के दौरान उन्हें प्राथमिकता दी गई होगी, जिससे उनकी जीवित रहने की दर अधिक हो गई। केबिन डेक के स्तर और जीवित रहने की दर के बीच संबंधों का विश्लेषण करने के लिए, हमने प्रत्येक डेक के लिए जीवित रहने के प्रतिशत को प्रदर्शित करने वाला एक बार प्लॉट बनाया। ग्राफ़ की जांच करके, हम केबिन डेक स्तरों के आधार पर जीवित रहने की दर के रुझान की पहचान कर सकते हैं।

आयु समूह और लिंग के अनुसार जीवित रहने की दर

 # Create age groups age_bins = [0, 12, 18, 30, 50, 100] # Define the age group boundaries age_labels = ['Child', 'Teenager', 'Young Adult', 'Adult', 'Elderly'] # Define the age group labels df['AgeGroup'] = pd.cut(df['Age'], bins=age_bins, labels=age_labels, right=False) # Calculate the survival rates by age group and gender survival_by_age_gender = df.groupby(['AgeGroup', 'Sex'])['Survived'].mean() * 100 # Convert the survival rates into a pivot table for easier visualization survival_pivot = survival_by_age_gender.unstack() # Create a heatmap to visualize the survival rates by age group and gender sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.heatmap(data=survival_pivot, annot=True, cmap='coolwarm', fmt=".2f", cbar=True) plt.xlabel('Gender') plt.ylabel('Age Group') plt.title('Survival Rate by Age Group and Gender') plt.show() 

आयु समूह और लिंग के आधार पर जीवित रहने की दर

हीटमैप टाइटैनिक डेटासेट में यात्रियों के बीच विभिन्न आयु समूहों और लिंगों के लिए जीवित रहने की दर का एक दृश्य प्रतिनिधित्व प्रदान करता है। हीटमैप का विश्लेषण करके, हम उम्र और लिंग के आधार पर जीवित रहने की दर में पैटर्न और रुझान देख सकते हैं, जिससे हमें यह पहचानने की अनुमति मिलती है कि आपदा के दौरान किस आयु और लिंग समूह के जीवित रहने की संभावना अधिक या कम थी। हीटमैप में रंग की तीव्रता एक स्पष्ट संकेतक के रूप में कार्य करती है, जिसमें गहरे रंग उच्च जीवित रहने की दर का प्रतिनिधित्व करते हैं और हल्के रंग कम जीवित रहने की दर का संकेत देते हैं।


हीटमैप से, हम कई जानकारियां प्राप्त कर सकते हैं। बुजुर्ग महिला यात्रियों के बचने की संभावना सबसे अधिक थी, जबकि बुजुर्ग पुरुष यात्रियों के बचने की संभावना सबसे कम थी। इसके अतिरिक्त, हीटमैप से पता चलता है कि, सामान्य तौर पर, सभी आयु वर्गों में महिलाओं के जीवित रहने की अधिक संभावना थी। ये अवलोकन इस ऐतिहासिक त्रासदी के दौरान यात्रियों के जीवित रहने के परिणामों को निर्धारित करने में उम्र और लिंग के महत्वपूर्ण प्रभाव पर प्रकाश डालते हैं।


आयु समूहों और लिंग के आधार पर जीवित रहने की दर की कल्पना करने के लिए, हमने हीटमैप का उपयोग किया। हीटमैप में प्रत्येक कोशिका एक विशिष्ट आयु समूह और लिंग संयोजन के लिए जीवित रहने की दर (प्रतिशत) का प्रतिनिधित्व करती है। हीटमैप में रंग की तीव्रता की जांच करके, हम विभिन्न आयु और लिंग समूहों के बीच जीवित रहने की दर में अंतर को समझने में सक्षम थे।

परिवार के आकार के अनुसार जीवित रहने की दर

 # Calculate the total number of family members for each passenger df['FamilySize'] = df['SibSp'] + df['Parch'] + 1 # Calculate the survival rates by family size survival_by_family_size = df.groupby('FamilySize')['Survived'].mean() * 100 # Create a bar plot to visualize the survival rates by family size sns.set(style='darkgrid') plt.figure(figsize=(10, 6)) sns.barplot(x=survival_by_family_size.index, y=survival_by_family_size.values) plt.xlabel('Family Size') plt.ylabel('Survival Rate') plt.title('Survival Rate by Family Size') plt.show() 

परिवार के आकार के अनुसार जीवित रहने की दर

ग्राफ़ दर्शाता है कि बड़े परिवार वाले यात्रियों के टाइटैनिक के डूबने से बचने की अधिक संभावना थी। परिवार के सदस्यों की संख्या बढ़ने के कारण 1 से 4 तक के परिवार वाले यात्रियों की जीवित रहने की दर में वृद्धि हुई।


यह अंतर्दृष्टि महत्वपूर्ण है क्योंकि यह टाइटैनिक पर जीवित रहने के सबसे मजबूत भविष्यवक्ताओं में से एक के रूप में परिवार के आकार को उजागर करती है। बड़े परिवार वाले यात्री संभवतः एक साथ यात्रा कर रहे थे, जिससे बचाव प्रयासों के लिए उन्हें प्राथमिकता दी गई।


इसके अतिरिक्त, अधिक परिवार के सदस्यों के होने से आपसी सहयोग में मदद मिल सकती है, जैसे कि भोजन और पानी जैसे संसाधनों को साझा करना, जिससे उनके जीवित रहने की संभावना अधिक हो सकती है।


परिवार के आकार और जीवित रहने की दर के बीच संबंधों का विश्लेषण करने के लिए, हमने प्रत्येक परिवार के आकार की श्रेणी के लिए जीवित रहने के प्रतिशत को प्रदर्शित करने वाला एक बार प्लॉट बनाया। ग्राफ़ की दृष्टि से जांच करके, हम यह पहचान सकते हैं कि परिवार के आकार ने यात्रियों के जीवित रहने के परिणामों को कैसे प्रभावित किया।

जहाज़ पर चढ़ने के बाद और यात्री श्रेणी के अनुसार जीवित रहने की दर

 # Calculate the survival rates by port of embarkation and passenger class survival_by_embark_class = df.groupby(['Embarked', 'Pclass'])['Survived'].mean() * 100 # Convert the survival rates into a pivot table for easier visualization survival_pivot = survival_by_embark_class.unstack() # Create a heatmap to visualize the survival rates sns.set(style='darkgrid') plt.figure(figsize=(8, 6)) sns.heatmap(data=survival_pivot, annot=True, cmap='coolwarm', fmt=".2f", cbar=True) plt.xlabel('Passenger Class') plt.ylabel('Port of Embarkation') plt.title('Survival Rate by Port of Embarkation and Passenger Class') plt.show() 

बंदरगाह और तटबंध द्वारा जीवित रहने की दर

ग्राफ़ आरोहण के बंदरगाह और यात्री वर्ग के आधार पर जीवित रहने की दर के संबंध में कई महत्वपूर्ण पैटर्न दिखाता है। चेरबर्ग से यात्रा करने वाले यात्रियों की जीवित रहने की दर क्वीन्सटाउन या साउथेम्प्टन के यात्रियों की तुलना में अधिक थी।


यह संभवतः चेरबर्ग कॉल का पहला बंदरगाह होने और अधिक प्रथम श्रेणी यात्रियों के वहां चढ़ने की संभावना के कारण है। इसके अतिरिक्त, एक फ्रांसीसी बंदरगाह के रूप में, फ्रांसीसी यात्रियों को बचाने के प्रति पूर्वाग्रह हो सकता है।


इसके अलावा, ग्राफ़ इंगित करता है कि प्रथम श्रेणी के यात्रियों की जीवित रहने की दर दूसरी या तीसरी श्रेणी के यात्रियों की तुलना में अधिक थी। इसका श्रेय प्रथम श्रेणी के यात्रियों को बचाव के लिए प्राथमिकता के रूप में देखा जाना और उनकी उच्च सामाजिक स्थिति और जीवन-रक्षक उपायों को वहन करने की संभावित क्षमता के कारण जीवनरक्षक नौकाओं तक बेहतर पहुंच के रूप में देखा जा सकता है।


अंत में, सभी बंदरगाहों पर एक उल्लेखनीय प्रवृत्ति यह है कि जैसे-जैसे यात्री वर्ग घटता है, उत्तरजीविता दर में कमी आती है। इससे पता चलता है कि यात्री वर्ग टाइटैनिक पर जीवित रहने का एक महत्वपूर्ण निर्धारक था, प्रथम श्रेणी के यात्रियों के जीवित रहने की संभावना सबसे अधिक थी। आरोहण के बंदरगाह, यात्री वर्ग और जीवित रहने की दर के बीच संबंधों का विश्लेषण करने के लिए, हमने एक हीटमैप बनाया। हीटमैप आरोहण के बंदरगाह और यात्री वर्ग के विभिन्न संयोजनों के लिए जीवित रहने की दर प्रतिशत का प्रतिनिधित्व करता है। हीटमैप की जांच करके, हम इन दो कारकों के आधार पर जीवित रहने की दर में पैटर्न और रुझान की पहचान करने में सक्षम थे।