📊 Comprehensive Dataset Collection

🚀 Welcome to the Ultimate Datasets Repository! 🚀

✨ A curated collection of 70+ diverse datasets for data science, machine learning, and analytics projects

⬇️ Get Started • 📖 View All Datasets • 🎯 Find Your Dataset

🎨 Repository Statistics

📦 Total Files	🏆 Categories	⭐ Beginner Friendly	🔥 Updated
70+	11	15+	Regularly

🎯 Overview

🌟 Perfect For:

╔═══════════════════════════════════════════════════════╗
║                                                       ║
║  🔬 Data Science       │  🤖 Machine Learning      ║
║  📊 Analytics          │  🎓 Learning & Teaching   ║
║  💼 Business Projects  │  🏆 Competitions & Kaggle ║
║                                                       ║
╚═══════════════════════════════════════════════════════╝

This repository contains a comprehensive collection of 70+ datasets spanning various domains including healthcare, entertainment, transportation, demographics, finance, and more. Each dataset is carefully organized and ready for analysis!

✅ What You Get:

✨ 70+ Curated Datasets | 🎯 Well-Organized | 📖 Documented | 🚀 Ready to Use | 🏆 Quality Verified

🚀 Quick Navigation

👇 Click Any Category Below to Explore:

🏥 Healthcare	🎬 Entertainment	🚗 Transport	🏠 Real Estate	🌍 Demographics
8+ Datasets	8+ Datasets	3+ Datasets	2+ Datasets	2+ Datasets
📖 Explore	📖 Explore	📖 Explore	📖 Explore	📖 Explore

💰 Finance	🎓 Education	🔬 Science	📊 Forecasting	🌾 Environment
5+ Datasets	3+ Datasets	5+ Datasets	4+ Datasets	3+ Datasets
📖 Explore	📖 Explore	📖 Explore	📖 Explore	📖 Explore

🎯 Interactive Category Browser

📚 Browse & Explore All Categories (Click Headers to Expand)

Each category includes dataset descriptions, file names, use cases, and difficulty levels!

🏥 Healthcare & Medical (8 datasets) ⭐ POPULAR

Medical data for health analytics and prediction models

Dataset	File	Purpose	Type	Level
💊 Diabetes Prediction	`diabetes.csv`, `diabetes1.csv`	Classification for diabetes risk	Classification	🟢 Beginner
🏥 Health Camp Data	`Health_Care_Dataset/`	Multi-camp attendance analysis	Analytics	🟡 Intermediate
❤️ Heart Disease	`gfg_heart.csv`, `heart_disease_uci.csv`	Cardiology prediction	Classification	🟢 Beginner
💰 Medical Costs	`medical_cost_gfg.csv`	Healthcare expense analysis	Regression	🟢 Beginner
👕 Clothing Reviews	`RNN_Clothing-Review.csv`	NLP sentiment analysis	NLP	🔴 Advanced

💡 Quick Start Code:

import pandas as pd
df = pd.read_csv('diabetes.csv')
print(df.shape)      # View dimensions
df.describe()        # Get statistics
df.isnull().sum()    # Check for missing values

🎬 Entertainment & Media (8 datasets) ⭐ POPULAR

Streaming platforms, movies, and content analysis data

Dataset	File	Purpose	Type	Level
🎥 Netflix	`Netflix_titles.csv`, `Netflix_credits.csv`	Content analysis & trends	Analysis	🟢 Beginner
📺 HBO Content	`HBO_titles.csv`, `HBO_credits.csv`	Streaming platform comparison	Comparison	🟢 Beginner
🎬 IMDB Dataset	`IMDB-Dataset.csv`	Movie database analysis	Analysis	🟢 Beginner
💵 Box Office	`gfg_boxoffice.csv`	Revenue & performance metrics	Analysis	🟢 Beginner
🔥 Trending Data	`Trending/trending.csv`	Social media trends	TimeSeries	🟡 Intermediate

💡 Quick Start Code:

netflix = pd.read_csv('Netflix_titles.csv')
netflix['type'].value_counts()     # Content distribution
netflix.groupby('country').size()  # Country analysis

🚗 Transportation & Mobility (3 datasets)

Vehicle data, traffic, and transportation analytics

Dataset	File	Purpose	Type	Level
🚙 Cars Dataset	`Project_2_Cars_Dataset.csv`	Vehicle specs & pricing	Regression	🟢 Beginner
🚨 Police Data	`Project_3_Police Data.csv`	Traffic & incidents	Analysis	🟡 Intermediate
⚙️ Vehicle Failure	`vehicle_failure.csv`	Maintenance prediction	Classification	🟡 Intermediate

🏠 Real Estate (2 datasets)

Housing market and property data

Dataset	File	Purpose	Type	Level
🏡 Housing Data	`Project_5_Housing_Data.csv`, `House_Price_India.csv`	Price prediction & analysis	Regression	🟢 Beginner

🌍 Demographics & Census (2 datasets)

Population and demographic statistics

Dataset	File	Purpose	Type	Level
📊 Census 2011	`Project_6_Census_2011.csv`	Population statistics	Analysis	🟡 Intermediate
👥 Demographics	`demographics.csv`, `dermographic data.csv`	Demographic analysis	Analysis	🟢 Beginner

💰 Finance & Business (5 datasets)

Financial and business-related datasets

Dataset	File	Purpose	Type	Level
📋 Loan Datasets	`gfg_LoanDataset---LoansDatasest.csv`, `loan_approval_dataset.csv`	Loan approval prediction	Classification	🟡 Intermediate
📉 Churn Modeling	`Churn_Modelling_gfg.csv`	Customer retention analysis	Classification	🟡 Intermediate
👔 Employee Attrition	`MFG10YearTerminationData(EMPLOYEE-ATTRITION).csv`	Workforce analytics	Classification	🟡 Intermediate
📈 Stock Data	`stock_data.csv`	Market analysis	TimeSeries	🟡 Intermediate

🎓 Education & Learning (3 datasets)

Educational resources and student data

Dataset	File	Purpose	Type	Level
🎯 Udemy Courses	`Project_7_Udemy_Dataset.csv`, `Udmey Data/`	Course analysis & pricing	Analysis	🟢 Beginner
📚 Student Performance	`student-pass-fail-data.csv`	Academic prediction	Classification	🟢 Beginner
🛍️ Mall Customers	`gfg_Mall_Customers-.csv`	Customer segmentation	Clustering	🟡 Intermediate

🔬 Science & Classic ML Datasets (5 datasets) ⭐ FOR BEGINNERS

Classic datasets perfect for learning and tutorials

Dataset	File	Purpose	Type	Level
🌸 Iris	`IRIS.csv`	Classic classification	Classification	🟢 Beginner
⚓ Titanic	`Titanic_dataset.csv`, `GFG_titanic.csv`, `Titanic_Dataset_SmartED.csv`	Survival prediction	Classification	🟢 Beginner
🍷 Wine Quality	`redwinequality.csv`, `whitewinequality.csv`	Quality classification	Regression	🟢 Beginner

📊 Forecasting & TimeSeries (4 datasets)

Time series and forecasting datasets

Dataset	File	Purpose	Type	Level
🌤️ Weather Data	`Project_1_Weather_Dataset.csv`, `daily-min-temperatures.csv`	Temperature forecasting	TimeSeries	🟡 Intermediate
💹 Sales Forecasting	`sales_forecasting_dataset_SmartEd_Project.csv`, `stores_sales_forecasting_SmartED.csv`	Revenue prediction	TimeSeries	🟡 Intermediate
🏏 IPL Data	`ipl_data.csv`	Sports analytics	Analysis	🟢 Beginner
🌧️ Rainfall	`Rainfall_dataset.csv`	Climate patterns	TimeSeries	🟡 Intermediate

🌾 Environment & Special Topics (3 datasets)

Environmental and specialized datasets

Dataset	File	Purpose	Type	Level
🦠 COVID-19 Data	`Project_4_Covid_19_data.csv`	Pandemic analysis	TimeSeries	🟡 Intermediate
🎬 Amazon Prime	`Amazone_titles.csv`, `Amazone_credits.csv`	Content analysis	Analysis	🟢 Beginner
🍔 Zomato Data	`Zomato-data-.csv`	Restaurant trends	Analysis	🟢 Beginner

🚀 Quick Start Guide

📋 Prerequisites

# Install required packages
pip install pandas numpy matplotlib seaborn scikit-learn jupyter

⚡ Load & Explore Any Dataset (30 seconds)

import pandas as pd
import numpy as np

# Load your chosen dataset
df = pd.read_csv('diabetes.csv')

# Quick exploration
print(df.info())        # Data types & missing values
print(df.describe())    # Statistical summary
print(df.head(10))      # First 10 rows
print(df.shape)         # Dimensions (rows, columns)

# Visual inspection
import matplotlib.pyplot as plt
df.hist(figsize=(12, 8))
plt.tight_layout()
plt.show()

💡 Common Usage Patterns

🎯 Choose Your Use Case:

📊 1. Exploratory Data Analysis (EDA)

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Load data
df = pd.read_csv('diabetes.csv')

# Basic exploration
print(f"Shape: {df.shape}")
print(f"Columns: {df.columns.tolist()}")
print(f"Missing values:\n{df.isnull().sum()}")

# Statistical summary
print(df.describe())

# Distribution analysis
plt.figure(figsize=(12, 4))
df['diabetes'].value_counts().plot(kind='bar')
plt.title('Diabetes Distribution')
plt.show()

# Correlation heatmap
plt.figure(figsize=(12, 8))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm', center=0)
plt.title('Feature Correlation Matrix')
plt.tight_layout()
plt.show()

🤖 2. Classification Pipeline

from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
import pandas as pd

# Load data
df = pd.read_csv('diabetes.csv')

# Prepare features and target
X = df.drop(['diabetes'], axis=1)
y = df['diabetes']

# Handle categorical variables
X_encoded = pd.get_dummies(X, drop_first=True)

# Train-test split
X_train, X_test, y_train, y_test = train_test_split(
    X_encoded, y, test_size=0.2, random_state=42
)

# Train Random Forest model
model = RandomForestClassifier(n_estimators=100, random_state=42, n_jobs=-1)
model.fit(X_train, y_train)

# Make predictions
y_pred = model.predict(X_test)

# Evaluate model
print(f"Accuracy: {accuracy_score(y_test, y_pred):.4f}")
print("\nClassification Report:")
print(classification_report(y_test, y_pred))
print("\nConfusion Matrix:")
print(confusion_matrix(y_test, y_pred))

# Feature importance
feature_importance = pd.DataFrame({
    'feature': X_encoded.columns,
    'importance': model.feature_importances_
}).sort_values('importance', ascending=False)
print("\nTop Features:")
print(feature_importance.head(10))

📈 3. Regression Pipeline

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error, r2_score, mean_absolute_error
import pandas as pd
import numpy as np

# Load housing data
df = pd.read_csv('Project_5_Housing_Data.csv')

# Prepare data (adjust column names as needed)
X = df.drop('price', axis=1)  # Features
y = df['price']               # Target

# Train-test split
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

# Train model
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# Predictions
y_pred = model.predict(X_test)

# Evaluation
print(f'R² Score: {r2_score(y_test, y_pred):.4f}')
print(f'RMSE: {np.sqrt(mean_squared_error(y_test, y_pred)):.4f}')
print(f'MAE: {mean_absolute_error(y_test, y_pred):.4f}')

# Visualization
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 6))
plt.scatter(y_test, y_pred, alpha=0.5)
plt.plot([y_test.min(), y_test.max()], [y_test.min(), y_test.max()], 'r--', lw=2)
plt.xlabel('Actual Price')
plt.ylabel('Predicted Price')
plt.title('Regression: Actual vs Predicted')
plt.show()

🔤 4. Text Classification & NLP

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import Pipeline
from sklearn.model_selection import train_test_split
import pandas as pd

# Load spam dataset
df = pd.read_csv('spam_ham_dataset.csv')

# Create pipeline
pipeline = Pipeline([
    ('tfidf', TfidfVectorizer(max_features=5000, stop_words='english')),
    ('classifier', MultinomialNB())
])

# Train-test split
X_train, X_test, y_train, y_test = train_test_split(
    df['text'], df['label'], test_size=0.2, random_state=42
)

# Train
pipeline.fit(X_train, y_train)

# Evaluate
from sklearn.metrics import accuracy_score, classification_report
y_pred = pipeline.predict(X_test)
print(f'Accuracy: {accuracy_score(y_test, y_pred):.4f}')
print(classification_report(y_test, y_pred))

# Test on new data
test_messages = [
    'Congratulations! You won a prize!',
    'Hello, can we schedule a meeting tomorrow?'
]
predictions = pipeline.predict(test_messages)
for msg, pred in zip(test_messages, predictions):
    print(f"'{msg}' -> {pred}")

🎯 5. Clustering & Segmentation

from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
import pandas as pd
import matplotlib.pyplot as plt

# Load mall customers data
df = pd.read_csv('gfg_Mall_Customers-.csv')

# Select features for clustering
X = df[['Age', 'Annual Income (k$)', 'Spending Score (1-100)']].values

# Standardize features
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Determine optimal k (elbow method)
inertias = []
for k in range(1, 11):
    kmeans = KMeans(n_clusters=k, random_state=42, n_init=10)
    kmeans.fit(X_scaled)
    inertias.append(kmeans.inertia_)

plt.figure(figsize=(10, 6))
plt.plot(range(1, 11), inertias, 'bo-')
plt.xlabel('Number of Clusters (k)')
plt.ylabel('Inertia')
plt.title('Elbow Method for Optimal k')
plt.show()

# Apply clustering with optimal k (e.g., k=5)
kmeans = KMeans(n_clusters=5, random_state=42, n_init=10)
clusters = kmeans.fit_predict(X_scaled)

# Visualization
plt.figure(figsize=(10, 6))
scatter = plt.scatter(X[:, 0], X[:, 1], c=clusters, cmap='viridis', s=100, alpha=0.6)
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1],
            c='red', marker='X', s=200, edgecolors='black', linewidths=2)
plt.xlabel('Age')
plt.ylabel('Annual Income')
plt.title('Customer Segmentation (K-Means)')
plt.colorbar(scatter, label='Cluster')
plt.show()

# Cluster analysis
df['Cluster'] = clusters
print(df.groupby('Cluster')[['Age', 'Annual Income (k$)', 'Spending Score (1-100)']].mean())

📊 Dataset Quick Reference

Category	Count	Beginner Friendly	Best For
🏥 Healthcare	8	✅ YES	Classification, Health Analytics
🎬 Entertainment	8	✅ YES	EDA, Visualization, Trends
🚗 Transportation	3	✅ YES	Regression, Analysis
🏠 Real Estate	2	✅ YES	Regression, Price Prediction
🌍 Demographics	2	✅ YES	Analysis, Population Studies
💰 Finance	5	🟡 SOME	Classification, Forecasting
🎓 Education	3	✅ YES	Analysis, Clustering
🔬 Science & ML	5	✅ YES	Learning, Tutorials
📊 Forecasting	4	🟡 SOME	TimeSeries, ARIMA, LSTM
🌾 Environment	3	🟡 SOME	Analysis, Trends
🍔 Food & Dining	1	✅ YES	Analysis, Visualization

🛠️ Recommended Tools & Libraries

📦 Complete Setup Guide

Essential Stack

# Data manipulation & analysis
pip install pandas numpy

# Visualization
pip install matplotlib seaborn plotly

# Machine Learning
pip install scikit-learn xgboost lightgbm catboost

# Deep Learning (Optional)
pip install tensorflow pytorch

# Statistical Analysis
pip install scipy statsmodels

# Jupyter Notebooks
pip install jupyter jupyterlab ipywidgets

# Data Quality
pip install pandas-profiling missingno

All-in-One Installation

pip install pandas numpy matplotlib seaborn scikit-learn jupyter plotly scipy statsmodels xgboost

Verify Installation

import pandas as pd
import numpy as np
import sklearn
import matplotlib.pyplot as plt

print(f"Pandas: {pd.__version__}")
print(f"NumPy: {np.__version__}")
print(f"Scikit-Learn: {sklearn.__version__}")
print(f"✅ All libraries installed successfully!")

📁 Directory Structure

📁 Datasets/
├── 📄 README.md                           (This file)
├── 📄 LICENSE
│
├── 🩺 HEALTHCARE DATASETS
│   ├── diabetes.csv
│   ├── diabetes1.csv
│   ├── gfg_heart.csv
│   ├── heart_disease_uci.csv
│   ├── medical_cost_gfg.csv
│   ├── RNN_Clothing-Review.csv
│   └── Health_Care_Dataset/
│       ├── Patient_Profile.csv
│       ├── Health_Camp_Detail.csv
│       ├── First_Health_Camp_Attended.csv
│       ├── Second_Health_Camp_Attended.csv
│       ├── Third_Health_Camp_Attended.csv
│       ├── Train.csv
│       ├── test.csv
│       └── Cleaned_Data/
│
├── 🎬 ENTERTAINMENT DATASETS
│   ├── Netflix_titles.csv
│   ├── Netflix_credits.csv
│   ├── HBO_titles.csv
│   ├── HBO_credits.csv
│   ├── Amazone_titles.csv
│   ├── Amazone_credits.csv
│   ├── IMDB-Dataset.csv
│   ├── gfg_boxoffice.csv
│   └── Trending/
│       ├── trending.csv
│       └── Cleaned data/
│
├── 🚗 TRANSPORTATION & 📊 FORECASTING
│   ├── Project_1_Weather_Dataset.csv
│   ├── Project_2_Cars_Dataset.csv
│   ├── Project_3_Police Data.csv
│   ├── daily-min-temperatures.csv
│   ├── stock_data.csv
│   ├── vehicle_failure.csv
│   └── ipl_data.csv
│
├── 🏠 REAL ESTATE & 💼 BUSINESS
│   ├── House_Price_India.csv
│   ├── Project_5_Housing_Data.csv
│   ├── gfg_LoanDataset---LoansDatasest.csv
│   ├── loan_approval_dataset.csv
│   ├── Churn_Modelling_gfg.csv
│   └── MFG10YearTerminationData(EMPLOYEE-ATTRITION).csv
│
├── 🎓 EDUCATION & 🌍 DEMOGRAPHICS
│   ├── Project_6_Census_2011.csv
│   ├── Project_7_Udemy_Dataset.csv
│   ├── demographics.csv
│   ├── dermographic data.csv
│   ├── student-pass-fail-data.csv
│   ├── gfg_Mall_Customers-.csv
│   └── Udmey Data/
│
├── 🔬 CLASSIC ML & SCIENCE
│   ├── IRIS.csv
│   ├── Titanic_dataset.csv
│   ├── GFG_titanic.csv
│   ├── Titanic_Dataset_SmartED.csv
│   ├── redwinequality.csv
│   └── whitewinequality.csv
│
├── 📝 TEXT & SPECIAL
│   ├── spam_ham_dataset.csv
│   ├── Project_Text_Classification_synthetic_text_data.csv
│   ├── Zomato-data-.csv
│   ├── Project_4_Covid_19_data.csv
│   ├── Rainfall_dataset.csv
│   └── sales_forecasting_dataset_SmartEd_Project.csv
│
└── 🧹 CLEANED & TEST DATA
    ├── testdata.csv
    ├── CleaneD_testdata_File.csv
    ├── Naivs_diabetes.csv
    ├── customer_purchase_behavior.csv
    ├── Position_Salaries.csv
    └── stores_sales_forecasting_SmartED.csv

🎓 Learning Paths

🟢 Beginner Learning Path (Start Here!)

Week 1-2: Basics

Load & Explore: Start with IRIS.csv or Titanic_dataset.csv
Practice: Use the EDA code examples above
Visualize: Create plots with matplotlib & seaborn

Week 3-4: Simple Models

Classification: Try diabetes.csv with logistic regression
Regression: Use House_Price_India.csv for price prediction
Understand: Learn about train-test splits and model evaluation

Week 5-6: Advanced Concepts

Ensemble Methods: Apply Random Forests to any dataset
Clustering: Segment customers with gfg_Mall_Customers-.csv
NLP Basics: Text classification with spam_ham_dataset.csv

🟡 Intermediate Learning Path

Feature Engineering: Work with Titanic_dataset.csv
Time Series: Learn with daily-min-temperatures.csv
Feature Selection: Apply to Churn_Modelling_gfg.csv
Model Tuning: Hyperparameter optimization on any dataset
Cross-Validation: Implement k-fold on classification problems

🔴 Advanced Learning Path

Deep Learning: NLP with RNN_Clothing-Review.csv
LSTM Models: Time series forecasting
Ensemble Stacking: Combine multiple models
Advanced NLP: Sentiment analysis & text generation
Big Data Techniques: Handle large datasets efficiently

🤝 Contributing

We welcome contributions! Here's how you can help:

📋 Contribution Guidelines

Fork the repository
Create a feature branch: git checkout -b feature/add-dataset
Add your dataset with documentation
Commit changes: git commit -m "Add new dataset: [name]"
Push to branch: git push origin feature/add-dataset
Submit a Pull Request

📝 Dataset Submission Requirements

When adding a dataset, please include:

✅ Clear description of dataset
✅ Data dictionary/schema
✅ Usage examples
✅ Source attribution
✅ Data quality assessment
✅ Size and format information

📚 Resources & Links

⚖️ License & Usage

This dataset collection is available under Open Source License.

✅ You Can:

Use for educational and research purposes
Use for commercial projects (with attribution)
Modify and redistribute datasets
Create derivative works

❌ You Cannot:

Claim original ownership
Remove attribution from original sources

Citation Format:

Dataset Collection by itsluckysharma01
GitHub: https://github.com/itsluckysharma01/Datasets

🎉 Getting Started Today!

Quick Checklist:

📧 Support & Questions

Issues: Open an issue on GitHub
Discussions: Use GitHub Discussions for questions
Email: itsluckysharma01@email.com

🌟 Star This Repository If You Find It Helpful!

Made with ❤️ for the Data Science Community

⬆ Back to Top

Name		Name	Last commit message	Last commit date
Latest commit History 60 Commits
Health_Care_Dataset		Health_Care_Dataset
Trending		Trending
Udmey Data		Udmey Data
.gitattributes		.gitattributes
Amazone_credits.csv		Amazone_credits.csv
Amazone_titles.csv		Amazone_titles.csv
Churn_Modelling_gfg.csv		Churn_Modelling_gfg.csv
CleaneD_testdata_File.csv		CleaneD_testdata_File.csv
GFG_titanic.csv		GFG_titanic.csv
HBO_credits.csv		HBO_credits.csv
HBO_titles.csv		HBO_titles.csv
House_Price_India.csv		House_Price_India.csv
IMDB-Dataset.csv		IMDB-Dataset.csv
IRIS.csv		IRIS.csv
LICENSE		LICENSE
MFG10YearTerminationData(EMPLOYEE-ATTRITION).csv		MFG10YearTerminationData(EMPLOYEE-ATTRITION).csv
Naivs_diabetes.csv		Naivs_diabetes.csv
Netflix_credits.csv		Netflix_credits.csv
Netflix_titles.csv		Netflix_titles.csv
Position_Salaries.csv		Position_Salaries.csv
Project_1_Weather_Dataset.csv		Project_1_Weather_Dataset.csv
Project_2_Cars_Dataset.csv		Project_2_Cars_Dataset.csv
Project_3_Police Data.csv		Project_3_Police Data.csv
Project_4_Covid_19_data.csv		Project_4_Covid_19_data.csv
Project_5_Housing_Data.csv		Project_5_Housing_Data.csv
Project_6_Census_2011.csv		Project_6_Census_2011.csv
Project_7_Udemy_Dataset.csv		Project_7_Udemy_Dataset.csv
Project_8_Netflix_Dataset.csv		Project_8_Netflix_Dataset.csv
Project_9_Sales-Data-Analysis.xlsx		Project_9_Sales-Data-Analysis.xlsx
Project_Text_Classification_synthetic_text_data.csv		Project_Text_Classification_synthetic_text_data.csv
README.md		README.md
RNN_Clothing-Review.csv		RNN_Clothing-Review.csv
Rainfall_dataset.csv		Rainfall_dataset.csv
Titanic_Dataset_SmartED.csv		Titanic_Dataset_SmartED.csv
Titanic_dataset.csv		Titanic_dataset.csv
Zomato-data-.csv		Zomato-data-.csv
customer_purchase_behavior.csv		customer_purchase_behavior.csv
daily-min-temperatures.csv		daily-min-temperatures.csv
demographics.csv		demographics.csv
dermographic data.csv		dermographic data.csv
diabetes.csv		diabetes.csv
diabetes1.csv		diabetes1.csv
gfg_LoanDataset---LoansDatasest.csv		gfg_LoanDataset---LoansDatasest.csv
gfg_Mall_Customers-.csv		gfg_Mall_Customers-.csv
gfg_Online-Retail.xlsx		gfg_Online-Retail.xlsx
gfg_boxoffice.csv		gfg_boxoffice.csv
gfg_heart.csv		gfg_heart.csv
gfg_titinicdaataset.csv		gfg_titinicdaataset.csv
heart_disease_uci.csv		heart_disease_uci.csv
ipl_data.csv		ipl_data.csv
loan_approval_dataset.csv		loan_approval_dataset.csv
medical_cost_gfg.csv		medical_cost_gfg.csv
monthly_milk_production.csv		monthly_milk_production.csv
redwinequality.csv		redwinequality.csv
sales_forecasting_dataset_SmartEd_Project.csv		sales_forecasting_dataset_SmartEd_Project.csv
spam_ham_dataset.csv		spam_ham_dataset.csv
stock_data.csv		stock_data.csv
stores_sales_forecasting_SmartED.csv		stores_sales_forecasting_SmartED.csv
student-pass-fail-data.csv		student-pass-fail-data.csv
swiggy.csv		swiggy.csv
testdata.csv		testdata.csv
vehicle_failure.csv		vehicle_failure.csv
whitewinequality.csv		whitewinequality.csv

Folders and files

Latest commit

History

Repository files navigation

📊 Comprehensive Dataset Collection

🚀 Welcome to the Ultimate Datasets Repository! 🚀

🎨 Repository Statistics

🎯 Overview

🌟 Perfect For:

✅ What You Get:

🚀 Quick Navigation

👇 Click Any Category Below to Explore:

🎯 Interactive Category Browser

📚 Browse & Explore All Categories (Click Headers to Expand)

🚀 Quick Start Guide

📋 Prerequisites

⚡ Load & Explore Any Dataset (30 seconds)

💡 Common Usage Patterns

🎯 Choose Your Use Case:

📊 Dataset Quick Reference

🛠️ Recommended Tools & Libraries

Essential Stack

All-in-One Installation

Verify Installation

📁 Directory Structure

🎓 Learning Paths

Week 1-2: Basics

Week 3-4: Simple Models

Week 5-6: Advanced Concepts

🤝 Contributing

📋 Contribution Guidelines

📝 Dataset Submission Requirements

📚 Resources & Links

⚖️ License & Usage

✅ You Can:

❌ You Cannot:

Citation Format:

🎉 Getting Started Today!

Quick Checklist:

📧 Support & Questions

🌟 Star This Repository If You Find It Helpful!

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages