0% found this document useful (0 votes)

27 views11 pages

Getting Start With Pandas

The document provides an introduction to Pandas, a data manipulation library in Python, detailing its primary data structures: Series and DataFrame. It covers creating Series and DataFrames, data manipulation techniques such as filtering, sorting, and grouping, as well as handling missing data, merging DataFrames, and performing descriptive statistics. Additionally, it includes examples of reading from and writing to various file formats and string manipulation methods.

Uploaded by

abhinav.mishra

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

27 views11 pages

Getting Start With Pandas

Uploaded by

abhinav.mishra

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 11

UNIVERSITY OF STEEL TECHNOLOGY

AND MANAGEMENT

Introduction to Data Science and

Data Analytics
Presented by:

Dr. Ravindra Singh Saluja

OP Jindal University, Raigarh

UNIVERSITY OF STEEL TECHNOLOGYAND MANAGEMENT
Introduction to Pandas

• Pandas is primarily used for working

with structured data. It provides two
main data structures:
• Series: One-dimensional labeled array
capable of holding any data type.
• DataFrame: Two-dimensional labeled
data structure with columns of
potentially different types.

2
Creating a series
• From a List:
import pandas as pd
data = [10, 20, 30, 40, 50]
series = pd.Series(data)
print(series)
• From a Dictionary:
import pandas as pd
data = {"a": 1, "b": 2, "c": 3}
series = pd.Series(data)
print(series)
• With Custom Index:
import pandas as pd
data = [10, 20, 30, 40, 50]
series = pd.Series(data, index=["a", "b", "c", "d", "e"])
print(series)
3
Creating a DataFrame

import pandas as pd

# Creating a DataFrame from a dictionary

data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
print(df)

4
Data Manipulation
Pandas provides a wide range of methods to manipulate data, such as filtering, sorting,
and grouping.
•Filtering: Select rows based on conditions.
# Filtering rows where Age is greater than 28
filtered_df = df[df['Age'] > 28]
print(filtered_df)

• Sorting: Sort the DataFrame by a specific column.

# Sorting by Age in descending order
sorted_df = df.sort_values(by='Age', ascending=False)
print(sorted_df)
• Grouping: Group data and perform aggregate functions.
# Grouping by City and calculating the mean age
grouped_df = df.groupby('City')['Age'].mean()
print(grouped_df)
Handling Missing Data

Pandas makes it easy to handle missing data with methods like fillna() and dropna().
# Filling missing values with a default value
df.fillna(0, inplace=True)

# Dropping rows with any missing values

df.dropna(inplace=True)
Merging and Joining
DataFrames

# Merging two DataFrames on a common column

df1 = pd.DataFrame({'ID': [1, 2, 3], 'Name': ['Alice', 'Bob', 'Charlie']})
df2 = pd.DataFrame({'ID': [1, 2, 4], 'Age': [25, 30, 40]})

merged_df = pd.merge(df1, df2, on='ID', how='inner')

print(merged_df)
Reading and Writing Data

You can read from and write to various file formats like CSV, Excel, and SQL databases.
# Reading from a CSV file
df = pd.read_csv('data.csv')

# Writing to a CSV file

df.to_csv('output.csv', index=False)
String Manipulation

df['Name'] = df['Name'].str.upper() # Convert names to uppercase

df['Name_Length'] = df['Name'].str.len() # Find length of names
df['Name'] = df['Name'].str.replace('A', '@') # Replace 'A' with '@'

9
Descriptive Statistics

• Basic Statistical Measures:

# Creating a sample DataFrame
data = {'A': [1, 2, 3, 4, 5], 'B': [5, 10, 15, 20,
25]}
df = pd.DataFrame(data)
# Descriptive statistics
print(df.describe())

10
• Calculating Specific Statistics:
# Mean
mean = df['A'].mean()
print('Mean:', mean)

# Standard Deviation
std = df['A'].std()
print('Standard Deviation:', std)

# Correlation
correlation = df.corr()
print('Correlation:\n', correlation)

Pandas
No ratings yet
Pandas
27 pages
Pandas
No ratings yet
Pandas
4 pages
FDS Module 2 Notes
No ratings yet
FDS Module 2 Notes
24 pages
Data Handling Using Pandas-1
No ratings yet
Data Handling Using Pandas-1
60 pages
Python 2.1.2
No ratings yet
Python 2.1.2
7 pages
Pandas & PyNumS Essentials
No ratings yet
Pandas & PyNumS Essentials
10 pages
Python Unit 4&5 Que
No ratings yet
Python Unit 4&5 Que
33 pages
FDS Exp4
No ratings yet
FDS Exp4
5 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
16 pages
DAP 3 Module
No ratings yet
DAP 3 Module
62 pages
Lab-3 Pandas Library
No ratings yet
Lab-3 Pandas Library
14 pages
Pandas
No ratings yet
Pandas
12 pages
Pandas
No ratings yet
Pandas
13 pages
The Pandas Library
No ratings yet
The Pandas Library
39 pages
Pandas Handbook
No ratings yet
Pandas Handbook
33 pages
Pandas - Digitalocean
No ratings yet
Pandas - Digitalocean
15 pages
EDA Unit2
No ratings yet
EDA Unit2
99 pages
Introduction To Pandas For Data Analysis
No ratings yet
Introduction To Pandas For Data Analysis
6 pages
Pandas For Machine Learning
No ratings yet
Pandas For Machine Learning
10 pages
Unit 3
No ratings yet
Unit 3
10 pages
Python & MySQL For Data Analysis
No ratings yet
Python & MySQL For Data Analysis
45 pages
Unit 4 Pandas
No ratings yet
Unit 4 Pandas
8 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
7 pages
Introduction To Pandas in Data Analytics
No ratings yet
Introduction To Pandas in Data Analytics
12 pages
Session2-DM Using Pandas
No ratings yet
Session2-DM Using Pandas
51 pages
IP 12th Chapter 3
No ratings yet
IP 12th Chapter 3
9 pages
Pandas
No ratings yet
Pandas
20 pages
Pandas Guide for Data Science
No ratings yet
Pandas Guide for Data Science
42 pages
Pandas PDF
No ratings yet
Pandas PDF
25 pages
04-Data Manipulation With Pandas
No ratings yet
04-Data Manipulation With Pandas
28 pages
Unit 4
No ratings yet
Unit 4
27 pages
Pandas Programs
No ratings yet
Pandas Programs
2 pages
Unit III - Notes
No ratings yet
Unit III - Notes
12 pages
FDS Notes Unit-4
No ratings yet
FDS Notes Unit-4
30 pages
Unit 4
No ratings yet
Unit 4
36 pages
Python Programming For Data Science
No ratings yet
Python Programming For Data Science
36 pages
Learn Complete Pandas With Real World Interviews Questions
No ratings yet
Learn Complete Pandas With Real World Interviews Questions
40 pages
Lab 1 ML Lab
No ratings yet
Lab 1 ML Lab
15 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
33 pages
EDA Unit II
No ratings yet
EDA Unit II
117 pages
Unit 3 (FODS)
No ratings yet
Unit 3 (FODS)
34 pages
Pandas
No ratings yet
Pandas
7 pages
Lab-3 Pandas Library
No ratings yet
Lab-3 Pandas Library
18 pages
Pandas Research
No ratings yet
Pandas Research
14 pages
Data Analysis - 5th Unit
No ratings yet
Data Analysis - 5th Unit
14 pages
Pandas Merged
No ratings yet
Pandas Merged
2 pages
Pandas Presentation
No ratings yet
Pandas Presentation
10 pages
Pandas
No ratings yet
Pandas
5 pages
L32, 33 Pandas
No ratings yet
L32, 33 Pandas
7 pages
Dilip PP
No ratings yet
Dilip PP
9 pages
UNIT II Notes
No ratings yet
UNIT II Notes
23 pages
Introduction to Pandas Library
No ratings yet
Introduction to Pandas Library
31 pages
Pandas Introduction: What Is Python Pandas Used For?
No ratings yet
Pandas Introduction: What Is Python Pandas Used For?
28 pages
Data Handling Module
No ratings yet
Data Handling Module
10 pages
Pandas Library: Data Manipulation & Analysis Guide
No ratings yet
Pandas Library: Data Manipulation & Analysis Guide
9 pages
JOINS
No ratings yet
JOINS
10 pages
Python For Data Analysis Jan 28
No ratings yet
Python For Data Analysis Jan 28
105 pages
Chapter - 4 Data Analysis With Pandas
No ratings yet
Chapter - 4 Data Analysis With Pandas
60 pages
347 862840 PureSubstanceAP
No ratings yet
347 862840 PureSubstanceAP
31 pages
Introduction To Data Science and Data Analytics: OP Jindal University, Raigarh
No ratings yet
Introduction To Data Science and Data Analytics: OP Jindal University, Raigarh
6 pages
Python Learn 05 Dictionaries
No ratings yet
Python Learn 05 Dictionaries
9 pages
Python Learn 06 Tuples
No ratings yet
Python Learn 06 Tuples
9 pages
347 862932 Introduction
No ratings yet
347 862932 Introduction
35 pages
SL 1015
No ratings yet
SL 1015
1 page
Assignment 1 - Unitii
No ratings yet
Assignment 1 - Unitii
2 pages
Dbunit-Intro: Commons IO. Eclipse 3.1.x
No ratings yet
Dbunit-Intro: Commons IO. Eclipse 3.1.x
5 pages
LSMW S4Q Ztest
No ratings yet
LSMW S4Q Ztest
4 pages
Microsoft Services Hub: Webcast Series: Azure Technical Update Briefing Call
No ratings yet
Microsoft Services Hub: Webcast Series: Azure Technical Update Briefing Call
37 pages
CS - Xii - PB - Ii - Set-A
No ratings yet
CS - Xii - PB - Ii - Set-A
13 pages
1Z0 051 Exam Dumps 2018
No ratings yet
1Z0 051 Exam Dumps 2018
11 pages
SQL Stored Procedures Guide
No ratings yet
SQL Stored Procedures Guide
5 pages
Active Directory Forest Recovery Guide
No ratings yet
Active Directory Forest Recovery Guide
17 pages
ADO.NET Data Objects Overview
No ratings yet
ADO.NET Data Objects Overview
29 pages
Step by Step Upgrading Oracle 10g To Oracle 11g: Samadhandba
No ratings yet
Step by Step Upgrading Oracle 10g To Oracle 11g: Samadhandba
27 pages
Data Mining
No ratings yet
Data Mining
5 pages
San Unit-Wise Questions
No ratings yet
San Unit-Wise Questions
6 pages
Ans Assi2
No ratings yet
Ans Assi2
10 pages
SAP HANA Modeling Guide For SAP HANA XS Advanced Model en
No ratings yet
SAP HANA Modeling Guide For SAP HANA XS Advanced Model en
146 pages
Payroll Management System
No ratings yet
Payroll Management System
3 pages
Match Rule Configuration Example
No ratings yet
Match Rule Configuration Example
24 pages
D99340GC20 Ag
No ratings yet
D99340GC20 Ag
476 pages
ER Model Basics for Database Design
No ratings yet
ER Model Basics for Database Design
69 pages
Anil SR Dataengineer
No ratings yet
Anil SR Dataengineer
1 page
3rd Term DP Notes For Ss2
100% (2)
3rd Term DP Notes For Ss2
60 pages
CS502 DBMS
No ratings yet
CS502 DBMS
26 pages
Function vs. Procedure
No ratings yet
Function vs. Procedure
2 pages
Extracting Hyperion Essbase Metadata To Oracle Data Integrator
No ratings yet
Extracting Hyperion Essbase Metadata To Oracle Data Integrator
36 pages
Basic Guide To Manage LVM
No ratings yet
Basic Guide To Manage LVM
8 pages
Data File Handling Worksheet
No ratings yet
Data File Handling Worksheet
10 pages
R2032121 1
No ratings yet
R2032121 1
13 pages
!AutoPlant V8i
No ratings yet
!AutoPlant V8i
57 pages
1674176984
No ratings yet
1674176984
3 pages
Unit 2 Assessment - Attempt Review - Saylor Academy
No ratings yet
Unit 2 Assessment - Attempt Review - Saylor Academy
24 pages
Python Practical File Guide
No ratings yet
Python Practical File Guide
37 pages
Oracle Distributed Transactions Guide
No ratings yet
Oracle Distributed Transactions Guide
47 pages

Getting Start With Pandas

Uploaded by

Getting Start With Pandas

Uploaded by

UNIVERSITY OF STEEL TECHNOLOGY

Introduction to Data Science and

Dr. Ravindra Singh Saluja

OP Jindal University, Raigarh

• Pandas is primarily used for working

# Creating a DataFrame from a dictionary

• Sorting: Sort the DataFrame by a specific column.

# Dropping rows with any missing values

# Merging two DataFrames on a common column

merged_df = pd.merge(df1, df2, on='ID', how='inner')

# Writing to a CSV file

df['Name'] = df['Name'].str.upper() # Convert names to uppercase

• Basic Statistical Measures:

You might also like