DEV Community

Francisco Júnior
Francisco Júnior

Posted on • Edited on

Explorando as Funções Básicas no Python Pandas: Manipulação e Análise de Dados Simplificadas

O Python Pandas é uma biblioteca amplamente utilizada para manipulação e análise de dados em Python. Com suas estruturas de dados eficientes, como DataFrames e Series, juntamente com uma variedade de funções e métodos úteis, o Pandas simplifica a tarefa de trabalhar com dados. Neste artigo, vamos explorar algumas das funções básicas no Pandas e fornecer exemplos práticos para ilustrar seu uso.

Instalação e Importação do Pandas

Antes de começarmos, certifique-se de ter o Pandas instalado em seu ambiente Python. Você pode instalá-lo utilizando o seguinte comando:

pip install pandas 
Enter fullscreen mode Exit fullscreen mode

Após a instalação, importe o Pandas em seu script Python:

import pandas as pd 
Enter fullscreen mode Exit fullscreen mode

Agora, vamos explorar algumas das funções básicas disponíveis no Pandas:

1 - Criando um DataFrame

Podemos criar um DataFrame no Pandas a partir de várias fontes, como listas, dicionários, arquivos CSV, Excel, SQL e muito mais. Aqui está um exemplo simples de criação de um DataFrame a partir de um dicionário:

import pandas as pd # Criando um DataFrame a partir de um dicionário data = {'Nome': ['Alice', 'Bob', 'Charlie'], 'Idade': [25, 30, 35], 'Cidade': ['São Paulo', 'Rio de Janeiro', 'Curitiba']} df = pd.DataFrame(data) print(df) 
Enter fullscreen mode Exit fullscreen mode

2 - Exibindo Dados do DataFrame

O Pandas fornece várias funções para exibir os dados de um DataFrame. Aqui estão algumas das funções mais comuns:

  • head(): exibe as primeiras linhas do DataFrame (por padrão, as cinco primeiras linhas).
  • tail(): exibe as últimas linhas do DataFrame (por padrão, as cinco últimas linhas).
  • info(): fornece informações sobre as colunas do DataFrame, como nome, tipo de dados e valores não nulos.
  • describe(): calcula estatísticas descritivas para as colunas numéricas do DataFrame.
# Exibindo as primeiras linhas do DataFrame print(df.head()) # Exibindo as últimas linhas do DataFrame print(df.tail()) # Obtendo informações sobre o DataFrame print(df.info()) # Calculando estatísticas descritivas para colunas numéricas print(df.describe()) 
Enter fullscreen mode Exit fullscreen mode

3 - Manipulação de Dados

O Pandas oferece uma variedade de funções para manipular e transformar os dados em um DataFrame. Aqui estão algumas das funções mais comuns:

  • shape: retorna as dimensões do DataFrame (número de linhas e colunas).
  • columns: retorna os nomes das colunas do DataFrame.
  • loc[] e iloc[]: permitem acessar e modificar dados específicos no DataFrame, usando rótulos de índice ou posições numéricas, respectivamente.
  • drop(): remove linhas ou colunas do DataFrame.
  • fillna(): preenche os valores ausentes com um valor específico.
  • groupby(): agrupa os dados com base em uma ou mais colunas.
  • sort_values(): classifica o DataFrame com base em uma ou mais colunas.
# Obtendo as dimensões do DataFrame print(df.shape) # Obtendo os nomes das colunas do DataFrame print(df.columns) # Acessando e modificando dados específicos no DataFrame df.loc[1, 'Nome'] = 'Robert' df.iloc[2, 1] = 36 print(df) # Removendo uma coluna do DataFrame df = df.drop('Cidade', axis=1) print(df) # Preenchendo valores ausentes com um valor específico df['Idade'].fillna(0, inplace=True) print(df) # Agrupando dados com base em uma coluna grouped = df.groupby('Idade') print(grouped.get_group(30)) # Classificando o DataFrame com base em uma coluna df = df.sort_values('Idade') print(df) 
Enter fullscreen mode Exit fullscreen mode

4 - Leitura e Escrita de Dados

Além de criar um DataFrame a partir de fontes de dados existentes, o Pandas também oferece funções para ler e escrever dados em diferentes formatos, como CSV, Excel, SQL, JSON, HTML e muito mais.

# Lendo dados de um arquivo CSV data = pd.read_csv('dados.csv') # Escrevendo dados em um arquivo CSV df.to_csv('novo_dados.csv', index=False) # Lendo dados de uma planilha Excel data = pd.read_excel('dados.xlsx', sheet_name='Planilha1') # Escrevendo dados em uma planilha Excel df.to_excel('novo_dados.xlsx', sheet_name='Planilha1', index=False) # Lendo dados de um banco de dados SQL import sqlite3 conn = sqlite3.connect('database.db') data = pd.read_sql('SELECT * FROM tabela', conn) # Escrevendo dados em um banco de dados SQL df.to_sql('tabela', conn, if_exists='replace', index=False) 
Enter fullscreen mode Exit fullscreen mode

5 - Alterações no DataFrame

Explorando as Possibilidades de Alterações no DataFrame no Python Pandas

O Python Pandas é uma biblioteca poderosa para manipulação e análise de dados em Python. Além de oferecer funções básicas para criação e manipulação de DataFrames, o Pandas também fornece uma variedade de recursos para realizar alterações nos dados existentes. Neste artigo, vamos explorar algumas das possibilidades de alterações no DataFrame no Pandas e fornecer exemplos práticos para ilustrar seu uso.

5.1 - Renomeando Colunas

Podemos renomear as colunas de um DataFrame no Pandas usando o método rename(). Vamos ver um exemplo:

import pandas as pd # Criando um DataFrame data = {'Nome': ['Alice', 'Bob', 'Charlie'], 'Idade': [25, 30, 35], 'Cidade': ['São Paulo', 'Rio de Janeiro', 'Curitiba']} df = pd.DataFrame(data) # Renomeando colunas df.rename(columns={'Nome': 'Nome Completo', 'Cidade': 'Localização'}, inplace=True) print(df) 
Enter fullscreen mode Exit fullscreen mode

5.2 - Adicionando Colunas

Podemos adicionar colunas a um DataFrame existente no Pandas atribuindo um valor a uma nova coluna. Vamos ver um exemplo:

import pandas as pd # Criando um DataFrame data = {'Nome': ['Alice', 'Bob', 'Charlie'], 'Idade': [25, 30, 35]} df = pd.DataFrame(data) # Adicionando uma nova coluna df['Profissão'] = ['Engenheira', 'Desenvolvedor', 'Analista'] print(df) 
Enter fullscreen mode Exit fullscreen mode

5.3 - Removendo Colunas

Podemos remover colunas de um DataFrame no Pandas usando o método drop(). Vamos ver um exemplo:

import pandas as pd # Criando um DataFrame data = {'Nome': ['Alice', 'Bob', 'Charlie'], 'Idade': [25, 30, 35], 'Cidade': ['São Paulo', 'Rio de Janeiro', 'Curitiba']} df = pd.DataFrame(data) # Removendo uma coluna df = df.drop('Cidade', axis=1) print(df) 
Enter fullscreen mode Exit fullscreen mode

5.4 - Filtrando Linhas

Podemos filtrar linhas de um DataFrame com base em uma condição usando operadores lógicos e comparativos no Pandas. Vamos ver um exemplo:

import pandas as pd # Criando um DataFrame data = {'Nome': ['Alice', 'Bob', 'Charlie'], 'Idade': [25, 30, 35]} df = pd.DataFrame(data) # Filtrando linhas com base em uma condição filtro = df['Idade'] > 28 df_filtrado = df[filtro] print(df_filtrado) 
Enter fullscreen mode Exit fullscreen mode

5.5 - Alterando Valores

Podemos alterar valores em um DataFrame com base em uma condição usando operadores lógicos e comparativos no Pandas. Vamos ver um exemplo:

import pandas as pd # Criando um DataFrame data = {'Nome': ['Alice', 'Bob', 'Charlie'], 'Idade': [25, 30, 35]} df = pd.DataFrame(data) # Alterando valores com base em uma condição df.loc[df['Idade'] > 28, 'Idade'] = 40 print(df) 
Enter fullscreen mode Exit fullscreen mode

5.6 - Ordenando o DataFrame

Podemos ordenar um DataFrame com base em uma ou mais colunas usando o método sort_values() no Pandas. Vamos ver um exemplo:

import pandas as pd # Criando um DataFrame data = {'Nome': ['Alice', 'Bob', 'Charlie'], 'Idade': [25, 30, 35]} df = pd.DataFrame(data) # Ordenando o DataFrame com base em uma coluna df = df.sort_values('Idade') print(df) 
Enter fullscreen mode Exit fullscreen mode

O Python Pandas é uma biblioteca poderosa para manipulação e análise de dados em Python. Neste artigo, exploramos algumas das funções básicas disponíveis no Pandas, incluindo criação de DataFrame, exibição de dados, manipulação de dados e leitura/escrita de dados. Com esses exemplos, você está pronto para começar a explorar e aproveitar ao máximo o Pandas em suas tarefas de análise de dados. Lembre-se de consultar a documentação oficial do Pandas para obter mais detalhes e recursos avançados.

Top comments (0)