Como obter a Soma da Coluna Pandas

  1. Método para obter a soma da coluna Pandas DataFrame
  2. Soma cumulativa com groupby
  3. Método para obter a Soma das Colunas com base em Valores Condicionais de Outras Colunas
Como obter a Soma da Coluna Pandas

Apresentaremos como obter a soma de pandas dataFrame column. Inclui métodos como o cálculo da soma cumulativa com groupby, e a soma das colunas com base no condicional de outros valores de coluna.

Método para obter a soma da coluna Pandas DataFrame

Primeiro, criamos um array aleatório utilizando a biblioteca NumPy e depois obtemos a soma de cada coluna utilizando a função sum().

import numpy as np import pandas as pd  df = pd.DataFrame(np.random.randint(0, 10, size=(10, 4)), columns=list("1234")) print(df) Total = df["1"].sum() print("Column 1 sum:", Total) Total = df["2"].sum() print("Column 2 sum:", Total) Total = df["3"].sum() print("Column 3 sum:", Total) Total = df["4"].sum() print("Column 4 sum:", Total) 

O método Pandas DataFrame sum() totaliza a coluna Pandas.

Se você executar este código, você obterá a saída da seguinte forma.

 1 2 3 4 0 2 2 3 8 1 9 4 3 1 2 8 5 6 0 3 9 5 7 4 4 2 7 3 7 5 9 4 1 3 6 6 7 7 3 7 0 4 2 8 8 0 6 6 4 9 5 8 7 2 Column 1 sum: 50 Column 2 sum: 52 Column 3 sum: 45 Column 4 sum: 40 

Soma cumulativa com groupby

Podemos obter a soma acumulada dos Pandas utilizando o método groupby. Considere as seguintes colunas DataFrame com Date, Fruit, e Sales:

import pandas as pd  df = pd.DataFrame(  {  "Date": ["08/09/2018", "10/09/2018", "08/09/2018", "10/09/2018"],  "Fruit": ["Apple", "Apple", "Banana", "Banana"],  "Sale": [34, 12, 22, 27],  } ) 

Se quisermos calcular a soma cumulativa de Venda por Fruta e para cada data, podemos fazer:

import pandas as pd  df = pd.DataFrame(  {  "Date": ["08/09/2018", "10/09/2018", "08/09/2018", "10/09/2018"],  "Fruit": ["Apple", "Apple", "Banana", "Banana"],  "Sale": [34, 12, 22, 27],  } )  print(df.groupby(by=["Fruit", "Date"]).sum().groupby(level=[0]).cumsum()) 

Após executar os códigos acima, obteremos a seguinte saída, que mostra a soma cumulativa de Fruit para cada data:

Fruit Date Sale Apple 08/09/2018 34  10/09/2018 46 Banana 08/09/2018 22  10/09/2018 49  

Método para obter a Soma das Colunas com base em Valores Condicionais de Outras Colunas

Este método fornece funcionalidade para obter a soma se a condição dada for True e substituir a soma por um valor dado se a condição for False. Considere o seguinte código,

import numpy as np import pandas as pd  df = pd.DataFrame(np.random.randn(5, 3), columns=list("xyz"))  df["sum"] = df.loc[df["x"] > 0, ["x", "y"]].sum(axis=1)  df["sum"].fillna(0, inplace=True) print(df) 

No código acima, acrescentamos uma nova coluna sum ao DataFrame. O elemento sum é a soma das duas primeiras colunas ['x','y'] se ['x'] for maior que 1, caso contrário, substituímos sum por 0.

Depois de executar o código, obteremos a seguinte saída (os valores podem ser diferentes no seu caso).

 x y z sum 0 -1.067619 1.053494 0.179490 0.000000 1 -0.349935 0.531465 -1.350914 0.000000 2 -1.650904 1.534314 1.773287 0.000000 3 2.486195 0.800890 -0.132991 3.287085 4 1.581747 -0.667217 -0.182038 0.914530 
Está gostando dos nossos tutoriais? Inscreva-se no DelftStack no YouTube para nos apoiar na criação de mais vídeos tutoriais de alta qualidade. Inscrever-se

Artigo relacionado - Pandas DataFrame Column