Pandas之Dataframe叠加,排序,统计,重新设置索引

摘要:
如果有多个df,可以使用以下方法建立a_ lista_ list=[]foriinrange:a_ list。append II:排序df。排序值sdf。sort_Values这两个表达式的结果不同。第一个是基于B行的,然后是B相同时的A行。第二种方法基于A行,然后是B行。如果对多个列的计数值进行计数,可以使用以下方法:1a=[[“None”forcolinage]forrowinrange(len(df[“A”]*len(df[“B”])3k=04 foriinrange(len)(df[”A“]):5forjinrange(len[”B“]):6a[k][0]=df。A[i]7a[k][1]=df。B[j]8data_选择=df[df.A==x[i]&df。B==x[j]]9a[k][2]=len(data_select)10ViewCodedf[“A”]。unique()这将直接获取列A4中的唯一值。重置索引df=df。reset_索引(drop=True)重置行索引

Pandas之Dataframe索引,排序,统计,重新设置索引

一:叠加

import pandas as pd

a_list = [df1,df2,df3]
add_data = pd.concat(a_list,ignore_index = True)

其中的ignore_index参数代表是否重新建立索引。

如果df比较多,可以采用如下方法建立a_list

a_list = []
for i in range(len(df)):
     a_list.append(df[i])

二:排序

df.sort_values(by=["B","A"] , ascending=(False,False))
df.sort_values(by=["A","B"] , ascending=(False,False))

这两个表达式结果不一样,第一个是先按B排的基础上,当B一样时再按A排,第二个是先按照A排完再按B排。

其中ascending默认是FALSE,即默认会按照相应的by中的第几个元素降序排序,当希望用第几个元素升序排序时,可以设置成TRUE

三:统计

df["A"].value_counts()#对A列进行统计,计数然后生成一个只有一个A值和对应计数值。

这个是统计A列中的唯一值有多少。

如果统计多列的计数值,可以采用如下方法

Pandas之Dataframe叠加,排序,统计,重新设置索引第1张Pandas之Dataframe叠加,排序,统计,重新设置索引第2张
 1 a = [["None" for col in range(3)] for row in
 2 range(len(df["A"]*len(df["B"])
 3 k = 0
 4 for i in range(len(df["A"]):
 5     for j in range(len(df["B"]):
 6         a[k][0] = df.A[i]
 7         a[k][1] = df.B[j]
 8         data_select = df[df.A==x[i]&df.B==x[j]]
 9         a[k][2] = len(data_select)
10         
View Code
df["A"].unique()

这个会直接取出A列中的唯一值

四、重新设置索引

df = df.reset_index(drop = True)

重新设置行索引

免责声明:文章转载自《Pandas之Dataframe叠加,排序,统计,重新设置索引》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇解读 JavaScript 之引擎、运行时和堆栈调用android 边框圆角下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Mysql中查询索引和创建索引

查询索引   show index from table_name 1.添加PRIMARY KEY(主键索引) ALTER TABLE `table_name` ADD PRIMARY KEY ( `column` ) 2.添加UNIQUE(唯一索引) ALTER TABLE `table_name` ADD UNIQUE ( `column` ) 3.添...

SortedList、SortedSet、HashSet、Hashtable、Dictionary、SortedDictionary 排序/可重复排序/过滤重复排序等简单对比

//泛型的键值集合/有序/Hash算法/占内存较大/不排序,不受装填因子的限制,对读写操作效率较高 Dictionary<int, string> dc = new Dictionary<int, string>(); dc.Add(1, "111111");...

mssql性能优化

总结下SQL SERVER数据库性能优化相关的注意事项,在网上搜索了一下,发现很多文章,有的都列出了上百条,但是仔细看发现,有很多似是而非或者过时(可能对SQL SERVER6.5以前的版本或者ORACLE是适用的)的信息,只好自己根据以前的经验和测试结果进行总结了。我始终认为,一个系统的性能的提高,不单单是试运行或者维护阶段的性能调优的任务,也不单单是开...

10条技巧优化数据库速度

  大多数网站的内容都存在数据库里,用户通过请求来访问内容。数据库非常的快,有许多技巧能让你优化数据库的速度,使你不浪费服务器的资源。在这篇文章中,我收录了十个优化数据库速度的技巧。   1、小心设计数据库   第一个技巧也许看来理所当然,但事实上大部分数据库的问题都来自于设计不好的数据库结构。   譬如我曾经遇见过将客户端信息和支付信息储存在同一个数据库...

CUSPARSE 第三章 CUSPARAE索引和数据格式

(纯属自学笔记,部分翻译,不会翻译的不翻译) 3.1 索引基本格式       该函数库支持 zero- and one-based 索引. The index base 是通过 cusparseIndexBase_t 选择, 且是一个独立参数,或者是矩阵形容器 cusparseMatDescr_t type的一部分 3.2 向量格式      略 3.3...

Pandas之Series+DataFrame

Series是带有标签的一维数组,可以保存任何数据类型(整数,字符串,浮点数,python对象) index查看series索引,values查看series值 series相比于ndarray,是一个自带索引index的数组--> 一维数组 + 对应索引 series和dict相比,series更像是一个有顺序的字典 创建方法 1.由字典创建,字典...