series和读取外部数据

摘要:
importpandasaspdimportnumpyasnpimportstringt=pd.SeriesprintSeries对象本质上由两个数组构成,一个数组构成对象的键,一个数组构成对象的值,键→值7、pandas之读取外部数据现在假设我们有一个组关于狗的名字的统计数据,那么为了观察这组数据的情况,我们应该怎么做呢?
1、为什么学习pandas

我们并不是不愿意学习新的知识,只是在学习之前我们更想知道学习他们能够帮助我们解决什么问题。——伟哥

numpy虽然能够帮助我们处理数值,但是pandas除了处理数值之外(基于numpy),还能够帮助我们处理其他类型的数据(字符串、时间序列等等)

2、什么是pandas

pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language.

译:pandas 是一个开源的、BSD 许可的库,为 Python 编程语言提供高性能、易于使用的数据结构和数据分析工具。

3、pandas的常用数据类型
  • Series 一维,带标签数组(索引)
  • DataFrame 二维,Series容器
4、pandas之Series创建
import pandas as pd
import numpy as np
import string

t = pd.Series(np.arange(10), index=list(string.ascii_uppercase[:10]))
print(t)

A 0
B 1
C 2
D 3
E 4
F 5
G 6
H 7
I 8
J 9
dtype: int32

测试一个小案例:

import pandas as pd

student = {"name": "xiaoming", "age": 18, "tel": 110}
t = pd.Series(student)
print(t)

name xiaoming
age 18
tel 110
dtype: object

再测试:

import pandas as pd
import string

a = {string.ascii_uppercase[i]: i for i in range(10)}
t = pd.Series(a, index=list(string.ascii_uppercase[5:15]))
print(t)

F 5.0
G 6.0
H 7.0
I 8.0
J 9.0
K NaN
L NaN
M NaN
N NaN
O NaN
dtype: float64

重新指定其他的索引之后,如果能对上,就取值,否则为NaN

注意:pandas会自动根据数据类型更改series的dtype类型

5、pandas之Series切片和索引
import pandas as pd
import numpy as np
import string

t = pd.Series(np.arange(10), index=list(string.ascii_uppercase[:10]))
print(t)

测试如下:

image.png

image.png

切片:直接传入start, end或者步长即可
索引:一个的时候直接传入序号或者 index,多个的时候传入序号或者 index的列表

6、pandas之Series的索引和值

对于一个陌生的series类型,我们如何知道他的索引和具体的值呢?

import pandas as pd
import numpy as np
import string

t = pd.Series(np.arange(10), index=list(string.ascii_uppercase[:10]))
print(t)

image.png

Series对象本质上由两个数组构成,一个数组构成对象的键(index,索引),一个数组构成对象的值( values),键→值

7、pandas之读取外部数据

现在假设我们有一个组关于狗的名字的统计数据,那么为了观察这组数据的情况,我们应该怎么做呢?

数据来源:https://www.kaggle.com/new-york-city/nyc-dog-names/data

image.png

import pandas as pd

# 直接使用pandas读取csv文件
test = pd.read_csv("./dog.csv")
print(test)

image.png

但是,还有一个问题:

对于数据库比如mysql或者mongodb中数据我们如何使用呢?

pd.read_sql(sql_sentence,connection)

免责声明:文章转载自《series和读取外部数据》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇二十、oracle pl/sql基础vue + element ui 打印下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

zabbix主动模式无法获取网卡和文件系统数据

zabbix版本为4.2,根据网上教程将zabbixagent设置成主动模式后,将templates中各Items的type改为Zabbix agent (active),同时将Discovery rules中网卡及文件系统相关的两个rules的Type改成了Zabbix agent (active)。结果是CPU内存等数据都有,就是没有网卡和各分区目录的...

rabbitMq 索引 restfullApi 笔记

rabbitMq相关技术 什么是MQ? 消息队列(message Queue)本质上是个队列 FIFO先进先出 队列中放的是消息。 主要用途: 不同进程/线程thread之间的通信 为什么会使用消息队列? 1. 不同进程(process)之间传递消息的时候,两个进程之间耦合度过高,当改变其中一个进程时,那么另一个进程也将必须改变。使用MQ后可以先将消息放在...

Google Earth KML数据格式转换成Shp数据格式(转)

Link: http://www.cnblogs.com/sirc/archive/2010/07/19/1780699.html 1 打开Google Earth ,用工具条可以绘制点线面,比如画一条道路面: 点击OK结束画图操作 2 保存为KMZ或KML文件格式 File—Save—Save Place As 3 利用ArcGis的Data I...

Pandas数据合并方法merge()、concat()、combine_first()方法,数据的重塑和矩阵转置等操作的实现

阅读提示 本文将提到Pandas数据合并方法merge()、concat()、combine_first()方法,数据的重塑和矩阵转置等操作的实现 目录 阅读提示 一、数据合并 1、pandas.merge() 方法 以列名为连接键 以索引作为连接键 2、pandas.concat() 方法 3、combine_first() 方法 二、数...

java箭头函数,lambda表达式

jdk8+以上引入了箭头函数,即J8的lambda表达式。 // 1. 不需要参数,返回值为 5 () -> 5 // 2. 接收一个参数(数字类型),返回其2倍的值 x -> 2 * x // 3. 接受2个参数(数字),并返回他们的差值 (x, y) -> x – y // 4. 接收2个in...

MySQL通过自定义函数以及存储过程实现递归查询父级ID

1.存储过程定义  存储过程(Stored Procedure)是在大型数据库系统中,一组为了完成特定功能的SQL 语句集,存储在数据库中,经过第一次编译后调用不需要再次编译 2.为什么用存储过程实现树结构数据查询父级节点  1、能完成较复杂的运算与判断    2、可编程行强,灵活    3、SQL编程的代码可重复使用    4、预编译机制    5、减少...