pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?

摘要:
如何将所有nan值设置为空而不影响原始表中的数字字符串???

在利用pandas处理表格时,往往有时我们用表格做的测试用例往往会设计考一些必填项*故意赋值为空(代表不输入)的测试用例,

比如说我们的手机号、身份证号码、社会统一信用代码等都是数字型字符串。如下所示:

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?第1张

pandas读取表格,会把表格中的空单元格置为float类型的Nan值,会导致数字型字符串列的数据类型从原始的str类型自动转换为float类型,如下图所示:

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?第2张

读取的效果:

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?第3张

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?第4张

从上图可看出,pandas读取excel时,遇到空白单元格会自动置为nan值,float型。

导致原始表格中的文本类型的social_code(社会信用代码)和 telno(手机号)从原始的本文str类型转变为了float类型,导致数据显示错误,不是我们想要的结果。

那如何将nan值全部置为空,并且还不会影响原始表格中的数字型字符串呢???

我们可以在读取表格时,就以字符串型读取,如下图所示:

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?第5张

效果如下:

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?第6张

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?第7张

这时,原始的数字型字符串数据就不会受到nan值的影响了。

如果需要对nan值进行替换,直接采用fillna()填充即可。

 pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?第8张

替换、填充效果:

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?第9张

这样就完成了~~~~

免责声明:文章转载自《pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇安信可ESP-12F连接阿里云教程我想写一个前端开发工具(一):在npm发布模块下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

python数据分析——pandas的拼接操作

pandas的拼接操作 pandas的拼接分为两种: 级联:pd.concat, pd.append 合并:pd.merge, pd.join 1. 使用pd.concat()级联 pandas使用pd.concat函数,与np.concatenate函数类似,只是多了一些参数: objs axis=0 keys join='outer' /...

Python数据分析(三)pandas resample 重采样

下方是pandas中resample方法的定义,帮助文档http://pandas.pydata.org/pandas-docs/stable/timeseries.html#resampling中有更加详细的解释。 def resample(self, rule, how=None, axis=0, fill_method=None, closed=N...

pandas入门——loc与iloc函数

oc与iloc函数 loc函数 import pandas as pd import numpy # 导入数据 df = pd.read_csv(filepath_or_buffer="D://movie.csv") df_new = df.set_index(["country"]) df_new.loc[list(["Canada"])] #...

20个Pandas函数详解

作者|Soner Yıldırım 编译|VK 来源|Towards Data Science Pandas是一个python数据分析库。它提供了许多函数和方法来加快数据分析过程。pandas之所以如此普遍,是因为它具有强大的功能,以及他简单的语法和灵活性。 在这篇文章中,我将举例来解释20个常用的pandas函数。有些是很常见的,我敢肯定你以前用过。有些...

pandas的基础使用

从 CSV 文件中读取数据 这个数据集是一个列表,蒙特利尔的 7 个不同的自行车道上每天有多少人。 broken_df = pd.read_csv('../data/bikes.csv') # 查看前三行 broken_df[:3] 你可以看到这完全损坏了,说明读取方式不合适。 read_csv 拥有一堆选项能够让我们修复它,在这里我们: 将列分隔符改...

pandas 按某列中的指定字符拆分某列 pandas.DataFrame.field.str.split()

需求 把指定列的数据根据指定字符进行拆分,并保留拆分后所需的列; 原始数据:  需要将这列数据根据 ‘.’ 进行拆分,并保留 .DCE 前面的部分; 解决 借助于 pandas.DataFrame.field.str.split() df['ts_code'].str.split('.', expand=True) # expand=True 将拆分出...