pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响，让数字型字符串保持原始str类型，而不会自动变为float类型？

摘要：

如何将所有nan值设置为空而不影响原始表中的数字字符串？？？

在利用pandas处理表格时，往往有时我们用表格做的测试用例往往会设计考一些必填项*故意赋值为空（代表不输入）的测试用例，

比如说我们的手机号、身份证号码、社会统一信用代码等都是数字型字符串。如下所示：

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响，让数字型字符串保持原始str类型，而不会自动变为float类型？第1张

pandas读取表格，会把表格中的空单元格置为float类型的Nan值，会导致数字型字符串列的数据类型从原始的str类型自动转换为float类型，如下图所示：

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响，让数字型字符串保持原始str类型，而不会自动变为float类型？第2张

读取的效果：

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响，让数字型字符串保持原始str类型，而不会自动变为float类型？第3张

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响，让数字型字符串保持原始str类型，而不会自动变为float类型？第4张

从上图可看出，pandas读取excel时，遇到空白单元格会自动置为nan值，float型。

导致原始表格中的文本类型的social_code（社会信用代码）和 telno（手机号）从原始的本文str类型转变为了float类型，导致数据显示错误，不是我们想要的结果。

那如何将nan值全部置为空，并且还不会影响原始表格中的数字型字符串呢？？？

我们可以在读取表格时，就以字符串型读取，如下图所示：

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响，让数字型字符串保持原始str类型，而不会自动变为float类型？第5张

效果如下：

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响，让数字型字符串保持原始str类型，而不会自动变为float类型？第6张

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响，让数字型字符串保持原始str类型，而不会自动变为float类型？第7张

这时，原始的数字型字符串数据就不会受到nan值的影响了。

如果需要对nan值进行替换，直接采用fillna()填充即可。

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响，让数字型字符串保持原始str类型，而不会自动变为float类型？第8张

替换、填充效果：

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响，让数字型字符串保持原始str类型，而不会自动变为float类型？第9张

这样就完成了~~~~

python数据分析——pandas的拼接操作

pandas的拼接操作 pandas的拼接分为两种：级联：pd.concat, pd.append 合并：pd.merge, pd.join 1. 使用pd.concat()级联 pandas使用pd.concat函数，与np.concatenate函数类似，只是多了一些参数： objs axis=0 keys join='outer' /...

Python数据分析（三）pandas resample 重采样

下方是pandas中resample方法的定义，帮助文档http://pandas.pydata.org/pandas-docs/stable/timeseries.html#resampling中有更加详细的解释。 def resample(self, rule, how=None, axis=0, fill_method=None, closed=N...

pandas入门——loc与iloc函数

oc与iloc函数 loc函数 import pandas as pd import numpy # 导入数据 df = pd.read_csv(filepath_or_buffer="D://movie.csv") df_new = df.set_index(["country"]) df_new.loc[list(["Canada"])] #...

20个Pandas函数详解

作者|Soner Yıldırım 编译|VK 来源|Towards Data Science Pandas是一个python数据分析库。它提供了许多函数和方法来加快数据分析过程。pandas之所以如此普遍，是因为它具有强大的功能，以及他简单的语法和灵活性。在这篇文章中，我将举例来解释20个常用的pandas函数。有些是很常见的，我敢肯定你以前用过。有些...

pandas的基础使用

从 CSV 文件中读取数据这个数据集是一个列表，蒙特利尔的 7 个不同的自行车道上每天有多少人。 broken_df = pd.read_csv('../data/bikes.csv') # 查看前三行 broken_df[:3] 你可以看到这完全损坏了，说明读取方式不合适。 read_csv 拥有一堆选项能够让我们修复它，在这里我们：将列分隔符改...

pandas 按某列中的指定字符拆分某列 pandas.DataFrame.field.str.split()

需求把指定列的数据根据指定字符进行拆分，并保留拆分后所需的列；原始数据：需要将这列数据根据 ‘.’ 进行拆分，并保留 .DCE 前面的部分；解决借助于 pandas.DataFrame.field.str.split() df['ts_code'].str.split('.', expand=True) # expand=True 将拆分出...

pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响，让数字型字符串保持原始str类型，而不会自动变为float类型？

相关文章

python数据分析——pandas的拼接操作

Python数据分析（三）pandas resample 重采样

pandas入门——loc与iloc函数

20个Pandas函数详解

pandas的基础使用

pandas 按某列中的指定字符拆分某列 pandas.DataFrame.field.str.split()

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表