Press "Enter" to skip to content

Pandas去除列数据中的单位符号

在pandas库里面有多个对于字符串的处理方式,例如我们遇到带有单位符号的数据要怎么处理呢?,其实在pandas库里面有一种常见的处理方法就是函数,下面我们拿一个例子来说明一下。

首先打开一份数据

import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)  #处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.east_asian_width', True)   #无法对齐主要是因为列标题是中文

df=pd.read_excel(r'2013tianqi_clear.xls',encoding='gbk')

print(df.head(40))

假设我需要把最高温和最低温的单位℃去掉,然后再让它们进行数学运算

处理方法如下:

import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)  #处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.east_asian_width', True)   #无法对齐主要是因为列标题是中文

df=pd.read_excel(r'2013tianqi_clear.xls',encoding='gbk')
df.loc[:,'最高温度']=df['最高温度'].str.replace('℃','').astype('int32')
df.loc[:,'最低温度']=df['最低温度'].str.replace('℃','').astype('int32')

print(df.head(40))

这样后面的单位符号就去掉了

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注