在pandas库里面有多个对于字符串的处理方式,例如我们遇到带有单位符号的数据要怎么处理呢?,其实在pandas库里面有一种常见的处理方法就是函数,下面我们拿一个例子来说明一下。
首先打开一份数据
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True) #处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.east_asian_width', True) #无法对齐主要是因为列标题是中文
df=pd.read_excel(r'2013tianqi_clear.xls',encoding='gbk')
print(df.head(40))

假设我需要把最高温和最低温的单位℃去掉,然后再让它们进行数学运算
处理方法如下:
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True) #处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.east_asian_width', True) #无法对齐主要是因为列标题是中文
df=pd.read_excel(r'2013tianqi_clear.xls',encoding='gbk')
df.loc[:,'最高温度']=df['最高温度'].str.replace('℃','').astype('int32')
df.loc[:,'最低温度']=df['最低温度'].str.replace('℃','').astype('int32')
print(df.head(40))

这样后面的单位符号就去掉了