diff函数是用来将数据进行某种移动之后与原数据进行比较得出的差异数据,说白了其实就是求本行数据和上一行数据相减得到的值。
函数原型:
DataFrame.diff(periods=1,axis=0)
- periods:移动的幅度,int类型,默认值为1。
- axis:移动的方向,{0 or ‘index’, 1 or ‘columns’},如果为0或者’index’,则上下移动,如果为1或者’columns’,则左右移动。
举个例子
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df=pd.read_csv(r'data\sh600000.csv',encoding='gbk')
print(df.head(20)) #先调用前20条数据看看是否正常

我想看收盘价今天和前一天的涨跌,这个时候就可以使用diff函数来实现,具体操作如下:
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True) #处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.east_asian_width', True) #无法对齐主要是因为列标题是中文
df=pd.read_csv(r'data\sh600000.csv',encoding='gbk')
df['涨跌']=df['收盘价'].diff(1)
print(df.head(20))
