📊 DataFrame创建

函数 说明 示例
pd.DataFrame() 创建DataFrame pd.DataFrame({'A': [1, 2]})
pd.read_csv() 读取CSV文件 pd.read_csv('data.csv')
pd.read_excel() 读取Excel文件 pd.read_excel('data.xlsx')
pd.read_sql() 读取SQL数据库 pd.read_sql(query, conn)
pd.Series() 创建Series pd.Series([1, 2, 3])

🔍 数据查看

方法 说明 示例
df.head() 查看前几行 df.head(5)
df.tail() 查看后几行 df.tail(5)
df.info() 数据信息摘要 df.info()
df.describe() 统计描述 df.describe()
df.shape 维度 df.shape
df.dtypes 数据类型 df.dtypes

✏️ 数据选择

方法 说明 示例
df['col'] 选择列 df['close']
df.loc[] 标签索引 df.loc['2024-01-01']
df.iloc[] 位置索引 df.iloc[0:10]
df.query() 条件查询 df.query('close > 100')
df.sample() 随机采样 df.sample(n=10)

🔄 数据处理

方法 说明 示例
df.drop() 删除行/列 df.drop(columns=['A'])
df.fillna() 填充缺失值 df.fillna(0)
df.dropna() 删除缺失值 df.dropna()
df.sort_values() 排序 df.sort_values('date')
df.groupby() 分组聚合 df.groupby('date').mean()
df.merge() 合并DataFrame df.merge(other, on='date')
df.resample() 重采样 df.resample('D').mean()

时间序列操作

方法 说明 示例
pd.to_datetime() 转换为日期时间 pd.to_datetime('2024-01-01')
df.set_index() 设置日期索引 df.set_index('date')
df.pct_change() 计算变化率 df['close'].pct_change()
df.rolling() 滚动窗口 df['close'].rolling(5).mean()
df.shift() 数据平移 df['close'].shift(1)
💡
量化应用技巧

Pandas是量化交易中最核心的数据处理库。建议熟练掌握时间序列操作, 特别是pct_change()、rolling()和shift()方法,这些在计算收益率、技术指标时非常常用。