量化应用技巧
Pandas是量化交易中最核心的数据处理库。建议熟练掌握时间序列操作, 特别是pct_change()、rolling()和shift()方法,这些在计算收益率、技术指标时非常常用。
Python量化编程速查
| 函数 | 说明 | 示例 |
|---|---|---|
pd.DataFrame() |
创建DataFrame | pd.DataFrame({'A': [1, 2]}) |
pd.read_csv() |
读取CSV文件 | pd.read_csv('data.csv') |
pd.read_excel() |
读取Excel文件 | pd.read_excel('data.xlsx') |
pd.read_sql() |
读取SQL数据库 | pd.read_sql(query, conn) |
pd.Series() |
创建Series | pd.Series([1, 2, 3]) |
| 方法 | 说明 | 示例 |
|---|---|---|
df.head() |
查看前几行 | df.head(5) |
df.tail() |
查看后几行 | df.tail(5) |
df.info() |
数据信息摘要 | df.info() |
df.describe() |
统计描述 | df.describe() |
df.shape |
维度 | df.shape |
df.dtypes |
数据类型 | df.dtypes |
| 方法 | 说明 | 示例 |
|---|---|---|
df['col'] |
选择列 | df['close'] |
df.loc[] |
标签索引 | df.loc['2024-01-01'] |
df.iloc[] |
位置索引 | df.iloc[0:10] |
df.query() |
条件查询 | df.query('close > 100') |
df.sample() |
随机采样 | df.sample(n=10) |
| 方法 | 说明 | 示例 |
|---|---|---|
df.drop() |
删除行/列 | df.drop(columns=['A']) |
df.fillna() |
填充缺失值 | df.fillna(0) |
df.dropna() |
删除缺失值 | df.dropna() |
df.sort_values() |
排序 | df.sort_values('date') |
df.groupby() |
分组聚合 | df.groupby('date').mean() |
df.merge() |
合并DataFrame | df.merge(other, on='date') |
df.resample() |
重采样 | df.resample('D').mean() |
| 方法 | 说明 | 示例 |
|---|---|---|
pd.to_datetime() |
转换为日期时间 | pd.to_datetime('2024-01-01') |
df.set_index() |
设置日期索引 | df.set_index('date') |
df.pct_change() |
计算变化率 | df['close'].pct_change() |
df.rolling() |
滚动窗口 | df['close'].rolling(5).mean() |
df.shift() |
数据平移 | df['close'].shift(1) |
Pandas是量化交易中最核心的数据处理库。建议熟练掌握时间序列操作, 特别是pct_change()、rolling()和shift()方法,这些在计算收益率、技术指标时非常常用。