Pandas中解析多索引Excel文件(python编程)

介绍:我有一个带有三级列MultiIndex的时间序列excel文件,如果可能的话我想成功解析.关于如何对堆栈溢出的索引执行此操作有一些结果但不是列,并且parse函数具有似乎不占用行列表的头.ExcelFile看起来像如下所示:A列是从A4开始的所有时间序列日期B列有top_level1(B1)mid_level1(B2)

介绍:我有一个带有三级列MultiIndex的时间序列excel文件,如果可能的话我想成功解析.关于如何对堆栈溢出的索引执行此操作有一些结果但不是列,并且parse函数具有似乎不占用行列表的头.ExcelFile看起来像如下所示:A列是从A4开始的所有时间序列日期B列有top_level1(B1)mid_level1(B2)。

Pandas中解析多索引Excel文件(python编程)


我有一个带有三级列MultiIndex的时间序列excel文件,如果可能的话我想成功解析.关于如何对堆栈溢出的索引执行此操作有一些结果但不是列,并且parse函数具有似乎不占用行列表的头.

ExcelFile看起来像如下所示:

A列是从A4开始的所有时间序列日期
B列有top_level1(B1)mid_level1(B2)low_level1(B3)数据(B4-B100)
C列具有null(C1)null(C2)low_level2(C3)数据(C4-C100)
列D具有空(D1)mid_level2(D2)low_level1(D3)数据(D4-D100)
E列具有空(E1)null(E2)low_level2(E3)数据(E4-E100)
……

因此,有两个low_level值,许多mid_level值和一些top_level值,但技巧是顶级和中级值为null,并假设为左侧的值.因此,例如,上面的所有列都将top_level1作为顶部多索引值.

到目前为止,我最好的想法是使用转置,但它填充未命名:#无处不在,似乎不起作用.在Pandas 0.13中,read_csv似乎有一个可以获取列表的头参数,但这似乎不适用于解析.

解决方法

您可以填充空值.我没有你的文件,但你可以测试

#Headers as rows for now
df = pd.read_excel(xls_file,header=None,index_col=0) 

#fill in Null values in "Headers"
df = df.fillna(method=ffill,axis=1) 

#create multiindex column names
df.columns=pd.MultiIndex.from_arrays(df[:3].values,names=[top,mid,low]) 

#Just name of index
df.index.name=Date 

#remove 3 rows which are already used as column names
df = df[pd.notnull(df.index)]


总结

以上是为你收集整理的python – 在Pandas中解析多索引Excel文件全部内容,希望文章能够帮你解决python – 在Pandas中解析多索引Excel文件所遇到的程序开发问题。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论