DataFrame 二维数组
DataFrame是一个【表格型】的数据结构,可以看做是【由Series组成的字典】(共用同一个索引)。DataFrame由按一定顺序排列的多列数据组成。设计初衷是将Series的使用场景从一维拓展到多维。DataFrame既有行索引,也有列索引。
- 行索引:index
- 列索引:columns
- 值:values(NumPy的二维数组)
DataFrame的创建
最常用的方法是传递一个字典来创建。Dataframe以字典的键作为每一【列】的名称,以字典的值(一个数组)作为每一列。
此外,DataFrame会自动加上每一行的索引(和Series一样)。
同Series一样,若传入的列与字典的键不匹配,则相应的值为NaN。
data = { 'name':['miku','39','2007'], 'age':[18,19,20], } miku = pd.DataFrame(data) miku
输出结果