数据结构:Series 和 DataFrame
Series 和 DataFrame 这两个核心数据结构,他们分别代表着一维的序列和二维的表结构。
Series 是个定长的字典序列。说是定长是因为在存储的时候,相当于两个 ndarray,这也是和字典结构最大的不同。因为在字典的结构里,元素的个数是不固定的。
Series 有两个基本属性:index 和 values。在 Series 结构中,index 默认是 0,1,2,……递增的整数序列,当然我们也可以自己来指定索引,比如 index=[‘a’, ‘b’, ‘c’, ‘d’]。
import pandas as pd
from pandas import Series, DataFrame
x1 = Series([1,2,3,4]) #index 采用的是默认值
x2 = Series(data=[1,2,3,4], index=['a', 'b', 'c', 'd']) #index 进行了指定
x3 = Series({'a':1, 'b':2, 'c':3, 'd':4}) #采用字典的方式来创建 Series
print (x1)
print (x2)
print (x3)
结果:
0 1
1 2
2 3
3 4
dtype: int64
a 1
b 2
c 3
d 4
dtype: int64
a 1
b 2
c 3
d 4
dtype: int64
DataFrame 类型数据结构类似数据库表
韧桂 2019-04-20