Home

韧桂

思考,总结

数据结构:Series 和 DataFrame

Series 和 DataFrame 这两个核心数据结构,他们分别代表着一维的序列和二维的表结构。

Series 是个定长的字典序列。说是定长是因为在存储的时候,相当于两个 ndarray,这也是和字典结构最大的不同。因为在字典的结构里,元素的个数是不固定的。

Series 有两个基本属性:index 和 values。在 Series 结构中,index 默认是 0,1,2,……递增的整数序列,当然我们也可以自己来指定索引,比如 index=[‘a’, ‘b’, ‘c’, ‘d’]。

import pandas as pd
from pandas import Series, DataFrame
x1 = Series([1,2,3,4])  #index 采用的是默认值
x2 = Series(data=[1,2,3,4], index=['a', 'b', 'c', 'd'])  #index 进行了指定
x3 = Series({'a':1, 'b':2, 'c':3, 'd':4})  #采用字典的方式来创建 Series
print (x1)
print (x2)
print (x3)
结果:
0    1
1    2
2    3
3    4
dtype: int64
a    1
b    2
c    3
d    4
dtype: int64
a    1
b    2
c    3
d    4
dtype: int64

DataFrame 类型数据结构类似数据库表

韧桂 2019-04-20