请 [注册] 或 [登录]  | 返回主站

量化交易吧 /  数理科学 帖子:3366781 新帖:20

Python入门(2)- 数据类型之列表

大师做交易发表于:5 月 10 日 07:14回复(1)

这是面向新用户的 Python 教程,并结合了 JoinQuant 获取到的数据进行了讲解。

如果你之前没有学过 Python, 或者对 Python 不熟,那不要再犹豫了,这个教程就是为你准备的!

更多内容请查看量化课堂 - Python编程板块。

本节概要: 介绍了列表的主要用法

【Python入门(2)】基本语法-数据类型之列表¶

新手在使用平台进行量化策略实现时,往往会被各种数据类型搞乱,不知道目前获取的数据是什么类型的,可以使用什么方法,所以梳理了一下。

在Python中有多种内建的数据结构,我们这里经常遇到的会有列表、字典、集合和元组,第三方库pandas还提供DataFrame和Series。

将逐步详细介绍列表、字典、集合、元组、DataFrame和Series的基本使用方法和小技巧,然后介绍在使用平台获取数据时不同数据类型的转换。

Python内嵌的数据类型主要包括以下两类:¶

有序:¶

List(列表),是有序集合,没有固定大小,可以通过对偏移量以及其他方法修改列表大小。列表的基本形式如:[1,2,3,4]

Tuple(元组),是有序集合,是不可变的,可以进行组合和复制运算后会生成一个新的元组。元组的基本形式比如:(1,3,6,10)

String(字符串),也是有序集合,字符串的基本形式比如:’hello’,这里不进行具体介绍。

无序:¶

Set(集合),是一个无序不重复元素的集。基本功能包括关系运算和消除重复元素。集合的基本形式如:set('abracadabra')

Dictionary(字典)是无序的键:值对 (key:value 对)集合,键必须是互不相同的(在同一个字典之内)。字典的基本形式如:{'jack': 4098, 'sape': 4139}

首先对列表进行介绍。

列表¶

List(列表) 是 Python 中最通用的序列。列表是一个任意类型对象位置的相关有序集合,它没有固定大小。不像字符串,其大小是可以变的,通过对偏移量进行赋值以及其他各种列表的方法进行调用,可以修改列表大小。

索引是从0开始而非1开始!!¶

列表中值的分割用变量[头下标:尾下标],就可以截取相应的列表,从左到右索引默认“0”开始的,从右到左索引默认-1开始,下标可以为空表示取到头或尾。可以对列表进行索引、切片等操作,看下面例子。

# 定义列表L
L = [1,2,3,4,5,6,7,8,9]

# 使用len()函数查看列表的长度
len(L)
9

①列表索引:

print L[0]
print L[-1] # 负数表示从后数第几个元素,-1即为列表的最后一个元素
1
9

②列表切片: (注意:切片并不会取到“尾下表”那个数)

L[1:5]
[2, 3, 4, 5]

③ +操作可以拼接列表

L + [2,3,4]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 2, 3, 4]

Python 的列表数据类型包含更多的方法。¶

list.append(x) 把一个元素添加到列表的结尾。

list.extend(L) 将一个给定列表中的所有元素都添加到另一个列表中。

list.insert(i, x) 在指定位置插入一个元素。第一个参数是准备插入到其前面的那个元素的索引,例如 a.insert(0, x) 会插入到整个列表之前,而 a.insert(len(a), x) 相当于 a.append(x)。

list.remove(x) 删除列表中值为 x 的第一个元素。如果没有这样的元素,就会返回一个错误。

list.pop([i]) 从列表的指定位置删除元素,并将其返回。如果没有指定索引,a.pop() 返回最后一个元素。元素随即从链表中被删除。(方法中 i 两边的方括号表示这个参数是可选的,而不是要求你输入一对方括号,这个经常会在 Python 库参考手册中遇到这样的标记。)

list.index(x) 返回列表中第一个值为 x 的元素的索引。如果没有匹配的元素就会返回一个错误。

list.count(x) 返回 x 在链表中出现的次数。

list.sort(cmp=None, key=None, reverse=False) 对列表中的元素进行排序(参数可以用来自定义排序方法,参考 sorted() 的更详细的解释)。

list.reverse() 就地倒排链表中的元素

del list[i] 有个方法可以从列表中按给定的索引而不是值来删除一个子项:del 语句。它不同于有返回值的 pop() 方法。语句 del 还可以从列表中删除切片或清空整个列表(我们以前介绍过一个方法是将空列表赋值给列表的切片)。

# 统计a中元素出现的次数
a = [1, 2, 3, 3, 1234.5]
print 'a中 1 出现的次数:',a.count(1)
print 'a中 3 出现的次数:',a.count(3) 
print 'a中 x 出现的次数:',a.count('x')
a中 1 出现的次数: 1
a中 3 出现的次数: 2
a中 x 出现的次数: 0
# 在a的尾部添加元素
a.append(555)
a
[1, 2, 3, 3, 1234.5, 555]
# 将[7,8,9]于a进行拼接
a.extend([7,8,9])
a
[1, 2, 3, 3, 1234.5, 555, 7, 8, 9]
# 在a中第三个位置插入-1
a.insert(2, -1)
a
[1, 2, -1, 3, 3, 1234.5, 555, 7, 8, 9]
# 返回2在a中的位置
a.index(2)
1
# 反向排列a
a.reverse()
a
[9, 8, 7, 555, 1234.5, 3, 3, -1, 2, 1]
# 对a进行排序,默认为升序!
a.sort()
a
[-1, 1, 2, 3, 3, 7, 8, 9, 555, 1234.5]
# 逆序排列a
a.sort(reverse=True)
a
[1234.5, 555, 9, 8, 7, 3, 3, 2, 1, -1]
# 删除列表a中值为 3 的第一个元素
a.remove(3)
a
[1234.5, 555, 9, 8, 7, 3, 2, 1, -1]
# 删除a中索引为0的元素
del a[0]
a
[555, 9, 8, 7, 3, 2, 1, -1]
# 删除a中索引为 2:4 的元素
del a[2:4]
a
[555, 9, 3, 2, 1, -1]

del 也可以删除整个变量,此后再引用命名 a 会引发错误(直到另一个值赋给它为止)。我们在后面的内容中可以看到 del 的其它用法。

del a
a
---------------------------------------------------------------------------
NameError                                 Traceback (most recent call last)
<ipython-input-16-ef9d13752aff> in <module>()
      1 del a
----> 2 a

NameError: name 'a' is not defined

把列表当作堆栈使用¶

列表方法使得列表可以很方便的做为一个堆栈来使用,堆栈作为特定的数据结构,最先进入的元素最后一个被释放(后进先出)。用 append() 方法可以把一个元素添加到堆栈中。用不指定索引的 pop() 方法可以把一个元素从堆栈顶释放出来。例如:

stack = [3, 4, 5]
stack.append(6)
stack.append(7)
stack
[3, 4, 5, 6, 7]
stack.pop()    #后进先出
7
stack
[3, 4, 5, 6]
print stack.pop()
print stack.pop()
print stack
6
5
[3, 4]

把列表当作队列使用¶

你也可以把列表当做队列使用,队列作为特定的数据结构,最先进入的元素最先释放(先进先出)。不过,列表这样用效率不高。相对来说从列表末尾添加和弹出很快;在头部插入和弹出很慢(因为为了一个元素,要移动整个列表中的所有元素)。

要实现队列,使用 collections.deque,它为在首尾两端快速插入和删除而设计。例如:

from collections import deque
queue = deque(["Eric", "John", "Michael"])
queue.append("Terry")
queue.append("Graham")
queue
deque(['Eric', 'John', 'Michael', 'Terry', 'Graham'])
print queue.popleft()                 # 先到的先出
print queue.popleft()
print queue
Eric
John
deque(['Michael', 'Terry', 'Graham'])

这一节就学到这里就结束了。

下一节会向大家介绍数据类型的另一个重要成员——字典!

全部回复

0/140

量化课程

    移动端课程