Python基础知识(自存)
Python基础知识
基础语法
交互式编程
Linux :在命令行中输入 Python 命令即可启动交互式编程
Windows 在安装 Python 时已安装了交互式编程客户端
脚本式编程
所有 Python 文件将以 .py 为扩展名。
Python2.x 中使用 Python3.x 的 print 函数
如果 Python2.x 版本想使用 Python3.x 的 print 函数,可以导入 future 包,该包禁用 Python2.x 的 print 语句,采用 Python3.x 的 print 函数
1 | list =["a", "b", "c"] |
标识符
标识符由字母(区分大小写)、数字、下划线组成。所有标识符可以包括英文、数字以及下划线(_),但不能以数字开头。
以下划线开头的标识符是有特殊意义的。以单下划线开头 _foo 的代表不能直接访问的类属性,需通过类提供的接口进行访问,不能用 from xxx import * 而导入。
以双下划线开头的 __foo 代表类的私有成员,以双下划线开头和结尾的 foo 代表特殊方法专用的标识,如 init() 代表类的构造函数。
可以同一行显示多条语句,方法是用分号 ; 分开。
保留字符
不能用作常数或变数,或任何其他标识符名称。只包含小写字母。
and | exec | not |
---|---|---|
assert | finally | or |
break | for | pass |
class | from | |
continue | global | raise |
def | if | return |
del | import | try |
elif | in | while |
else | is | with |
except | lambda | yield |
行和缩进
代码块不使用大括号 {} 来控制类,函数以及其他逻辑判断,而是用缩进来写模块。
缩进的空白数量是可变的,但是所有代码块语句必须包含相同的缩进空白数量,这个必须严格执行。
1 | if True: |
以上实例缩进为四个空格
1 | #!/usr/bin/python |
执行以上代码,会出现如下错误提醒:
1 | File "test.py", line 11 |
IndentationError: unindent does not match any outer indentation level错误表明,你使用的缩进方式不一致,有的是 tab 键缩进,有的是空格缩进,改为一致即可。
IndentationError: unexpected indent 错误表明”**文件里格式错误,可能是 tab 和空格没对齐”,因此,在 Python 的代码块中必须使用相同数目的行首缩进空格数。
可以在每个缩进层次使用 单个制表符 或 两个空格 或 四个空格 , 切记不能混用。
多行语句
一般以新行作为语句的结束符。可以使用斜杠( \)将一行的语句分为多行显示,如下
1 | total = item_one + \ |
语句中包含 [], {} 或 () 括号就不需要使用多行连接符。如下
1 | days = ['Monday', 'Tuesday', 'Wednesday', |
同一行显示多条语句:
1 | #!/usr/bin/python |
输出结果:
1 | $ python test.py |
引号
1 | word = 'word' |
注释
单行注释采用 # 开头,多行注释使用三个单引号 ‘’’ 或三个双引号 “””
等待用户输入
1 | #!/usr/bin/python |
print 输出
默认输出是换行的,如果要实现不换行需要在变量末尾加上逗号 **,**。
1 | #!/usr/bin/python |
代码组
缩进相同的一组语句构成一个代码块,我们称之代码组。
像if、while、def和class这样的复合语句,首行以关键字开始,以冒号( : )结束,该行之后的一行或多行代码构成代码组。
变量类型
不需要类型声明,等号 = 用来给变量赋值。
1 | #!/usr/bin/python |
输出
1 | 100 |
多个变量赋值
1 | a = b = c = 1 |
1 | a, b, c = 1, 2, "john" |
标准数据类型
五个标准数据类型:
Numbers(数字)
String(字符串)
List(列表)
Tuple(元组)
Dictionary(字典)
数字
数字数据类型用于存储数值,不可改变,改变数字数据类型会分配一个新的对象。
指定一个值时,Number 对象就会被创建
1 | var1 = 1 |
del语句删除一些对象的引用
1 | del var1[,var2[,var3[....,varN]]] |
1 | del var |
支持的数字类型:int(有符号整型)long(长整型,也可以代表八进制和十六进制)float(浮点型)complex(复数)
字符串
1 | s = "a1a2···an" # n>=0 |
字串列表有2种取值顺序:
从左到右索引 默认0开始,最大范围是字符串长度少1
从右到左索引 默认-1开始,最大范围是字符串开头
实现从字符串中获取一段子字符串可以使用 [头下标:尾下标] 来截取相应的字符串,其中下标从 0 开始算起,可以是正数或负数,下标可以为空表示取到头或尾。
[头下标:尾下标] 获取的子字符串包含头下标的字符,但不包含尾下标的字符。如
1 | 'abcdef' s = |
当使用以冒号分隔的字符串,返回一个新的对象,结果包含了以这对偏移标识的连续的内容,左边的开始是包含了下边界。
上面的结果包含了 s[1] 的值 b,而取到的最大范围不包括尾下标,就是 s[5] 的值 f。
加号(+)是字符串连接运算符,星号(*)是重复操作。:
1 | #!/usr/bin/python # -*- coding: UTF-8 -*- str = 'Hello World!' print str # 输出完整字符串 print str[0] # 输出字符串中的第一个字符 print str[2:5] # 输出字符串中第三个至第六个之间的字符串 print str[2:] # 输出从第三个字符开始的字符串 print str * 2 # 输出字符串两次 print str + "TEST" # 输出连接的字符串 |
输出结果:
1 | Hello World! |
列表
序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。序列都可以进行的操作包括索引,切片,加,乘,检查成员。
Python有6个序列的内置类型,但最常见的是列表和元组。
List(列表) 是 Python 中使用最频繁的数据类型。
列表可以完成大多数集合类的数据结构实现。它支持字符,数字,字符串甚至可以包含列表(即嵌套)。
列表用 [ ] 标识,是 python 最通用的复合数据类型。
创建列表
1 | list1 = ['physics', 'chemistry', 1997, 2000] |
访问列表中的值
列表中值的切割也可以用到变量 [头下标:尾下标] ,就可以截取相应的列表,从左到右索引默认 0 开始,从右到左索引默认 -1 开始,下标可以为空表示取到头或尾。
加号 + 是列表连接运算符,用于组合列表,* 号用于重复列表,是重复操作。如下
1 | #!/usr/bin/python |
更新列表
可以对列表的数据项进行修改或更新,或使用append()方法来添加列表项
1 | #!/usr/bin/python |
输出结果
1 | ['Google', 'Python'] |
删除列表元素
使用del语句
1 | #!/usr/bin/python |
输出结果
1 | ['physics', 'chemistry', 1997, 2000] |
列表脚本操作符
Python 表达式 | 结果 | 描述 |
---|---|---|
len([1, 2, 3]) | 3 | 长度 |
[1, 2, 3] + [4, 5, 6] | [1, 2, 3, 4, 5, 6] | 组合 |
[‘Hi!’] * 4 | [‘Hi!’, ‘Hi!’, ‘Hi!’, ‘Hi!’] | 重复 |
3 in [1, 2, 3] | True | 元素是否存在于列表中 |
for x in [1, 2, 3]: print x, | 1 2 3 | 迭代 |
列表截取
1 | >>>L = ['Google', 'Runoob', 'Taobao'] |
描述:
Python 表达式 | 结果 | 描述 |
---|---|---|
L[2] | ‘Taobao’ | 读取列表中第三个元素 |
L[-2] | ‘Runoob’ | 读取列表中倒数第二个元素 |
L[1:] | [‘Runoob’, ‘Taobao’] | 从第二个元素开始截取列表 |
列表函数&方法
序号 | 函数 |
---|---|
1 | cmp(list1, list2)比较两个列表的元素 |
2 | len(list) 列表元素个数 |
3 | max(list) 返回列表元素最大值 |
4 | min(list)返回列表元素最小值 |
5 | list(seq)将元组转换为列表 |
序号 | 方法 |
---|---|
1 | list.append(obj) 在列表末尾添加新的对象 |
2 | list.count(obj) 统计某个元素在列表中出现的次数 |
3 | list.extend(seq)在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表) |
4 | list.index(obj) 从列表中找出某个值第一个匹配项的索引位置 |
5 | list.insert(index, obj) 将对象插入列表 |
6 | list.pop([index=-1])移除列表中的一个元素(默认最后一个元素),并且返回该元素的值 |
7 | list.remove(obj)移除列表中某个值的第一个匹配项 |
8 | list.reverse()反向列表中元素 |
9 | list.sort(cmp=None, key=None, reverse=False) 对原列表进行排序 |
元组
元组是另一个数据类型,类似于 List(列表)。
元组用 () 标识。内部元素用逗号隔开。但是元组不能二次赋值,相当于只读列表。
创建元组
1 | tup1 = ('physics', 'chemistry', 1997, 2000) |
访问元组
1 | #!/usr/bin/python |
输出
1 | tup1[0]: physics |
修改元组
元组中的元素值是不允许修改的,但我们可以对元组进行连接组合
1 | #!/usr/bin/python |
输出结果
1 | (12, 34.56, 'abc', 'xyz') |
删除元组
元组中的元素值是不允许删除的,但我们可以使用del语句来删除整个元组
1 | #!/usr/bin/python |
元组被删除后,输出变量会有异常信息
1 | ('physics', 'chemistry', 1997, 2000) |
元组运算符
与字符串一样,元组之间可以使用 + 号和 * 号进行运算。这就意味着他们可以组合和复制,运算后会生成一个新的元组。
Python 表达式 | 结果 | 描述 |
---|---|---|
len((1, 2, 3)) | 3 | 计算元素个数 |
(1, 2, 3) + (4, 5, 6) | (1, 2, 3, 4, 5, 6) | 连接 |
(‘Hi!’,) * 4 | (‘Hi!’, ‘Hi!’, ‘Hi!’, ‘Hi!’) | 复制 |
3 in (1, 2, 3) | True | 元素是否存在 |
for x in (1, 2, 3): print x, | 1 2 3 | 迭代 |
元组索引与截取
元组也是一个序列,可以访问元组中的指定位置的元素,也可以截取索引中的一段元素
1 | L = ('spam', 'Spam', 'SPAM!') |
Python 表达式 | 结果 | 描述 |
---|---|---|
L[2] | ‘SPAM!’ | 读取第三个元素 |
L[-2] | ‘Spam’ | 反向读取,读取倒数第二个元素 |
L[1:] | (‘Spam’, ‘SPAM!’) | 截取元素 |
无关闭分隔符
任意无符号的对象,以逗号隔开,默认为元组
1 | #!/usr/bin/python |
运行结果
1 | abc -4.24e+93 (18+6.6j) xyz |
元组内置函数
1 | cmp(tuple1, tuple2) 比较两个元组元素。 |
---|---|
2 | len(tuple) 计算元组元素个数。 |
3 | max(tuple) 返回元组中元素最大值。 |
4 | min(tuple) 返回元组中元素最小值。 |
5 | tuple(seq) 将列表转换为元组。 |
字典
字典(dictionary)是除列表以外python之中最灵活的内置数据结构类型。字典是另一种可变容器模型,且可存储任意类型对象。
字典的每个键值 key:value 对用冒号 : 分割,每个键值对之间用逗号 , 分割,整个字典包括在花括号 {} 中。格式列表是有序的对象集合,字典是无序的对象集合。
区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。
创建字典
格式
1 | d = {key1 : value1, key2 : value2 } |
注意:dict 作为 Python 的关键字和内置函数,变量名不建议命名为 dict。
1 | 'a': 1, 'b': 2, 'b': '3'} tinydict = { |
其他实例
1 | tinydict = {'Alice': '2341', 'Beth': '9102', 'Cecil': '3258'} |
访问字典里的值
1 | #!/usr/bin/python |
输出
1 | tinydict['Name']: Zara |
如果用字典里没有的键访问数据
1 | #!/usr/bin/python |
1 | tinydict['Alice']: |
1 | #!/usr/bin/python |
输出结果
1 | This is one |
修改字典
向字典添加新内容的方法是增加新的键/值对,修改或删除已有键/值对
1 | #!/usr/bin/python |
输出
1 | tinydict['Age']: 8 |
删除字典元素
能删单一的元素也能清空字典,清空只需一项操作。
显示删除一个字典用del命令
1 | #!/usr/bin/python |
但这会引发一个异常,因为用del后字典不再存在。
字典键的特性
- 不允许同一个键出现两次。创建时如果同一个键被赋值两次,最后的一个键值对会替换前面的。
- 键必须不可变,所以可以用数字,字符串或元组充当,列表则不行。
字典内置函数&方法
内置函数
1 | cmp(dict1, dict2) 比较两个字典元素。 |
---|---|
2 | len(dict) 计算字典元素个数,即键的总数。 |
3 | str(dict) 输出字典可打印的字符串表示。 |
4 | type(variable) 返回输入的变量类型,如果变量是字典就返回字典类型。 |
内置方法
函数及描述 |
---|
dict.clear() 删除字典内所有元素 |
dict.copy() 返回一个字典的浅复制 |
[dict.fromkeys(seq, val]) 创建一个新字典,以序列 seq 中元素做字典的键,val 为字典所有键对应的初始值 |
dict.get(key, default=None) 返回指定键的值,如果值不在字典中返回default值 |
dict.items() 以列表返回可遍历的(键, 值) 元组数组 |
dict.keys() 以列表返回一个字典所有的键 |
dict.setdefault(key, default=None) 和get()类似, 但如果键不存在于字典中,将会添加键并将值设为default |
dict.update(dict2) 把字典dict2的键/值对更新到dict里 |
dict.values() 以列表返回字典中的所有值 |
[pop(key,default]) 删除字典给定键 key 所对应的值,返回值为被删除的值。key值必须给出。 否则,返回default值。 |
popitem() 返回并删除字典中的最后一对键和值。 |
数据类型转换
函数 | 描述 |
---|---|
int(x [,base]) | 将x转换为一个整数 |
long(x [,base] ) | 将x转换为一个长整数 |
float(x)] | 将x转换到一个浮点数 |
complex(real [,imag]) | 创建一个复数 |
str(x) | 将对象 x 转换为字符串 |
repr(x) | 将对象 x 转换为表达式字符串 |
eval(str) | 用来计算在字符串中的有效Python表达式,并返回一个对象 |
tuple(s) | 将序列 s 转换为一个元组 |
list(s) | 将序列 s 转换为一个列表 |
set(s) | 转换为可变集合 |
dict(d) | 创建一个字典。d 必须是一个序列 (key,value)元组。 |
frozenset(s) | 转换为不可变集合 |
chr(x) | 将一个整数转换为一个字符 |
unichr(x) | 将一个整数转换为Unicode字符 |
ord(x) | 将一个字符转换为它的整数值 |
hex(x) | 将一个整数转换为一个十六进制字符串 |
oct(x) | 将一个整数转换为一个八进制字符串 |
运算符
算术运算符
整数除整数,只能得出整数。如果要得到小数部分,把其中一个数改成浮点数即可。
1 | 1/2 |
比较运算符
赋值运算符
1 | #!/usr/bin/python |
输出
1 | 1 - c 的值为: 31 |
位运算符
按位运算符是把数字看作二进制来进行计算的。按位运算法则如下:
下表中变量 a 为 60,b 为 13,二进制格式如下:
1 | a = 0011 1100 |
运算符 | 描述 | 实例 |
---|---|---|
& | 按位与运算符:参与运算的两个值,如果两个相应位都为1,则该位的结果为1,否则为0 | (a & b) 输出结果 12 ,二进制解释: 0000 1100 |
| | 按位或运算符:只要对应的二个二进位有一个为1时,结果位就为1。 | (a | b) 输出结果 61 ,二进制解释: 0011 1101 |
^ | 按位异或运算符:当两对应的二进位相异时,结果为1 | (a ^ b) 输出结果 49 ,二进制解释: 0011 0001 |
~ | 按位取反运算符:将二进制表示中的每一位取反,0 变为 1,1 变为 0。**~x** 类似于 -x-1 | (~a ) 输出结果 -61 ,二进制解释: 1100 0011 (以补码形式表示),在一个有符号二进制数的补码形式。 |
<< | 左移动运算符:运算数的各二进位全部左移若干位,由 << 右边的数字指定了移动的位数,高位丢弃,低位补0。 | a << 2 输出结果 240 ,二进制解释: 1111 0000 |
>> | 右移动运算符:把”>>”左边的运算数的各二进位全部右移若干位,**>>** 右边的数字指定了移动的位数 | a >> 2 输出结果 15 ,二进制解释: 0000 1111 |
以下实例演示了Python所有位运算符的操作:
1 | #!/usr/bin/python |
输出结果:
1 | 1 - c 的值为: 12 |
逻辑运算符
运算符 | 逻辑表达式 | 描述 | 实例 |
---|---|---|---|
and | x and y | 布尔”与” - 如果 x 为 False,x and y 返回 False,否则它返回 y 的计算值。 | (a and b) 返回 20。 |
or | x or y | 布尔”或” - 如果 x 是非 0,它返回 x 的计算值,否则它返回 y 的计算值。 | (a or b) 返回 10。 |
not | not x | 布尔”非” - 如果 x 为 True,返回 False 。如果 x 为 False,它返回 True。 | not(a and b) 返回 False |
成员运算符
运算符 | 描述 | 实例 |
---|---|---|
in | 如果在指定的序列中找到值返回 True,否则返回 False。 | x 在 y 序列中 , 如果 x 在 y 序列中返回 True。 |
not in | 如果在指定的序列中没有找到值返回 True,否则返回 False。 | x 不在 y 序列中 , 如果 x 不在 y 序列中返回 True。 |
1 | #!/usr/bin/python |
输出结果
1 | 1 - 变量 a 不在给定的列表中 list 中 |
身份运算符
身份运算符用于比较两个对象的存储单元
运算符 | 描述 | 实例 |
---|---|---|
is | is 是判断两个标识符是不是引用自一个对象 | x is y, 类似 id(x) == id(y) , 如果引用的是同一个对象则返回 True,否则返回 False |
is not | is not 是判断两个标识符是不是引用自不同对象 | x is not y , 类似 **id(a) != id(b)**。如果引用的不是同一个对象则返回结果 True,否则返回 False。 |
注: id() 函数用于获取对象内存地址。
运算符优先级
从最高到最低优先级的所有运算符:
运算符 | 描述 |
---|---|
** | 指数 (最高优先级) |
~ + - | 按位翻转, 一元加号和减号 (最后两个的方法名为 +@ 和 -@) |
* / % // | 乘,除,取模和取整除 |
+ - | 加法减法 |
>> << | 右移,左移运算符 |
& | 位 ‘AND’ |
^ | | 位运算符 |
<= < > >= | 比较运算符 |
<> == != | 等于运算符 |
= %= /= //= -= += *= **= | 赋值运算符 |
is is not | 身份运算符 |
in not in | 成员运算符 |
not and or | 逻辑运算符 |
循环语句
Python 提供了 for 循环和 while 循环(在 Python 中没有 do..while 循环):
循环类型 | 描述 |
---|---|
while 循环 | 在给定的判断条件为 true 时执行循环体,否则退出循环体。 |
for 循环 | 重复执行语句 |
嵌套循环 | 可以在while循环体中嵌套for循环 |
循环控制语句
循环控制语句可以更改语句执行的顺序。Python支持以下循环控制语句:
控制语句 | 描述 |
---|---|
break 语句 | 在语句块执行过程中终止循环,并且跳出整个循环 |
continue 语句 | 在语句块执行过程中终止当前循环,跳出该次循环,执行下一次循环。 |
pass 语句 | pass是空语句,是为了保持程序结构的完整性。 |
While循环语句
无限循环
1 | #!/usr/bin/python |
输出结果
1 | Enter a number :20 |
以上的无限循环可以使用 CTRL+C 来中断循环。
循环使用 else 语句
while … else 在循环条件为 false 时执行 else 语句块:
1 | #!/usr/bin/python |
输出结果
1 | 0 is less than 5 |
简单语句组
1 | #!/usr/bin/python |
以上的无限循环可以使用 CTRL+C 来中断循环。
for 循环语句
for循环可以遍历任何序列的项目,如一个列表或者一个字符串。
语法格式:
1 | for iterating_var in sequence: |
1 | #!/usr/bin/python |
输出结果
1 | 当前字母: P |
通过序列索引迭代
另外一种执行循环的遍历方式是通过索引,如下实例:
1 | #!/usr/bin/python |
以上实例输出结果:
1 | 当前水果 : banana |
以上实例我们使用了内置函数 len() 和 range(),函数 len() 返回列表的长度,即元素的个数。 range返回一个序列的数。
循环使用 else 语句
在 python 中,for … else 表示这样的意思,for 中的语句和普通的没有区别,else 中的语句会在循环正常执行完(即 for 不是通过 break 跳出而中断的)的情况下执行,while … else 也是一样。
循环嵌套
1 | for iterating_var in sequence: |
pass 语句
pass 是空语句,是为了保持程序结构的完整性。
pass 不做任何事情,一般用做占位语句。
Python 语言 pass 语句语法格式如下:
1 | pass |
1 | #!/usr/bin/python |
输出结果
1 | 当前字母 : P |
Number 数据类型
Number 数据类型用于存储数值。数据类型是不允许改变的,这就意味着如果改变 Number 数据类型的值,将重新分配内存空间。
变量赋值时 Number 对象将被创建:
1 | var1 = 1 |
使用del语句删除一些 Number 对象引用
1 | del var1[,var2[,var3[....,varN]]]] |
del语句删除单个或多个对象
1 | del var |
math 模块、cmath 模块
Python math 模块提供了许多对浮点数的数学运算函数。
Python cmath 模块包含了一些用于复数运算的函数。
cmath 模块的函数跟 math 模块函数基本一致,区别是 cmath 模块运算的是复数,math 模块运算的是数学运算。
要使用 math 或 cmath 函数必须先导入:
1 | import math |
1 | import cmath |
数学函数
函数 | 返回值 ( 描述 ) |
---|---|
abs(x) | 返回数字的绝对值,如abs(-10) 返回 10 |
ceil(x)] | 返回数字的上入整数,如math.ceil(4.1) 返回 5 |
cmp(x, y) | 如果 x < y 返回 -1, 如果 x == y 返回 0, 如果 x > y 返回 1 |
exp(x) | |
fabs(x) | 以浮点数形式返回数字的绝对值,如math.fabs(-10) 返回10.0 |
floor(x) | 返回数字的下舍整数,如math.floor(4.9)返回 4 |
log(x) | 如math.log(math.e)返回1.0,math.log(100,10)返回2.0 |
log10(x) | 返回以10为基数的x的对数,如math.log10(100)返回 2.0 |
max(x1, x2,…) | 返回给定参数的最大值,参数可以为序列。 |
min(x1, x2,…) | 返回给定参数的最小值,参数可以为序列。 |
modf(x) | 返回x的整数部分与小数部分,两部分的数值符号与x相同,整数部分以浮点型表示。 |
pow(x, y) | x**y 运算后的值。 |
round(x [,n]) | 返回浮点数x的四舍五入值,如给出n值,则代表舍入到小数点后的位数。 |
sqrt(x) | 返回数字x的平方根 |
随机数函数
函数 | 描述 |
---|---|
choice(seq) | 从序列的元素中随机挑选一个元素,比如random.choice(range(10)),从0到9中随机挑选一个整数。 |
randrange ([start,] stop [,step]) | 从指定范围内,按指定基数递增的集合中获取一个随机数,基数默认值为 1 |
random() | 随机生成下一个实数,它在[0,1)范围内。 |
[seed([x]) | 改变随机数生成器的种子seed。如果你不了解其原理,你不必特别去设定seed,Python会帮你选择seed。 |
shuffle(lst) | 将序列的所有元素随机排序 |
uniform(x, y) | 随机生成下一个实数,它在[x,y]范围内。 |
三角函数
函数 | 描述 |
---|---|
acos(x) | 返回x的反余弦弧度值。 |
asin(x) | 返回x的反正弦弧度值。 |
atan(x) | 返回x的反正切弧度值。 |
atan2(y, x) | 返回给定的 X 及 Y 坐标值的反正切值。 |
cos(x) | 返回x的弧度的余弦值。 |
hypot(x, y) | 返回欧几里德范数 sqrt(xx + yy)。 |
sin(x) | 返回的x弧度的正弦值。 |
tan(x) | 返回x弧度的正切值。 |
degrees(x) | 将弧度转换为角度,如degrees(math.pi/2) , 返回90.0 |
radians(x) | 将角度转换为弧度 |
数学常量
常量 | 描述 |
---|---|
pi | 数学常量 pi(圆周率,一般以π来表示) |
e | 数学常量 e,e即自然常数(自然常数)。 |
字符串
使用引号 ( ‘ 或 “ ) 来创建字符串。创建字符串只要为变量分配一个值即可。
1 | var1 = 'Hello World!' |
不支持单字符类型,单字符在 Python 中也是作为一个字符串使用。
访问子字符串
可以使用方括号来截取字符串
1 | #!/usr/bin/python |
输出
1 | var1[0]: H |
字符串连接
1 | #!/usr/bin/python |
1 | 输出 :- Hello python! |
转义字符
转义字符 | 描述 |
---|---|
(在行尾时) | 续行符 |
\ | 反斜杠符号 |
' | 单引号 |
" | 双引号 |
\a | 响铃 |
\b | 退格(Backspace) |
\e | 转义 |
\000 | 空 |
\n | 换行 |
\v | 纵向制表符 |
\t | 横向制表符 |
\r | 回车 |
\f | 换页 |
\oyy | 八进制数,y 代表 0~7 的字符,例如:\012 代表换行。 |
\xyy | 十六进制数,以 \x 开头,yy代表的字符,例如:\x0a代表换行 |
\other | 其它的字符以普通格式输出 |
字符串运算符
操作符 | 描述 | 实例 |
---|---|---|
+ | 字符串连接 | >>>a + b ‘HelloPython’ |
* | 重复输出字符串 | >>>a * 2 ‘HelloHello’ |
[] | 通过索引获取字符串中字符 | >>>a[1] ‘e’ |
[ : ] | 截取字符串中的一部分 | >>>a[1:4] ‘ell’ |
in | 成员运算符 - 如果字符串中包含给定的字符返回 True | >>>”H” in a True |
not in | 成员运算符 - 如果字符串中不包含给定的字符返回 True | >>>”M” not in a True |
r/R | 原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母”r”(可以大小写)以外,与普通字符串有着几乎完全相同的语法。 | >>>print r’\n’ \n >>> print R’\n’ \n |
% | 格式字符串 | 见下一节 |
1 | #!/usr/bin/python |
执行结果
1 | a + b 输出结果: HelloPython |
字符串格式化
最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。字符串格式化使用与 C 中 sprintf 函数一样的语法。
1 | #!/usr/bin/python |
1 | My name is Zara and weight is 21 kg! |
字符串格式化符号:
符 号 | 描述 |
---|---|
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
格式化操作符辅助指令:
符号 | 功能 |
---|---|
* | 定义宽度或者小数点精度 |
- | 用做左对齐 |
+ | 在正数前面显示加号( + ) |
在正数前面显示空格 | |
# | 在八进制数前面显示零(‘0’),在十六进制前面显示’0x’或者’0X’(取决于用的是’x’还是’X’) |
0 | 显示的数字前面填充’0’而不是默认的空格 |
% | ‘%%’输出一个单一的’%’ |
(var) | 映射变量(字典参数) |
m.n. | m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话) |
三引号
三引号可以将复杂的字符串进行赋值,允许一个字符串跨多行,字符串中可以包含换行符、制表符以及其他特殊字符。语法是一对连续的单引号或者双引号(通常都是成对的用)。一个典型的用例是,当你需要一块HTML或者SQL时,这时当用三引号标记,使用传统的转义字符体系将十分费神。
1 | errHTML = ''' |
Unicode 字符串
定义一个 Unicode 字符串
1 | u'Hello World !' |
如果想加入一个特殊字符,可以使用 Python 的 Unicode-Escape 编码。
1 | u'Hello\u0020World !' |
\u0020 标识表示在给定位置插入编码值为 0x0020 的 Unicode 字符(空格符)。
字符串内建函数
字符串方法是从 Python1.6 到 2.0 慢慢加进来的 —— 它们也被加到了Jython 中。
这些方法实现了 string 模块的大部分方法,如下表所示列出了目前字符串内建支持的方法,所有的方法都包含了对 Unicode 的支持,有一些甚至是专门用于 Unicode 的。
方法 | 描述 |
---|---|
string.capitalize() | 把字符串的第一个字符大写 |
string.center(width) | 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串 |
string.count(str, beg=0, end=len(string)) | 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 |
string.decode(encoding=’UTF-8’, errors=’strict’) | 以 encoding 指定的编码格式解码 string,如果出错默认报一个 ValueError 的 异 常 , 除非 errors 指 定 的 是 ‘ignore’ 或 者’replace’ |
string.encode(encoding=’UTF-8’, errors=’strict’) | 以 encoding 指定的编码格式编码 string,如果出错默认报一个ValueError 的异常,除非 errors 指定的是’ignore’或者’replace’ |
string.endswith(obj, beg=0, end=len(string)) | 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False. |
string.expandtabs(tabsize=8) | 把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8。 |
string.find(str, beg=0, end=len(string)) | 检测 str 是否包含在 string 中,如果 beg 和 end 指定范围,则检查是否包含在指定范围内,如果是返回开始的索引值,否则返回-1 |
string.format() | 格式化字符串 |
string.index(str, beg=0, end=len(string)) | 跟find()方法一样,只不过如果str不在 string中会报一个异常. |
string.isalnum() | 如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False |
string.isalpha() | 如果 string 至少有一个字符并且所有字符都是字母则返回 True,否则返回 False |
string.isdecimal() | 如果 string 只包含十进制数字则返回 True 否则返回 False. |
string.isdigit() | 如果 string 只包含数字则返回 True 否则返回 False. |
string.islower() | 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
string.isnumeric() | 如果 string 中只包含数字字符,则返回 True,否则返回 False |
string.isspace() | 如果 string 中只包含空格,则返回 True,否则返回 False. |
string.istitle() | 如果 string 是标题化的(见 title())则返回 True,否则返回 False |
string.isupper() | 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False |
string.join(seq) | 以 string 作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
string.ljust(width) | 返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串 |
string.lower() | 转换 string 中所有大写字符为小写. |
string.lstrip() | 截掉 string 左边的空格 |
string.maketrans(intab, outtab) | maketrans() 方法用于创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。 |
max(str) | 返回字符串 str 中最大的字母。 |
min(str) | 返回字符串 str 中最小的字母。 |
string.partition(str) | 有点像 find()和 split()的结合体,从 str 出现的第一个位置起,把 字 符 串 string 分 成 一 个 3 元 素 的 元 组 (string_pre_str,str,string_post_str),如果 string 中不包含str 则 string_pre_str == string. |
string.replace(str1, str2, num=string.count(str1)) | 把 string 中的 str1 替换成 str2,如果 num 指定,则替换不超过 num 次. |
string.rfind(str, beg=0,end=len(string) ) | 类似于 find() 函数,返回字符串最后一次出现的位置,如果没有匹配项则返回 -1。 |
string.rindex( str, beg=0,end=len(string)) | 类似于 index(),不过是返回最后一个匹配到的子字符串的索引号。 |
string.rjust(width) | 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串 |
string.rpartition(str) | 类似于 partition()函数,不过是从右边开始查找 |
string.rstrip() | 删除 string 字符串末尾的空格. |
string.split(str=””, num=string.count(str)) | 以 str 为分隔符切片 string,如果 num 有指定值,则仅分隔 num+1 个子字符串 |
[string.splitlines(keepends]) | 按照行(‘\r’, ‘\r\n’, ‘\n’)分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。 |
string.startswith(obj, beg=0,end=len(string)) | 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查. |
[string.strip(obj]) | 在 string 上执行 lstrip()和 rstrip() |
string.swapcase() | 翻转 string 中的大小写 |
string.title() | 返回”标题化”的 string,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle()) |
string.translate(str, del=””) | 根据 str 给出的表(包含 256 个字符)转换 string 的字符,要过滤掉的字符放到 del 参数中 |
string.upper() | 转换 string 中的小写字母为大写 |
string.zfill(width) | 返回长度为 width 的字符串,原字符串 string 右对齐,前面填充0 |
日期和时间
时间间隔是以秒为单位的浮点小数。每个时间戳都以自从1970年1月1日午夜(历元)经过了多长时间来表示。
time 模块下有很多函数可以转换常见日期格式。如函数time.time()用于获取当前时间戳,最适于做日期运算。但是1970年之前的日期就无法以此表示了。太遥远的日期也不行,UNIX和Windows只支持到2038年。
1 | #!/usr/bin/python |
输出
1 | 当前时间戳为: 1459994552.51 |
时间元组
很多Python函数用一个元组装起来的9组数字处理时间。
struct_time元组
序号 | 字段 | 属性 | 值 |
---|---|---|---|
0 | 4位数年 | tm_year | 2008 |
1 | 月 | tm_mon | 1 到 12 |
2 | 日 | tm_mday | 1到31 |
3 | 小时 | tm_hour | 0到23 |
4 | 分钟 | tm_min | 0到59 |
5 | 秒 | tm_sec | 0到61 (60或61 是闰秒) |
6 | 一周的第几日 | tm_wday | 0到6 (0是周一) |
7 | 一年的第几日 | tm_yday | 1到366 (儒略历) |
8 | 夏令时 | tm_isdst | -1, 0, 1, -1是决定是否为夏令时的旗帜 |
获取当前时间
最简单的获取可读的时间模式的函数是asctime()
1 | #!/usr/bin/python |
输出
1 | 本地时间为 : Thu Mar 17 23:05:21 2024 |
格式化日期
可以使用 time 模块的 strftime 方法来格式化日期
1 | time.strftime(format[, t]) |
1 | #!/usr/bin/python |
时间日期格式化符号:
- %y 两位数的年份表示(00-99)
- %Y 四位数的年份表示(000-9999)
- %m 月份(01-12)
- %d 月内中的一天(0-31)
- %H 24小时制小时数(0-23)
- %I 12小时制小时数(01-12)
- %M 分钟数(00-59)
- %S 秒(00-59)
- %a 本地简化星期名称
- %A 本地完整星期名称
- %b 本地简化的月份名称
- %B 本地完整的月份名称
- %c 本地相应的日期表示和时间表示
- %j 年内的一天(001-366)
- %p 本地A.M.或P.M.的等价符
- %U 一年中的星期数(00-53)星期天为星期的开始
- %w 星期(0-6),星期天为星期的开始
- %W 一年中的星期数(00-53)星期一为星期的开始
- %x 本地相应的日期表示
- %X 本地相应的时间表示
- %Z 当前时区的名称
- %% %号本身
获取某月日历
1 | #!/usr/bin/python |
1 | 以下输出2024年3月份的日历: |
函数
定义一个函数
- 函数代码块以 def 关键词开头,后接函数标识符名称和圆括号**()**。
- 任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。
- 函数的第一行语句可以选择性地使用文档字符串—用于存放函数说明。
- 函数内容以冒号起始,并且缩进。
- return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回 None。
1 | def functionname( parameters ): |
1 | def printme( str ): |
可更改(mutable)与不可更改(immutable)对象
在 python 中,strings, tuples, 和 numbers 是不可更改的对象,而 list,dict 等则是可以修改的对象。
- 不可变类型:变量赋值 a=5 后再赋值 a=10,这里实际是新生成一个 int 值对象 10,再让 a 指向它,而 5 被丢弃,不是改变a的值,相当于新生成了a。
- 可变类型:变量赋值 la=[1,2,3,4] 后再赋值 la[2]=5 则是将 list la 的第三个元素值更改,本身la没有动,只是其内部的一部分值被修改了。
参数传递
- 不可变类型:类似 c++ 的值传递,如 整数、字符串、元组。如fun(a),传递的只是a的值,没有影响a对象本身。比如在 fun(a)内部修改 a 的值,只是修改另一个复制的对象,不会影响 a 本身。
- 可变类型:类似 c++ 的引用传递,如 列表,字典。如 fun(la),则是将 la 真正的传过去,修改后fun外部的la也会受影响
python 中一切都是对象,严格意义我们不能说值传递还是引用传递,我们应该说传不可变对象和传可变对象。
传不可变对象
1 | #!/usr/bin/python |
int 对象 2,指向它的变量是 b,在传递给 ChangeInt 函数时,按传值的方式复制了变量 b,a 和 b 都指向了同一个 Int 对象,在 a=10 时,则新生成一个 int 值对象 10,并让 a 指向它。
传可变对象
1 | #!/usr/bin/python |
传入函数的和在末尾添加新内容的对象用的是同一个引用,故输出结果
1 | 函数内取值: [10, 20, 30, [1, 2, 3, 4]] |
参数
调用函数时可使用的正式参数类型:必备参数、关键字参数、默认参数、不定长参数
必备参数
必备参数须以正确的顺序传入函数。调用时的数量必须和声明时的一样。调用printme()函数,必须传入一个参数,不然会出现语法错误。
关键字参数
关键字参数和函数调用关系紧密,函数调用使用关键字参数来确定传入的参数值。
使用关键字参数允许函数调用时参数的顺序与声明时不一致,因为 Python 解释器能够用参数名匹配参数值。
1 | #!/usr/bin/python |
输出
1 | Name: miki |
默认参数
调用函数时,默认参数的值如果没有传入,则被认为是默认值。下例会打印默认的age,如果age没有被传入:
1 | #!/usr/bin/python |
输出
1 | Name: miki |
不定长参数
需要一个函数能处理比当初声明时更多的参数时,这些参数叫做不定长参数,和上述2种参数不同,声明时不会命名。
语法
1 | def functionname([formal_args,] *var_args_tuple ): |
1 | #!/usr/bin/python |
输出
1 | 输出: |
匿名函数
使用 lambda 来创建匿名函数。
- lambda只是一个表达式,函数体比def简单很多。
- lambda的主体是一个表达式,而不是一个代码块。仅仅能在lambda表达式中封装有限的逻辑进去。
- lambda函数拥有自己的命名空间,且不能访问自有参数列表之外或全局命名空间里的参数。
- 虽然lambda函数看起来只能写一行,却不等同于C或C++的内联函数,后者的目的是调用小函数时不占用栈内存从而增加运行效率。
语法
lambda函数的语法只包含一个语句,如下:
1 | lambda [arg1 [,arg2,.....argn]]:expression |
如下
1 | #!/usr/bin/python |
输出结果:
1 | 相加后的值为 : 30 |
return 语句
1 | #!/usr/bin/python |
输出结果
1 | 函数内 : 30 |
全局变量和局部变量
1 | #!/usr/bin/python |
输出结果
1 | 函数内是局部变量 : 30 |
模块
模块(Module)是一个 Python 文件,以 .py 结尾,包含了 Python 对象定义和Python语句,让你能够有逻辑地组织你的 Python 代码段。把相关的代码分配到一个模块里能让你的代码更好用,更易懂。
模块能定义函数,类和变量,模块里也能包含可执行的代码。
support.py 模块:
1 | def print_func( par ): |
import 语句
模块引入
import module1[, module2[,... moduleN]]
要引用模块 math,就可以在文件最开始的地方用 import math 来引入。在调用 math 模块中的函数时,必须这样引用:
模块名.函数名
当解释器遇到 import 语句,如果模块在当前的搜索路径就会被导入。一个模块只会被导入一次,不管你执行了多少次import。
搜索路径是一个解释器会先进行搜索的所有目录的列表。如想要导入模块 support.py,需要把命令放在脚本的顶端:
test.py 文件代码
1 | #!/usr/bin/python |
输出
1 | Hello : Python |
from…import 语句
from 语句让你从模块中导入一个指定的部分到当前命名空间中。
1 | from modname import name1[, name2[, ... nameN]] |
导入模块 fib 的 fibonacci 函数:
1 | from fib import fibonacci |
这个声明不会把整个 fib 模块导入到当前的命名空间中,它只会将 fib 里的 fibonacci 单个引入到执行这个声明的模块的全局符号表。
from…import* 语句
把一个模块的所有内容全都导入到当前的命名空间的声明
1 | from modname import * |
一次性引入 math 模块中所有的东西
1 | from math import * |
搜索路径
当你导入一个模块,Python 解析器对模块位置的搜索顺序是:
- 1、当前目录
- 2、如果不在当前目录,Python 则搜索在 shell 变量 PYTHONPATH 下的每个目录。
- 3、如果都找不到,Python会察看默认路径。UNIX下,默认路径一般为/usr/local/lib/python/。
模块搜索路径存储在 system 模块的 sys.path 变量中。变量里包含当前目录,PYTHONPATH和由安装过程决定的默认目录。
PYTHONPATH 变量
作为环境变量,PYTHONPATH 由装在一个列表里的许多目录组成。PYTHONPATH 的语法和 shell 变量 PATH 的一样。在 Windows 系统,典型的 PYTHONPATH 如
set PYTHONPATH=c:\python27\lib;
命名空间和作用域
命名空间是一个包含了变量名称们(键)和它们各自相应的对象们(值)的字典。表达式可以访问局部命名空间和全局命名空间里的变量。每个函数都有自己的命名空间。类的方法的作用域规则和通常函数的一样。
Python 假设任何在函数内赋值的变量都是局部的。因此如果要给函数内的全局变量赋值,必须使用 global 语句。
globals() 和 locals() 函数
根据调用地方的不同,globals() 和 locals() 函数可被用来返回全局和局部命名空间里的名字。如果在函数内部调用 locals(),返回的是所有能在该函数里访问的命名。
如果在函数内部调用 globals(),返回的是所有在该函数里能访问的全局名字。两个函数的返回类型都是字典,所以名字们能用 keys() 函数摘取。
reload() 函数
当一个模块被导入到一个脚本,模块顶层部分的代码只会被执行一次。如果要重新执行模块里顶层部分的代码,可以用 reload() 函数。
1 | reload(module_name) |
包
包是一个分层次的文件目录结构,它定义了一个由模块及子包,和子包下的子包等组成的 Python 的应用环境。简单来说,包就是文件夹,但该文件夹下必须存在 init.py 文件, 该文件的内容可以为空。init.py 用于标识当前文件夹是一个包。